TEMA 2. Explotando el paralelismo dentro de cada núcleo
Procesadores de emisión multiple
Con los clásicos procesadores segmenetados como los dados en (AEC), a lo máximo que podíamos aspierar era a un CPI de 1 (una instrución por ciclo). Para poder alcanzar un mayor rendimiento se dio con la siguiente solución:
- Lanzar y ejecutar simultáneamente varias instrucciones por cada ciclo de reloj aumentar el ancho de emisión
- Esto permite mejorar el rendimiento de forma significativa => obtener un mayor ILP
Pero esto no viene sin una serie de problemas/dificultades:
- ¿Tendremos suficientes recursos?
- Habrá más presión sobre la memoria y registros
- Habrá más posibilidad de los riesgos (estructurales) y dependencias (datos y control)
- Técnicas para resolver dependencias de datos (ejecución fuera de orden)
- Técnicas para resolver dependencias de control (especulación)
- Mayor área de silicio => mayor consumo (power wall)