TEMA 2. Explotando el paralelismo dentro de cada núcleo

Procesadores de emisión multiple

Con los clásicos procesadores segmenetados como los dados en (AEC), a lo máximo que podíamos aspierar era a un CPI de 1 (una instrución por ciclo). Para poder alcanzar un mayor rendimiento se dio con la siguiente solución:

Lanzar y ejecutar simultáneamente varias instrucciones por cada ciclo de reloj  aumentar el ancho de emisión
Esto permite mejorar el rendimiento de forma significativa => obtener un mayor ILP

Pero esto no viene sin una serie de problemas/dificultades:

¿Tendremos suficientes recursos?
Habrá más presión sobre la memoria y registros
Habrá más posibilidad de los riesgos (estructurales) y dependencias (datos y control)
- Técnicas para resolver dependencias de datos (ejecución fuera de orden)
- Técnicas para resolver dependencias de control (especulación)
Mayor área de silicio => mayor consumo (power wall)