La arquitectura de un computador está compuesta por:
- ISA (Instruction Set Architecture)
- Conjunto de instrucciones que pueden ser ejecutadas por el procesador.
- Ejemplos: x86, ARM, RISC-V
- Microarquitectura
- Cómo se implementan las instrucciones del ISA
- Diseño tecnológico del sistema ≡ hardware
Evolución de las microarquitecturas (resumen)
- Monociclo: Simplicidad, pero gran ineficiencia
- Multiciclo: ¿cómo mejora al monociclo?
- Segmentación
- Ejecución solapada de varias instrucciones
- Detenciones debido a los riesgos y dependencias
- Explotando el ILP
- Superescalares, Superpipelining,
- MultiThreading, Vectorización, ...
- CMPs (multiprocesadores en un chip)
- Arquitecturas heterogéneas
- CMPs heterogéneos
- CMP + aceleradores (GPUs, DSPs, TPUs, XPUs)
- Supercomputadores
Transistores y Cables
Tamaño característico (Feature size)
- Tamaño mínimo del transistor en la dimensión X o Y
- 10 micras en 1971 y 10 nanómetros en 2019
- El rendimiento del transistor escala linealmente • El retardo en los cables no mejora con el tamaño característico
- La densidad de integración escala cuadráticamente
2022 proesadores con 7 nanometors e incluso con 5 nanómetros (samsung)
Tendencias en tecnoligía
• Circuitos Integrados (Ley de Moore)
- Densidad de los transistores: + 35% / año
- Tamaño del chip (dado): + 10-20% / año
- Mejora global: 40-55% / año • Capacidad DRAM: + 25-40% / año (enlenteciéndose el progreso)
- 8 Gb (2014), 16 Gb (2017), 32 Gb y 64 Gb (2019) • Capacidad Flash: + 50-60% / año
- 8-10X más barato/bit que DRAM • Capacidad Discos Duros (HDs): recientemente ha bajado al 5% / año
- No es posible mejorar la densidad, quizás pasar de 7 a 9 discos
- 8-10X más barato/bit que Flash
1.1 Aspectos tecnológicos: Leyes de Moore y de Dennard
Consecuencias Dennard & Moore
• ¿Qué pasa cuando el tamaño característico del transistor (feature size) se reduce por un factor de x?
- El número de transistores en el chip aumenta por x2
- El clock rate (frecuencia de funcionamiento) podía mejorar hasta ~x, porque los transistores pueden cambiar de estado más rápido
- Además, el tamaño del dado del chip también podía aumentar (no siempre lo hacía) • ¡El rendimiento “bruto” del chip podía aumentar hasta por ~ x4 !
- hasta ~x por la frecuencia
- x3 por tener más transistores, que se dedicaban a • Paralelismo: ILP (y últimamente vectorial) • Localidad: cachés • Gracias a las mejoras en la arquitectura, la mayoría de los programas se ejecutaban x2 veces más rápido ¡sin cambiarlos! Los procesadores (CPUs) doblaban su rendimiento cada 18-24 (aproximadamente).