Entre octubre y diciembre de este año AMD lanzará sus nuevos APU Kaveri, uno de sus productos más esperados, pues promete traer sendas mejoras por sobre sus predecesores al combinar una nueva micro-arquitectura CPU (Steamroller) una nueva arquitectura gráfica (Sea Islands), el nuevo controlador de memoria hUMA y el proceso de manufactura de 28nm, sólo por citar sus principales novedades.
Kaveri será comercializado bajo la denominación comercial: AMD A Series de cuarta generación, y es considerado por muchos el lanzamiento más importante de AMD desde el lanzamiento de los microprocesadores AMD Phenom II/Athlon II basados en la micro-arquitectura K10.6.
AMD promete que Kaveri será uno de sus productos integrados más exitosos, y ha puesto su confianza en él para cubrir los segmentos del mercado más importantes para AMD: PCs de escritorio (A 7000 Series), notebooks y ultrathins (A 6000 Series), estaciones de trabajo (FirePro A Series) y servidores mono socket “1P” (Opteron X Series).
A continuación describiremos cada uno de los componentes integrados en el APU AMD Kaveri:
Steamroller: La micro-arquitectura CPU de Kaveri
A fines de agosto AMD nos proporcionó los primeros detalles de su nueva micro-arquitectura Steamroller, la que vendría a ser su arquitectura modular de tercera generación, precedida por Piledriver y Bulldozer, y que promete importantes cambios y un mayor rendimiento por ciclo en comparación con Piledriver.
Si podríamos considerar a Pildedriver una micro-arquitectura con algunos retoques inteligentemente realizados para incrementar su rendimiento por ciclo (en hasta un 15%) pero sin cambiar la esencia compartida estrenada en Bulldozer; entonces Steamroller sería una micro-arquitectura con retoques profundos, enfocados en eliminar los cuellos de botella mejorando el balance entre el rendimiento por ciclo y el rendimiento multi-hilo.
Tanto Bulldozer como Piledriver están basados en módulos, unidad de cálculo conformada por un decodificador de 4 vías (2 para cada ALU), dos unidades de procesamiento de enteros (ALUs) y una unidad Flex-FP (FPU con capacidades SMT), las que comparten la mayoría de sus recursos para ejecutar 2 hilos de procesamiento.
En Steamroller tenemos que el módulo ha sido rediseñado para que únicamente los recursos de la unidad de punto flotante Flex-FP sean compartidos, mientras que los ALUs poseen sus propios recursos dedicados, es decir, cada módulo Steamroller está conformado por 2 decodificadores de cuatro vías (cada uno de ellos con su propia unidad dispatch dedicada), 2 ALUs y una unidad Flex-FP.
AMD añadió también una unidad prefetch mejorada y un subsistema de caches de primer nivel (L1) más veloz, eficiente y con menor latencia, todo destinado a mantener a los núcleos alimentados con instrucciones.
Bulldozer y Piledriver tenían el inconveniente de perder sensiblemente su rendimiento por ciclo, al usarse todas las unidades del módulo, motivo por el que se hizo popular el que algunos usuarios deshabilitaran un ALU de cada módulo, a fin de obtener un rendimiento superior en aplicaciones que no requieran muchos hilos de procesamiento.
Con Steamroller esto no será necesario, pues al tener cada ALU sus propios decoder y dispatch, se eliminan los cuellos de botella que se originaban en el decoder, ofreciendo un rendimiento por ciclo entre 25 a 30% superior en algunas circunstancias, a la vez que se mejora la eficiencia energética pudiendo apagar completamente las unidades no usadas en el módulo.
Kaveri estará conformado por hasta 2 módulos Steamroller, es decir cuatro unidades de procesamiento de enteros (ALUs) y 2 unidades Flex-FP (cada una capaz de ejecutar 2 hilos de procesamiento de punto flotante).
Arquitecturas Bulldozer/Piledriver (superior) y Steamroller (inferior) – PC Watch (CC)
Área de die de los diversos CPUs/APUs de AMD e Intel – PC Watch (CC).
El controlador de memoria hUMA
Como se describió anteriormente, Kaveri será el primer producto de AMD que posea un controlador de memoria con arquitectura hUMA, gracias a lo cual, tanto el CPU como el GPU podrán acceder a la memoria principal y virtual de forma unificada y con coherencia basada en hardware.
Kaveri poseerá un controlador de memoria hUMA DDR3-2133 de doble canal, el que gracias a su menor latencia, mayor frecuencia de funcionamiento y su manejo unificado, ofrecerá un gran ancho de banda, suficiente para beneficiar el rendimiento de sus unidades CPU y GPU.
Controlador PCI Express 3.0 Integrado
Kaveri poseerá un total de 24 líneas PCI Express 3.0 (PCIe 3.0), además contará con un Bus UMI (Unified Media Interface) conformado por 4 líneas PCI Express 3.0, con el cual se comunicará directamente con el chipset.
Los chipset AMD A88X y A78 “Bolton”
Kaveri estrenará los nuevos chipsets (ahora denominados Fusion Controller Hub “FCH”) A88X y A78, aunque de momento no tenemos muchos datos de estos nuevos chipsets, se conoce de momento que A88X poseerá 8 puertos SATA-III (6Gbps) mientras que A78 poseerá tan sólo 6 puertos SATA-III; ambos incorporarán también un controlador USB 3.0.
El nuevo socket FM2+
Dado que Kaveri incorpora muchos cambios, requerirá del nuevo socket FM2+, el cual es también compatible con los APUs Richland y Trinity; pero lamentablemente no se podrán instalar APUs Kaveri en tarjetas madre socket FM2, dado que poseen 906 pines (FM2 posee 904 pines), lo que los hace físicamente incompatibles.
El GPU de Kaveri
No nos hemos olvidado de que Kaveri poseerá potentes gráficos integrados, los que poseen importantes cambios, los que describiremos en la segunda y última parte de esta serie de artículos dedicados al APU Kaveri.
Link: AMDの次世代APU「Kaveri」はアーキテクチャの転換点 (PC Watch)
También pueden comentar en nuestro foro.