Fujitsu para Fork Arm Server Chip Line para Chase Clouds

Cuando se trata de fichas, hay una gran diferencia entre un pateador y un tenedor.

El pateador es un sucesor que implementa una arquitectura y un diseño y que incluye mejoras en la microarquitectura para aumentar el rendimiento del núcleo (núcleo en los dos significados de esa palabra cuando se trata de CPU), además de aprovechar los procesos de fabricación de chips (y ahora el empaquetado) para escalar el rendimiento aún más en un socket.

La bifurcación es una divergencia de algún tipo, literalmente una bifurcación en el camino que marca la diferencia, como diría Robert Frost. Puede haber compatibilidad, como las diferencias entre núcleos grandes y pequeños en los mercados Arm, Power y ahora X86. Intel y AMD van a implementar estrategias de núcleo grande y pequeño en sus líneas de CPU de servidor este año, AMD en sus Epycs "Bergamo" e Intel en sus Xeon SP "Sierra Forest". Intel ha tenido chips Atom y Xeon compatibles con X86 y ahora núcleos E y P durante una década y media, por lo que esto no es precisamente nuevo para el fabricante de CPU más grande del mundo.

Y este tipo de bifurcación es lo que creemos que el fabricante japonés de CPU y sistemas Fujitsu hará con sus futuros procesadores "Monaka" y "Fugaku-Next", el primero de los cuales se reveló recientemente y el último se colocó en las pizarras con apestoso marcadores: bueno, fue el comienzo de un estudio de viabilidad realizado por el Ministerio de Educación, Cultura, Deportes, Ciencia y Tecnología de Japón, con Educación, Cultura, Deportes, Ciencia siendo una variable X y, por lo tanto, formando la abreviatura MEXT. agosto de 2022.

Fujitsu ha sido un socio estrecho de RIKEN Lab, el centro de investigación de HPC preeminente del país, desde el diseño de la supercomputadora "Keisuko" K de $1200 millones, que comenzó en 2006 para romper la barrera de los 10 petaflops en punto flotante de precisión de 64 bits. y que se entregó en 2011. El diseño de la supercomputadora "Fugaku" de 910 millones de dólares y 513,9 petaflops, en la que Fujitsu cambió de su arquitectura Sparc64 a una arquitectura Arm personalizada con turbocompresor vectorial, comenzó en 2012. El sistema Fugaku se entregó en junio de 2020, estuvo en pleno funcionamiento en 2021 y el trabajo en el sistema Fugaku-Next comenzó un año después, justo a tiempo.

De acuerdo con la hoja de ruta presentada por Fujitsu y RIKEN Lab en SC22 en noviembre pasado, el plan es que la máquina Fugaku-Next esté operativa "alrededor de 2030", y ese momento es importante (hablaremos de eso en un momento).

Estas son las ideas de investigación que se están abordando y la tecnología incorporada en Fugaku-Next y quién está abordando:

Todas las ideas que esperaría en una máquina que se instalará en seis o siete años están ahí: una combinación de HPC tradicional e IA y la adición de computación cuántica y neuromórfica. Las supercomputadoras en el futuro serán poderosas, sin duda, pero podría llamarse mejor "computación de flujo" en lugar de "supercomputación" porque habrá una combinación de diferentes tipos de computación y aplicaciones compuestas por flujos de trabajo de diferentes aplicaciones más pequeñas que trabajan en conjunto. , ya sea de forma serial o en bucles iterativos.

De manera significativa, Fujitsu y RIKEN enfatizan la "compatibilidad con el ecosistema existente" y los "sistemas heterogéneos conectados por redes de gran ancho de banda". Fujitsu dice además que la arquitectura del sistema Fugaku-Next utilizará empaques emergentes de alta densidad, tendrá aceleradores de alto rendimiento y eficiencia energética, baja latencia y memoria de alto ancho de banda.

Si la historia es una guía, y con las supercomputadoras japonesas lo es absolutamente, entonces se instala una máquina el año antes de que entre en funcionamiento, lo que significa que Fugaku-Next se instalará "alrededor de 2029" más o menos.

Tenga todo eso en mente mientras observamos la CPU "Monaka" en la que Fujitsu está trabajando bajo los auspicios de la Organización de Desarrollo de Tecnología Industrial y Nuevas Energías (NEDO) del gobierno japonés. A fines de febrero, se recurrió a Fujitsu, NEC, AIO Core, Kioxia y Kyocera para trabajar en interconexiones y procesamiento de centros de datos más eficientes energéticamente. Específicamente, el esfuerzo de NEDO quiere tener CPU de servidor energéticamente eficientes y SmartNIC potenciados por la fotónica.

Dentro de este esfuerzo, parece que Fujitsu está creando un derivado del procesador Arm A64FX en el corazón del sistema Fugaku, pero la gente está confundiendo esto con el significado de que Monaka es el procesador de seguimiento que se usará en el sistema Fugaku-Next. .

Esto es precisamente lo que se dijo: "Fujitsu refinará aún más esta tecnología y desarrollará una CPU de bajo consumo de energía que se puede usar en los centros de datos ecológicos de próxima generación".

Estas son las tareas asignadas a los socios NEDO:

La CPU Monaka está prevista para 2027 y tiene como objetivo proporcionar un mayor rendimiento con un menor consumo de energía:

No está claro cómo sucederá esto, pero la implicación es que será un procesador de servidor basado en Arm, pero optimizado para hiperescaladores y desarrolladores de nubes y no para centros de HPC e IA. Eso debería significar más núcleos y menos procesamiento de vectores en relación con A64FX (o más bien, el truco para A64FX en el sistema Fugaku-Next) y muy probablemente la adición de unidades matemáticas de matriz de baja precisión para la inferencia de IA. Algo conceptualmente como los Xeon SP "Sapphire Rapids" de Intel y los futuros procesadores AMD Epyc con motores Xilinx DSP AI en términos de capacidades, pero con un núcleo Arm y un enfoque en la eficiencia energética, un rendimiento por vatio mucho mayor.

De hecho, como Fujitsu mira hacia 2027, cuando Monaka entrará en los sistemas de producción, dice que podrá ofrecer 1,7 veces el rendimiento de la aplicación y 2 veces el rendimiento por vatio de la CPU "Another – 2027", sea lo que sea.

La parte confusa, que ha llevado a algunas personas a creer que Monaka es el procesador que impulsará a A64FX y se utilizará en el sistema Fugaku-Next, es esta frase: "No solo aumenta las cargas de trabajo HPC tradicionales, sino que también proporciona un alto rendimiento para Cargas de trabajo de inteligencia artificial y análisis de datos".

Pero aquí está la cosa, que señalamos a menudo: HPC se trata de obtener rendimiento a cualquier costo, y los hiperescaladores y los desarrolladores de la nube necesitan obtener el mejor rendimiento razonable al menor costo y menor consumo de energía.

Estos son puntos de diseño muy diferentes y, si bien puede crear HPC en la nube, no puede crear una nube optimizada para ejecutar aplicaciones web y esperar que funcione bien en simulación y modelado de HPC o incluso en cargas de trabajo de capacitación de IA. Y viceversa. Un clúster HPC no estaría optimizado para bajo costo y bajo consumo y sería una mala elección para las aplicaciones web. Puede vender sistemas HPC reales bajo un modelo de nube, por supuesto, colocando InfiniBand y nodos gordos con muchas GPU en el 20 por ciento de los nodos en una nube, pero nunca será tan barato como la infraestructura de nube simple. que tiene ese punto de diseño diferente.

Dado que Fugaku-Next es un estilo de supercomputadora heterogéneo de "computadora de flujo", es muy razonable pensar que un pateador de la CPU Monaka Arm destinado a la infraestructura de la nube podría terminar en el sistema Fugaku-Next. Pero eso no es lo mismo que decir que no habrá un sucesor de A64FX, que los investigadores ya han demostrado que puede aumentar su rendimiento 10 veces para 2028 con enormes cantidades de caché L3 apiladas y procesos reducidos en los núcleos Arm. Eso es sin mejoras arquitectónicas en los núcleos A64FX, y sabes que habrá ajustes aquí.

Creemos que es mucho más probable que un sucesor de Monaka, que esperaríamos en 2029 dada una cadencia de procesador de dos años, pueda incluirse en Fugaku-Next, pero hay muy pocas posibilidades de que sea la única CPU en el sistema. – a menos que los tanques económicos y MEXT y NEDO tengan que compartir dinero.

La Gran Recesión arruinó el proyecto original "Keisuko", que tenía a Fujitsu haciendo una CPU escalar, NEC haciendo una CPU vectorial e Hitachi haciendo la interconexión toroidal que ahora conocemos como Tofu. NEC y Fujitsu se echaron atrás porque el proyecto era demasiado caro y no creían que la tecnología pudiera comercializarse lo suficiente como para cubrir los costes. Fujitsu se hizo cargo del proyecto y lo entregó de manera brillante, pero sospechamos que ganar dinero con Sparc64fx y A64FX ha sido difícil.

Pero, con el respaldo del gobierno, como lo ha hecho Fujitsu gracias a su relación con RIKEN, y el deseo de Japón de ser independiente cuando se trata de su supercomputadora más rápida, nada de eso importa. Lo que era cierto en 2009 sobre el valor de la independencia de la cadena de suministro (que muchos países ignoraron en aras de la facilidad y las supercomputadoras de menor costo) es aún más cierto en 2029.

Fujitsu no está siendo específico, y Satoshi Matsuoka, director de RIKEN Lab y profesor del Instituto de Tecnología de Tokio, comentó sobre los informes de que Monaka se estaba utilizando en la máquina Fugaku-Next en su cuenta de Twitter: "No se ha decidido nada todavía si Monaka impulsará #FugakuNEXT; sin duda es uno de los elementos técnicos que se están considerando". Pero también agregó esto: "Dado que #HPC (con AI, BD) ya no es un nicho de mercado, el objetivo no es crear una máquina de escala única, sino plataformas de ciencia y tecnología que se extiendan a través de SC, nubes, etc. Para ese propósito, la generalidad SW y la penetrabilidad del mercado, especialmente a los hiperescalares, son imprescindibles. Nos asociaremos con proveedores que compartan la misma visión".

Creemos que se utilizarán dos CPU Arm en Fugaku-Next: una adaptada a la inferencia de IA y cargas de trabajo de CPU genéricas y otra ajustada para realizar simulaciones de HPC realmente duras y entrenamiento de IA. Llámalos A64FX2 y Monaka2 si quieres. La única forma de que haya un chip es si el presupuesto lo obliga, tal como sucedió con la máquina K.

Pero, es cierto que esto es solo especulación, y tendremos que esperar y ver.

Presentando aspectos destacados, análisis e historias de la semana directamente de nosotros a su bandeja de entrada sin nada en el medio. Suscríbase ahora

Noticias