viernes, 27 de agosto de 2021

Es tan grande como una tableta, pero no es una de ellas; es un monstruoso chip para aprendizaje profundo con más de 1,2 billones de transistores

Es tan grande como una tableta, pero no es una de ellas; es un monstruoso chip para aprendizaje profundo con más de 1,2 billones de transistores

Los algoritmos de aprendizaje profundo no se llevan del todo bien con los procesadores de propósito general. Su alto paralelismo intrínseco encaja mucho mejor con la arquitectura de los procesadores gráficos, lo que ha provocado que muchos centros de datos y laboratorios de investigación que se dedican a la inteligencia artificial hayan confiado el esfuerzo de procesado a un clúster de GPU más o menos ambicioso.

Sin embargo, esta no es la única opción. También es posible desplegar una infraestructura de chips enlazados mediante conexiones de alto rendimiento y diseñados específicamente para lidiar con el alto paralelismo intrínseco de los algoritmos de aprendizaje profundo. Una de las compañías que tiene soluciones de este tipo es Intel. Su chip neuromórfico Loihi está fabricado con fotolitografía de 14 nm e incorpora 128 núcleos y algo más de 130 000 neuronas artificiales.

El chip Wafer Scale Engine desarrollado por Cerebra incorpora 1,2 billones de transistores. Y son 1,2 billones de los nuestros, no de los anglosajones

IBM también tiene su propio procesador neuromórfico, un chip al que sus creadores han llamado TrueNorth. Integra 4096 núcleos, de manera que es posible conectar varios de ellos en una red con el propósito de emular, según IBM, un sistema con un millón de neuronas y 256 millones de sinapsis. Intel, IBM y NVIDIA son algunas de las grandes compañías que están involucradas en el desarrollo de hardware diseñado específicamente para inteligencia artificial, pero no son las únicas que tienen algo que decir en este ámbito.

Y es que la empresa californiana Cerebras ha desarrollado un chip diseñado específicamente para aprendizaje profundo. Lo curioso es que se parece relativamente poco a un procesador convencional. Ni siquiera se parece al hardware de Intel o IBM del que he hablado brevemente en los párrafos anteriores. Como podéis ver en la fotografía de portada de este artículo, es mucho más grande que un chip tradicional. De hecho, parece probable que estén empleando una oblea completa para producir cada uno de ellos. No obstante, esta no es en absoluto la única característica por la que el chip de Cerebras es muy poco habitual.

Un chip grande es mejor que muchos pequeños, según Cerebras

Ahí va otro dato sorprendente acerca del procesador Wafer Scale Engine (WSE), que es como lo llaman sus creadores: integra nada menos que 1,2 billones de transistores. Y son 1,2 billones de los nuestros, no de los anglosajones, por lo que esta cifra equivale a la monstruosa cantidad de 1 200 000 000 000 transistores. Sin duda, es una cifra ante la que es difícil no sorprenderse a pesar de las abultadas cantidades de transistores que incorporan los chips con los que todos estamos familiarizados, como las CPU y las GPU de nuestros ordenadores.

Esta descomunal cantidad de transistores responde a la aproximación por la que han optado los ingenieros que han diseñado el chip WSE, que es muy diferente a la estrategia de diseño que han utilizado Intel o IBM en sus propias soluciones. Y es que, siempre según Cerebras, para optimizar la ejecución de los algoritmos de aprendizaje profundo es necesario apostar por un chip dotado de un paralelismo intrínseco muy alto que se manifiesta a través del empaquetado de una enorme cantidad de núcleos. Esta es la razón por la que el chip WSE incorpora la sorprendente cifra de 400 000 núcleos programables.

Wsememoria
Este esquema refleja con mucha claridad que los ingenieros de Cerebras han apostado por distribuir la memoria alrededor de los 400 000 núcleos del chip WSE para minimizar la latencia e incrementar su rendimiento global.

No obstante, no toda la superficie del chip está dedicada a los núcleos de proceso, como es lógico. Otro de los subsistemas que también acapara una parte importante de la lógica es la memoria. Colocarla cerca de los núcleos permite reducir la latencia, incrementar el rendimiento y minimizar el consumo de forma perceptible, de nuevo según Cerebras. Y tiene sentido. El chip WSE integra 18 GB de memoria.

Y, para concluir, dos cifras más que afianzan la ambición que tiene este procesador: el ancho de banda de la memoria roza los 9,6 Petabytes, y los 400 000 núcleos se comunican con el exterior a través de un enlace con una velocidad de transferencia de 100 Petabits por segundo. Son unas cifras monstruosas que quedan muy lejos de las que manejan los procesadores de nuestros ordenadores. Eso sí, no debemos perder de vista que los chips WSE no sirven para cualquier cosa. Lo suyo es el aprendizaje profundo.

Imágenes | Cerebras

Más información | Cerebras

-
La noticia Es tan grande como una tableta, pero no es una de ellas; es un monstruoso chip para aprendizaje profundo con más de 1,2 billones de transistores fue publicada originalmente en Xataka por Juan Carlos López .



via Xataka https://ift.tt/38lYwtD

No hay comentarios:

Publicar un comentario