Krypton Solid

La última tecnología en raciones de 5 minutos

¿Son los chips de IA gigantes el futuro del hardware de IA?

Los nuevos tipos de chips de inteligencia artificial que adoptan diferentes formas de organizar la memoria, la computación y las redes podrían remodelar la forma en que las empresas líderes diseñan e implementan algoritmos de inteligencia artificial.

Al menos un proveedor, Cerebras Systems, ha comenzado a probar un solo chip del tamaño de un iPad que mueve los datos miles de veces más rápido que los chips de IA existentes. Esto podría abrir oportunidades para que los desarrolladores experimenten con nuevos tipos de algoritmos de IA.

Ashmeet SidanaAshmeet Sidana

«Esta es una gran oportunidad de mercado y veo un replanteamiento completo de la arquitectura de la computadora en progreso», dijo Ashmeet Sidana, ingeniero jefe de Engineering Capital, una firma de capital de riesgo.

La reconsideración está pendiente desde hace mucho tiempo, señaló Sidana. Históricamente, la industria se ha centrado en escalar cargas de trabajo de aprendizaje automático simples sobre arquitecturas informáticas tradicionales en lugar de pensar en la forma más adecuada de construir una computadora específica de IA.

Pero la situación está cambiando rápidamente a medida que empresas emergentes como Cerebras y Graphcore, junto con jugadores establecidos como Intel, con la compra de Habana Labs, compiten por construir una nueva generación de chips de inteligencia artificial.

A corto plazo, este tipo de avances tendrán el mayor impacto en las empresas que utilizan mucha IA. A largo plazo, las empresas de todos los tamaños tendrán que repensar sus procesos de TI, ingeniería de datos y ciencia de datos para mantenerse a la vanguardia.

Abordar el cuello de botella del ancho de banda en el hardware de IA tradicional

Cerebras sorprendió a la industria cuando introdujo el chip Wafer Scale Engine (WSE): del tamaño de una oblea de silicio completa, el chip WSE es 56 veces más grande y tiene 78 veces más núcleos que la GPU más grande. Pero su ventaja real radica en la rapidez con la que puede mover los datos, más de 10.000 veces más rápido.

«La mayor innovación que encuentro en esta solución es la integración de la memoria con un ancho de banda tan alto», dijo Tom Hackenberg, analista principal senior y director asociado de procesadores de la firma de investigación Omdia.

Chip Cerebras WSE en comparación con el teclado
Chip Cerebras WSE en comparación con el teclado.

«El acceso y la configuración de la memoria es una de las tecnologías que muchas nuevas empresas están [tackling] porque las direcciones de memoria tradicionales a gran escala no están bien optimizadas para los algoritmos de redes neuronales «, dijo.

Tom HackenbergTom Hackenberg

Un gran cuello de botella en la arquitectura de hardware tradicional para la IA radica en el tiempo que lleva pasar entre los diferentes núcleos de procesamiento, la memoria y los núcleos de procesamiento en otros chips. En consecuencia, los algoritmos de IA deben optimizarse para minimizar los requisitos de comunicación entre núcleos. Esto se aplica tanto si los algoritmos se ejecutan en varias CPU como en varias GPU.

Los núcleos del WSE están más densamente interconectados que en un chip tradicional. Esto permite una comunicación más rápida entre los núcleos y entre los núcleos y la RAM incorporada, denominada SRAM. Además, hay más SRAM almacenada en el mismo sustrato que los núcleos de procesamiento. El WSE tiene 32 gigabytes de SRAM en comparación con unas pocas docenas de megabytes para un chip tradicional. La interconexión densa permite que los datos se muevan entre la memoria y el procesador a 9 petabytes por segundo y entre núcleos a 100 petabytes por segundo.

En una computadora típica, los pasos intermedios en un cálculo se almacenan en la DRAM adjunta a la placa base, que es mucho más lenta que la SRAM, pero más rápida que el almacenamiento externo.

«DRAM es como la historia del supermercado a la vuelta de la esquina, mientras que SRAM es como su refrigerador», dijo Andrew Feldman, director ejecutivo de Cerebras. Si quieres conseguir algo rápido, es mejor que quepa en el frigorífico, dijo, refiriéndose a la analogía. No importa cuán grande sea la tienda de comestibles, porque te perderás un partido de fútbol si tienes que ir a la tienda a comprar una cerveza.

Andrew FeldmanAndrew Feldman

En comparación, una GPU de última generación como la Tesla V100 tiene un ancho de banda de memoria GPU de 900 gigabytes por segundo.

Otros proveedores de chips de inteligencia artificial también están aliviando el cuello de botella del ancho de banda. Por ejemplo, la Unidad de procesamiento de inteligencia de Graphcore tiene 300 megabytes de SRAM y 45 terabytes por segundo de ancho de banda de memoria.

El esfuerzo por repensar cómo se organizan la memoria y la computación puede, en última instancia, resolver algunas de las barreras de acceso a la memoria de los sistemas tradicionales. También podría reducir drásticamente los requisitos de energía, dijo Hackenberg. Esto atraería a los superescalares de servicios en la nube que ya están incursionando en coprocesadores de aceleradores de inteligencia artificial: Alibaba, Alphabet, Amazon y Microsoft se encuentran entre los que han diseñado sus propias soluciones ASIC.

El soporte del ecosistema es clave para los nuevos chips de IA

Cerebras, como todos los nuevos proveedores de chips, debe invertir en hacer que sus grandes chips de IA funcionen con los marcos de desarrollo de IA existentes como TensorFlow y PyTorch. Pero el jurado aún está deliberando sobre qué tan bien funcionarán WSE y los grandes chips de IA con los flujos de trabajo de desarrollo de IA.

«No solo se necesitará rendimiento por vatio, sino también un importante apoyo al ecosistema, servicios e incentivos de precios para arrebatar la participación de mercado a líderes como AMD, Intel, Nvidia o Xilinx», advirtió Hackenberg de Omdia.

Los proveedores más grandes de este mercado brindan no solo economías de escala, sino también muchos años de respaldo al ecosistema, dijo Hackenberg. Para pasar de las pruebas beta a la viabilidad comercial, las nuevas empresas en este espacio deberán ofrecer muchos incentivos para que los compradores abandonen sus proveedores tradicionales, incluida una mejora notable del rendimiento, ahorros de costos o un poco de ambos.

«Las nuevas empresas a menudo subestiman las relaciones a largo plazo y el apoyo al ecosistema», dijo Hackenberg.

Otros tienen más esperanzas sobre el potencial de los chips de IA gigantes y las arquitecturas más nuevas para demostrar su valor.

Agustín HuertaAgustín Huerta

Agustín Huerta, vicepresidente de tecnología de la consultora de TI Globant, dijo que los proveedores de chips están facilitando a las empresas el uso de chips de IA más grandes.

«En mi experiencia personal, los proveedores de chips también están dispuestos a estar más cerca de las empresas que antes y proporcionar insumos significativos, a diferencia de los proveedores de CPU tradicionales», dijo Huerta, quien dirige el estudio de automatización de procesos e inteligencia artificial de Globant.

Los proveedores de chips están trabajando directamente con los usuarios finales para optimizar sus chips para diferentes casos de uso y arquitecturas, dijo. El soporte alivia a los equipos de IA de tener que hacer este trabajo. También significa que los equipos de IA pueden escribir un algoritmo una vez y volver a compilarlo para una variedad de entornos de producción de destino diferentes.

En elogio de los chiplets de resolución de problemas

Dicho esto, Huerta espera que los chips más grandes sean utilizados principalmente por empresas donde las aplicaciones de IA son el núcleo de su negocio o por empresas que brindan servicios de desarrollo en IA. Los chips de IA gigantes les permitirán invertir más tiempo en ajustar los modelos o identificar casos en los que el entrenamiento adicional no arroje los resultados esperados. Para muchas otras empresas, sin embargo, estos chips no serán relevantes, al menos no en un futuro próximo.

«La mayoría de las empresas, como los bancos o los minoristas, apenas utilizarán esas soluciones; simplemente hay demasiada potencia informática para que puedan hacer un buen uso de ella», dijo. «Para un uso corporativo más generalizado, los chips más grandes podrían ser un desperdicio de recursos».

De hecho, Hackenberg advirtió que en esta etapa es solo una teoría que los chips más grandes ganarán tracción. Muchas empresas obtendrán un mejor retorno de la inversión al adoptar chips más pequeños que cuestan menos de comprar y ejecutar. De hecho, la tendencia del mercado es hacia chips más pequeños. «Más pequeño tiende a mejorar el rendimiento por vatio y un mejor rendimiento de fabricación», dijo.

Los proveedores de procesadores tradicionales están tratando de desarrollar hardware de inteligencia artificial menos costoso, como chiplets, piezas modulares que se pueden combinar en procesadores heterogéneos más grandes para agregar ancho de banda y ejecutar algoritmos especializados.

Huerta cree que estos chips más pequeños y de baja potencia podrían permitir el uso de IA en dispositivos que no pueden conectarse de manera confiable a una red como brazos robóticos, bots de entrega y automatización de equipos remotos.

Un chip de IA gigante tiene una función diferente. Los chips más grandes prometen abrir nuevas vías de investigación de IA, argumentó Feldman de Cerebras.

«Cuando tienes un nuevo hardware que permite diferentes cosas, puedes escribir diferentes modelos», dijo. Hasta ahora, los científicos de datos solo han explorado un subconjunto de algoritmos adaptados a las características de las GPU. Están escribiendo el mismo tipo de algoritmos para que se ejecuten más rápido.

Pero en el futuro, Feldman dijo que espera que los investigadores exploren nuevos modelos que podrían incluir redes más grandes, redes más profundas o redes extraordinariamente dispersas.

Deja un comentario

También te puede interesar...

Definición de dinero barato

¿Qué es el dinero barato? El dinero barato es un préstamo o préstamo con una tasa de interés baja o tasas de interés bajas establecidas por un banco central como la Reserva Federal. El dinero

Definición de productos blandos

¿Qué es un producto blando? Un producto blando se refiere a contratos de futuros en los que el efectivo crece en lugar de extraerse o extraerse. Los bienes blandos son algunos de los tipos de

Definición de garantía del conductor

¿Qué es la garantía de un mecánico? La garantía del mecánico es una garantía de pago a los constructores, contratistas y empresas constructoras que construyen o reparan estructuras. Las garantías del conductor se extienden a

Vario II se convierte en WinMob 6

Una advertencia rápida para cualquier persona como yo que use un T-Mobile Vario II (también conocido como HTC Hermes). T-mob finalmente ha lanzado una actualización de Windows Mobile 6 para el teléfono, que se puede

8 sitios que funcionan bien sin JS, gracias

8 sitios que funcionan bien sin JS, gracias Demasiados desarrolladores confían en JavaScript como recurso esencial. Observamos una variedad de sitios que son modernos, interactivos y cuentan con una excelente experiencia de usuario, sin la

Definición de fondos de capital riesgo

¿Qué son los fondos de capital riesgo? Los fondos de capital de riesgo son fondos mutuos que administran el dinero de los inversores que buscan capital privado en nuevas empresas y pequeñas y medianas empresas

Navegador sin conexión de Android | Krypton Solid

Si bien ahora es posible comprar navegadores por satélite de excelente calidad a precios asequibles, cuando no hagas un uso intensivo de este tipo de dispositivos puedes compensar muy bien su carencia instalando aplicaciones de

SK Telecom implementa LTE-R en el metro de Busan

SK Telecom ha implementado LTE-R, el estándar de red ferroviaria de última generación, en la línea 1 del metro de Busan, Corea del Sur. El mayor operador de telefonía móvil de Corea del Sur firmó

Definición de acuerdo de adquisición

¿Qué es un acuerdo de adquisición? Un acuerdo de adquisición es un acuerdo entre un fabricante y un comprador para comprar o vender partes de los activos futuros del fabricante. Normalmente se negocia antes de

Cómo invertir en la bolsa de Arabia Saudita

Incluso en un momento de caída de los precios del petróleo, el mercado de valores de Arabia Saudita ha dominado la inversión en el Consejo de Cooperación del Golfo de seis países. Pero los inversores

Diversificación: mi término favorito

Investopedia y nuestros socios externos utilizan cookies y procesan datos personales, como identificadores únicos, en función de su consentimiento para almacenar y/o acceder a información en un dispositivo, para mostrar anuncios personalizados y para medir