español>>Ciencia-Tecnología

Investigadores chinos presentan el primer modelo grande inspirado en el cerebro y con picos construido en GPUs nacionales

Por DIARIO DEL PUEBLO digital | el 09 de septiembre de 2025 | 13:29

Captura de pantalla de la interfaz de SpikingBrain-1.0. (Foto: CCTV News)

Investigadores chinos han completado, por primera vez, el entrenamiento y la inferencia de todo el proceso de un modelo grande de spikes inspirado en el cerebro nativo, SpikingBrain-1.0, una plataforma de computación GPU desarrollada en el país, informó este lunes el Diario de Ciencia y Tecnología.

El equipo de investigación, proveniente del Instituto de Automatización de la Academia China de Ciencias (CASIA, por sus siglas en inglés), hizo pública oficialmente una versión del modelo con 7 mil millones de parámetros y presentó un portal digital de prueba para una versión de 76 mil millones de parámetros. Este hecho marca el debut del primer gran modelo del mundo inspirado en el cerebro, construido completamente con tecnología autóctona, y señala un avance significativo para China en la fusión de la computación inspirada en el cerebro.

El nuevo modelo, desarrollado en base a la teoría original del equipo de "complejidad endógena", fue completamente entrenado e inferido en una plataforma GPU nacional, reportó CCTV News. Su rendimiento aumenta la eficiencia y velocidad del procesamiento de secuencias ultra-largas y demuestra la viabilidad de construir un nuevo ecosistema autosuficiente de arquitecturas de modelos a gran escala, más allá del Transformer en China.

En su desempeño, también logra un rendimiento en tareas de razonamiento y comprensión de múltiples idiomas que es comparable a muchos modelos convencionales, mientras que requiere solo alrededor del 2 por ciento de los datos de entrenamiento que normalmente usan dichos modelos.

Li Guoqi, investigador de CASIA, manifestó al Diario de Ciencia y Tecnología que este logro representa no solo un hito en la arquitectura de modelos grandes inspirados en el cerebro y el desarrollo de procesos completos de la capacidad informática nacional, sino que también proporciona una herramienta de modelado más eficiente para escenarios de aplicación de secuencias ultralargas como la ley, la atención médica y la simulación científica.

"Se espera que este avance inspire la próxima generación de teorías de computación neuromórfica y diseño de chips", concluyó Li.

(Web editor: Rosa Liu, Zhao Jian)