- Más
La computadora cuántica china Wukong se convierte en la primera del mundo en afinar un modelo de IA de mil millones de parámetros
Un visitante toma fotos de un modelo de computadora cuántica superconductora Origin Wukong en la Convención Mundial de Manufactura 2024 en Hefei, provincia de Anhui, este de China, el 20 de septiembre de 2024. [Foto/Xinhua]
Un equipo de científicos e ingenieros en Hefei, provincia de Anhui, utilizó recientemente una computadora cuántica para perfeccionar un modelo de IA de mil millones de parámetros, lo que marca un hito mundial en la integración de IA y computación cuántica, según un anuncio del Centro de Investigación de Ingeniería de Computación Cuántica de Anhui el lunes.
El ajuste fino implica entrenar modelos generales de gran tamaño (como DeepSeek) con datos específicos del dominio para optimizarlos para aplicaciones especializadas, que abarcan desde el diagnóstico médico hasta la evaluación de riesgos financieros. Los métodos tradicionales, como el ajuste fino de bajo rango, a menudo se enfrentan a cuellos de botella en el rendimiento y capacidades de generalización limitadas.
La computación cuántica, sin embargo, emplea la superposición y el entrelazamiento para explorar simultáneamente grandes combinaciones de parámetros, según Origin Quantum, la empresa con sede en Hefei responsable de este avance. En otras palabras, es capaz de probar múltiples soluciones posibles a la vez para ajustar los modelos de IA con mayor rapidez y precisión.
Origin Quantum afirmó que los resultados experimentales mostraron una mejora del 8,4 % en la eficacia del entrenamiento, con una reducción del 76 % en el número de parámetros.
Esta hazaña se logró utilizando Origin Wukong, el ordenador cuántico superconductor de tercera generación desarrollado en China. El proyecto fue una colaboración entre Origin Quantum, el Instituto de Inteligencia Artificial del Centro Nacional Integral de Ciencias de Hefei y otras instituciones asociadas.
Este avance demuestra la viabilidad de la computación cuántica para lograr modelos grandes y ligeros (LLM) y abre caminos para aliviar la preocupación por la "ansiedad por la potencia de cálculo" asociada a los modelos grandes, según la compañía.
El entrenamiento y la ejecución eficiente de modelos de IA a gran escala requieren enormes recursos informáticos. A medida que los modelos de IA crecen en complejidad y tamaño, necesitan más potencia de cálculo, memoria y capacidad de procesamiento para funcionar eficazmente.
"Nuestro método es como equipar un modelo clásico de gran tamaño con un 'motor cuántico', lo que les permite trabajar juntos", afirmó Dou Menghan, vicepresidente de Origin Quantum.
Su equipo aprovechó la computación cuántica para lograr un ajuste fino inteligente, convirtiendo los pesos del modelo en un híbrido de redes neuronales cuánticas y redes tensoriales clásicas.
Chen Zhaoyun, investigador asociado del Instituto de Inteligencia Artificial, afirmó que este avance marca la primera tarea de un modelo de gran tamaño en el mundo real con computación cuántica, lo que demuestra que el hardware existente puede soportar preliminarmente el ajuste fino de modelos de gran tamaño.
Origin Wukong funciona con el chip Wukong, lo que lo convierte en el ordenador cuántico superconductor programable y entregable más avanzado de China. Puede procesar cientos de tareas cuánticas en paralelo para cualquier conjunto de datos.
El chip Wukong consta de 72 cúbits computacionales y 126 cúbits acopladores. Su nombre proviene del mítico personaje chino Sun Wukong, también conocido como el Rey Mono, que podía adoptar 72 formas diferentes. En este contexto, el nombre simboliza el poder y la versatilidad de la computación cuántica.
Un cúbit (bit cuántico) es la unidad fundamental de la información cuántica; funciona de forma similar a un bit binario clásico, pero puede existir en múltiples estados simultáneamente.
Desde su lanzamiento el año pasado, Origin Wukong ha completado aproximadamente 350.000 tareas de computación cuántica para usuarios de 139 países, abarcando diversos sectores como la dinámica de fluidos, las finanzas y la biomedicina, según Origin Quantum.
Estas tareas incluyen la simulación de dinámica de fluidos de computación cuántica a mayor escala del mundo y la integración con la plataforma experimental de nube cuántica financiera para explorar soluciones más eficientes de resolución de problemas en el ámbito financiero.