Lanzado modelo de lenguaje grande de nueva generación en Shanghai

Por Xinhua | el 18 de enero de 2024 | 16:17

Visitantes se informan sobre un modelo de lenguaje de gran tamaño impulsado por inteligencia artificial, durante la Conferencia Mundial de Computación 2023, que se celebra en la ciudad de Changsha, capital de la provincia de Hunan, en el centro de China, el 15 de septiembre de 2023. (Xinhua/Chen Zeguo)

Un modelo de lenguaje grande de nueva generación, capaz de aceptar y procesar alrededor de 300.000 caracteres chinos a la vez, fue lanzado el miércoles en la municipalidad de Shanghai, en el este de China.

La limitada longitud de contexto de los modelos grandes es un problema significativo en la inteligencia artificial.

El nuevo modelo, InternLM2, fue desarrollado por el Laboratorio de Inteligencia Artificial de Shanghai, SenseTime, la Universidad China de Hong Kong y la Universidad Fudan.

En un experimento, los investigadores alimentaron al modelo con la transcripción de una reunión pública de tres horas de duración y le pidieron extraer información prominente.

Los resultados de la prueba mostraron que aunque había muchos errores tipográficos en el texto no corregido, InternLM2 puede extraer con precisión la información clave y resumir los puntos principales del orador.

Los desarrolladores tienen como objetivo avanzar en la capacidad de modelado del lenguaje de la base del modelo mediante la mejora de la calidad del corpus y la densidad de la información.

El Laboratorio de Inteligencia Artificial de Shanghai informó que continúa otorgando licencias de InternLM2 para su uso comercial gratuito.

(Web editor: Zhao Jian, 周雨)