español>>Ciencia-Tecnología

¿Potente herramienta o destructor de empleos? La opinión de un investigador de IA sobre Sora suscita el debate en China

Por DIARIO DEL PUEBLO digital | el 20 de febrero de 2024 | 13:11

[Imagen: OpenAI]

Muchos pasaron noches en vela después de que Sora asombrara al mundo con su capacidad sin precedentes de crear vídeos directamente a partir de instrucciones de texto. Los debates sobre lo que el modelo de inteligencia artificial puede llegar hacer y suponer continúan.

Algunos señalan el golpe que podría dar a industrias tradicionales como la del cine y la televisión, esperando el día en que se pueda crear una película tras introducir una novela en el modelo. Pero otros siguen mostrándose escépticos sobre lo poderoso que realmente pueda ser el modelo para cambiar el panorama de aplicación de las IA.

Desarrollado por un grupo de jóvenes talentos de la empresa OpenAI, respaldada por Microsoft, el modelo de texto a vídeo puede generar vídeos de hasta un minuto de duración manteniendo la calidad visual y ajustándose a la indicación del usuario.

Líderes del sector en China afirman que el nuevo modelo muestra una impresionante capacidad para comprender y simular el mundo físico en movimiento, superando a modelos anteriores que funcionan basándose en la comprensión de la IA de un mundo 2D.

"Sora representa un salto revolucionario en el campo de los contenidos generados por IA", afirma el profesor Shen Yang, de la Facultad de Periodismo y Comunicación de la Universidad Tsinghua.

Un hito

Shen, uno de los más destacados investigadores de inteligencia artificial en China, dirige un equipo que estudia la filosofía de la IA, por ejemplo cómo cooperan e interactúan entre sí los humanos y las máquinas, y la aplicación de la misma en diversos campos.

Hasta que conoció Sora el 16 de febrero, Shen estaba bastante satisfecho con los vídeos generados por IA de su equipo. Un vídeo de dos minutos sobre la Fiesta de la Primavera producido por ellos mismos ha obtenido recientemente muchos likes en las redes sociales. Fue realizado por dos miembros en cinco días utilizando una serie de herramientas de contenido generado por inteligencia artificial (AIGC por sus siglas en inglés), incluidos modelos que generan textos, imágenes y vídeos.

"En comparación con el nuevo modelo Sora, lo que utilizamos son herramientas de la generación anterior. Hay un gran abismo entre unas y otras", afirma Shen.

Shen cree que Sora estamos ante otro hito en la era AIGC, después de que el chatbot de inteligencia artificial GPT-3.5 asombrara al mundo en 2022. "No esperaba que el segundo hito llegara tan pronto. Sora supera a todos sus compañeros en cuanto a sentido espacial y precisión", recalcó Shen.

El profesor añadió que la mejora de la precisión de Sora se basa en la acumulación a largo plazo de avances tecnológicos en OpenAI.

"Con su enorme potencia de cálculo y su capacidad de optimización de algoritmos, esta empresa alcanzará el próximo hito en la generación automatizada de vídeos espaciales en 3D", dijo Shen.

Fotograma del vídeo generado por IA realizado por el equipo de Shen Yang.[Cortesía de Shen Yang]

Cambios por delante

Como usuario habitual de la IA, Shen afirma que la tecnología no sólo le ayuda a mejorar su productividad, sino que también le aporta beneficios en su vida cotidiana. Su mujer padecía cáncer y muchas complicaciones, y él utilizó la IA para ayudarla a encontrar un tratamiento, lo que ha prolongado considerablemente su vida. Incluso escribió una premiada novela de ciencia ficción utilizando estas herramientas.

Sin embargo, las nuevas tecnologías no implican necesariamente buenas noticias para todos. Muchos también se muestran preocupados por los problemas de seguridad, ya que la normativa al respecto va con retraso.

"Los modelos de generación de texto ayudan a los usuarios a aumentar su productividad", afirma Shen. "Pero la demanda de diseñadores artísticos ha disminuido considerablemente a medida que los modelos de generación de imágenes salen al mercado. Conforme evolucionen los modelos de IA, se producirán cambios similares en profesiones como traductores de idiomas y programadores de bajo nivel."

Según Shen, Sora va a introducir cambios en muchos campos, como los vídeos cortos, el cine y la televisión, las noticias, los juegos, la publicidad, la educación e incluso la fabricación industrial. Otros considderan también que Sora tiene un gran potencial para impulsar el desarrollo de la conducción autónoma.

Aún hay mucho margen para mejorar los modelos de IA. Por ejemplo, los modelos actuales no son capaces de dibujar personajes con precisión y rapidez, y los letreros de las tiendas carecen de sentido en el vídeo de demostración de Sora, que muestra a una mujer caminando por una calle de Tokio. Pero se cree que estos problemas se resolverán a medida que los modelos progresen.

Estados Unidos es líder mundial en el desarrollo de la IA. Con sus últimos avances, parece que a otros países les resultará difícil seguir el ritmo, ya que la inteligencia artificial requiere enormes cantidades de inversión y una sólida base de innovaciones tecnológicas en hardware y software. El consejero delegado de OpenAI, Sam Altman, persigue remodelar la industria mundial de semiconductores y la IA con billones de dólares de inversión, informó The Wall Street Journal.

Para finales de 2023, China habrá lanzado más de 200 modelos de IA, de los cuales más de 20 han sido aprobados para prestar servicios al público, según informes del Grupo de Medios de China. Se espera que estas herramientas permitan una producción industrial inteligente. Mientras tanto, más de 30 ciudades chinas están construyendo o proponiendo construir centros de computación inteligente en preparación para la próxima era de la IA.

Shen señaló que la IA podrá capacitar a la gente a través de varios niveles de generación de contenidos y predijo que, con el crecimiento de la potencia informática global, el PIB total del mundo podría multiplicarse hasta por 10 tras experimentar las revoluciones científicas y tecnológicas representadas por este campo.

"Estamos en vísperas de una transformación masiva", afirmó Shen.

Escena de un vídeo producido por el modelo Sora se muestra en un smartphone con el logotipo de OpenAI visible al fondo. Bruselas, Bélgica, 16 de febrero de 2024. [CFP]

Fuente:CGTN

(Web editor: Rosa Liu, Zhao Jian)