Desarrollador chino lanza modelo multimodal que unifica video, imagen y texto

spanish.news.cn| 2024-10-21 20:02:00|

BEIJING, 21 oct (Xinhua) -- La Academia de Inteligencia Artificial de Beijing (BAAI, por sus siglas en inglés) lanzó hoy lunes Emu3, un modelo de mundo multimodal que combina la comprensión y generación de modalidades de texto, imagen y video con la predicción del siguiente token.

Emu3 valida con éxito que la predicción del siguiente token puede servir como un poderoso paradigma para modelos multimodales, escalando más allá de los modelos de lenguaje y brindando un rendimiento de vanguardia en tareas multimodales, dijo Wang Zhongyuan, director de la BAAI, en un comunicado de prensa.

"Al tokenizar imágenes, texto y videos en un espacio discreto, entrenamos un solo transformador desde cero en una mezcla de secuencias multimodales", explicó Wang, y agregó que Emu3 elimina por completo la necesidad de enfoques de difusión o composición.

Emu3 supera a varios modelos de tareas específicas bien establecidos, tanto en tareas de generación como de percepción, según la BAAI, que ha abierto el código de las tecnologías y modelos clave de Emu3 a la comunidad tecnológica internacional.

Profesionales de la tecnología han dicho que ha surgido una nueva oportunidad para explorar la multimodalidad a través de una arquitectura unificada, eliminando la necesidad de combinar modelos de difusión complejos con grandes modelos de lenguaje.

"En el futuro, el modelo de mundo multimodal promoverá aplicaciones de escenarios como cerebros robóticos, conducción autónoma, diálogo multimodal e inferencia", dijo Wang.

Para cualquier sugerencia o consulta puede ponerse en contacto con nosotros a través del siguiente correo
electrónico: xinhuanet_spanish@news.cn

Volver Arriba

Desarrollador chino lanza modelo multimodal que unifica video, imagen y texto

FOTOS

Castillo de Yoros de Turquía

Rafael Nadal compite en "6 Kings Slam"de Arabia Saudita

Lanzan expedición científica multidisciplinaria en Xinjiang

Se ve el cometa C/2023 A3 en la Gran Muralla de China

Llega temporada de cosecha de flores de crisantemo en suroeste de China

Capturas frescas en Hainan se comercializarán en toda China

Llega a Shanghai el primer tren de carga "Jinbo" China-Europa

Paisaje otoñal en parque Namsan en Seúl

VIDEOS

Presidenta de México resalta "muy buena relación" con China y oportunidades de cooperación bilateral

#AmazingChina | Historias contadas por los fotógrafos de Xinhua

AmazingChina | Magníficas prendas de China atraen a extranjeros

Mictlán, el lugar de los muertos, se vive en experiencia inmersiva en Ciudad de México

Con énfasis en la cooperación bilateral, inicia en Argentina la Semana de la Cultura China en Mendoza

Empresarios miran a China como un potencial mercado en la apertura de Expo Flor Ecuador 2024

Temen que unas 200 personas hayan quedado atrapadas por deslizamiento de tierra en Brasil

A 60 años de gesta patriótica permanece espíritu valiente y soberano en Panamá, recuerdan panameños