Meta, cuyo CEO aseguraba hace solo unas semanas que quería ser “líder en IA generativa”, ha levantado el telón de su propio modelo de inteligencia artificial: LLaMA.
Pese a que en 2021 Meta fio su propio futuro al metaverso (y se adjudicó incluso un nombre en sintonía con este ámbito de actividad), la empresa liderada por Mark Zuckerberg es consciente de que actualmente el «hype» de más relumbrón en la industria tecnológica es la inteligencia artificial y por eso se ha apresurado a hincarle el diente.
Meta, cuyo CEO aseguraba hace solo unas semanas que quería ser «líder en IA generativa», ha levantado el telón de su propio modelo de inteligencia artificial: LLaMA (Large Language Model Meta AI).
El modelo de lenguaje de la matriz de Facebook e Instagram está enfocado a los investigadores que se desenvuelven en el ámbito de la IA. En este sentido, LLaMA nace con la vocación de convertirse en una herramienta para los investigadores y no estará abierta, por ende, al público general (como si lo están ChatGPT o el nuevo chatbot de Bing).
LLaMA está por lo pronto disponible en varios tamaños diferentes (65B, 33B, 13B y 7B) que están entrenados con distintas cantidades de tokens y textos en una veintena de idiomas.
«LLaMA-13B supera a GPT-3 (175B) en la mayoría de las pruebas, y LLaMA-65B compite con los mejores modelos, Chinchilla70B y PaLM-540B», subrayó Meta, que admite simultáneamente que «la tasa de respuestas correctas sigue siendo baja».
De acuerdo con Zuckerberg, LLaMA nace con el objetivo de «ayudar a los investigadores a avanzar en su trabajo» en el ámbito de la IA y contribuir a «limitar o eliminar» los problemas actuales de sesgo, «toxicidad» o «desinformación» que aletean actualmente en torno a esta tecnología. «Los modelos más pequeños y de mayor rendimiento como LLaMA permiten ser estudiados por otros miembros de la comunidad investigadora sin acceso a grandes infraestructuras, lo que democratiza todavía más el acceso a este campo tan importante y cambiante”, enfatiza Meta.
LLaMA está disponible bajo una licencia no comercial centrada en su empleo para investigaciones
«Aún queda mucho por investigar para hacer frente a los riesgos de sesgo, comentarios tóxicos y alucinaciones en los grandes modelos lingüísticos. Al igual que otros modelos, LLaMA comparte estos retos […]. Al compartir el código otros investigadores pueden probar más fácilmente nuevos enfoques para limitar o eliminar estos problemas en grandes modelos», dice la multinacional estadounidense.
El modelo lingüístico de Meta está disponible bajo una licencia no comercial centrada en su empleo para investigaciones. Y el acceso a esta herramienta se concederá individualmente a investigadores que estén afiliados a organismo y laboratorios y que presenten la solicitud correspondiente. De esta manera, Meta quiere curarse en salud, mantener la integridad de su modelo y «evitar usos indebidos».
Tras jugárselo todo a la carta del metaverso en 2021, Meta ha decidido diversificar sus esfuerzos en la arena «techie» para arrojarse en los brazos de la IA en un momento en que otras «Big Tech» están apostando de lleno por esta tecnología. Microsoft se ha asociado con OpenAI para integrar ChatGPT en Bing y Google ha presentado también su propio chatbot, al que ha bautizado con el nombre de Bard.
No es en todo caso la primera vez que Meta incursiona en el universo de la IA. En noviembre del año pasado la compañía levantó el telón de IA orientada a investigadores. La IA en cuestión, que Meta denominó Galactica, se ufanaba de poder resumir literatura académica, resolver problemas matemáticos o escribir código científico. Sin embargo, poco después del lanzamiento de una demo de Galactica, Meta se vio obligada a retirar esta herramienta, que confrontó al parecer a los investigadores con respuestas falsas y preñadas de sesgos de naturaleza racista.