Latam-GPT: El primer modelo de inteligencia artificial regional que impulsa la diversidad lingüística en América Latina
Chile lidera un ambicioso proyecto para preservar las lenguas originarias y fortalecer la inteligencia artificial (IA) en América Latina con Latam-GPT, el primer modelo de lenguaje de gran escala (LLM) desarrollado en la región. Esta iniciativa colaborativa, coordinada por el Centro Nacional de Inteligencia Artificial (Cenia) de Chile, reúne a más de 32 instituciones desde México hasta la zona austral chilena.
El director de Cenia, Álvaro Soto, destacó que a diferencia de otros modelos de IA entrenados principalmente con datos en inglés y contextos del norte global, Latam-GPT está diseñado para reflejar la realidad latinoamericana. Para ello, se ha entrenado con textos y documentos en español y portugués propios de la región, además de integrar lenguas originarias como el mapudungún y el rapa nui. En particular, en Rapa Nui se desarrolló un traductor bidireccional entre español y rapa nui en colaboración con la comunidad local y la Universidad Católica, con el objetivo de preservar esta lengua única y facilitar trámites gubernamentales.
Asimismo, se trabaja con las comunidades mapuches para incorporar su idioma al modelo, aunque este proceso es más complejo debido a la diversidad interna del pueblo originario más numeroso de Chile. La ministra de Ciencia, Tecnología, Conocimiento e Innovación, Aisén Etcheverry, señaló que países como Ecuador también han mostrado interés en sumar sus lenguas originarias a esta plataforma tecnológica.
Latam-GPT será un modelo abierto destinado a universidades, gobiernos y comunidades para fortalecer las capacidades locales en inteligencia artificial y reducir la dependencia de tecnologías extranjeras. Su entrenamiento se realiza sobre infraestructura regional de supercómputo y contempla un corpus de aproximadamente 70 mil millones de palabras en español, portugués e inglés. La primera versión experimental estará disponible en septiembre próximo, consolidando una herramienta tecnológica que busca reflejar no solo los idiomas sino también la cultura e identidad latinoamericanas.