Bibliotecas antiguas enriquecen los entrenamientos de inteligencia artificial en Harvard
En un esfuerzo por ampliar las fuentes de datos para la inteligencia artificial, Harvard ha puesto a disposición de investigadores casi un millón de libros antiguos en múltiples idiomas, algunos de los cuales datan del siglo XV. Esta iniciativa busca ofrecer a las máquinas una comprensión más profunda y diversa de la historia, cultura y lenguaje.
La colección, que incluye más de 394 millones de páginas escaneadas, abarca temáticas que van desde literatura y filosofía hasta agricultura y derecho, muchas de ellas preservadas por generaciones de bibliotecólogos. Además, se espera que estas colecciones sean un recurso valioso para perfeccionar la precisión y confiabilidad de los modelos de IA.
Este movimiento también plantea debates sobre derechos de autor y ética, ya que algunas instituciones están promoviendo el uso público y legal de estos archivos históricos. Empresas tecnológicas como OpenAI han colaborado con donaciones y proyectos conjuntos para digitalizar textos raros y promover un acceso responsable a estos recursos, en un contexto donde la propiedad intelectual sigue siendo un tema central.
Con la incorporación de estos archivos históricos, los desarrolladores podrán entrenar modelos que no solo aprendan del contenido actual, sino también de perspectivas pasadas, enriqueciendo así el proceso de razonamiento y análisis en las futuras generaciones de inteligencia artificial.