25 May 2026 · Original en inglés · Resumen IA

Noruega entrena IA con 2 petabytes de Huawei

Fuentes: Norway’s 2 petabytes of Huawei flash storage and LLM training

La Biblioteca Nacional de Noruega está desarrollando un modelo de lenguaje extenso (LLM) que comprende el idioma noruego, utilizando 2 petabytes de almacenamiento flash Huawei OceanStor Dorado para alimentar su canal de datos de entrenamiento de IA. Esta iniciativa surge de la necesidad de tener un LLM soberano que refleje la cultura, historia y noticias locales, algo que los modelos globales en inglés no pueden ofrecer. La Biblioteca, con la tarea encomendada por el Ministerio de Cultura, posee la colección digital más grande de contenido noruego, incluyendo libros, periódicos y páginas web, acumulando un total de 60 PB de datos.

El principal desafío no ha sido la capacidad de cómputo, sino la calidad de los datos, su limpieza y el rendimiento del canal de datos. El proceso implica varias etapas, desde la ingesta y limpieza de datos hasta la normalización y validación, antes de enviarlos al superordenador nacional Sigma2 Olivia para el entrenamiento. La Biblioteca ha tenido que desarrollar sus propias soluciones para mover grandes conjuntos de datos desde sistemas de archivo de baja latencia a sistemas de alto rendimiento para la IA. Además, se están abordando desafíos relacionados con la evaluación del modelo, la gobernanza de su acceso y la orquestación de los diferentes sistemas involucrados. La experiencia noruega destaca la importancia de tener LLMs que reflejen la identidad cultural y lingüística de cada nación, y la necesidad de custodios para estos sistemas, más allá de los simples constructores.

Temas

Etiquetas

noruega biblioteca nacional huawei inteligencia artificial llm sigma2 oceanstor dorado cultura noruega idioma noruego datos

Entidades mencionadas

Norway location

Huawei organization

Huawei Technologies Co., Ltd. es una empresa tecnológica multinacional con sede en Shenzhen, Guangdong, China. Es la empresa líder mundial en tecnologías de la información y la comunicación (TIC) y de

Ver en Wikipedia

OceanStor Dorado hardware

Marius Husnes person

Marius Husnes serves as the Infrastructure & Platform Architect and Team Coordinator for Team UWDB at the National Library of Norway since July 2014, with experience as a Database Administrator in

Nasjonlbiblioteket organization

La Biblioteca Nacional de Noruega es una Biblioteca Nacional que se encuentra ubicada en dos lugares diferentes, teniendo una primera sede en Oslo y una segunda sede en Mo i Rana.

Ver en Wikipedia

Paris person

En la mitología griega, Paris, también llamado Alejandro, fue un príncipe troyano, hijo del rey Príamo y de su esposa Hécuba y hermano de Héctor. Paris fue conocido como «el de la hermosa figura». Dar

Ver en Wikipedia

Norway’s Ministry of Culture organization

The Ministry also has overarching responsibility for the state lotteries run by Norsk Tipping and for regulating gaming and lotteries run by private organisations. ... Kulturvern, Medier, Kunst, Kultu

Norwegian group_movement

Nvidia DGX H200 hardware

OceanStor Dorado hardware

Sigma2 software

Olivia software

HPE Cray Supercomputing EX hardware

ClusterStor E1000 software

European market location

Enlaces

Nasjonlbiblioteket nb.no

legal deposit mandate nb.no

Sigma2 sigma2.no