El presidente del Gobierno, Pedro Sánchez, ha anunciado este lunes el lanzamiento de los primeros modelos de lenguaje de ALIA. Se trata de una iniciativa que de la que hablamos a principios del año pasado, pero que inició en 2019 y que este 2025 comienza a materializarse. Según explican en un comunicado oficial, el objetivo de la misma es impulsar el desarrollo de la inteligencia artificial (IA) poniendo a disposición de todos recursos en español y lenguas cooficiales (catalán y valenciano, euskera y gallego).
La idea es que los usuarios individuales y las empresas puedan utilizar estos recursos para realizar investigaciones o desarrollar sus propios productos de IA, aunque esta tecnología también aterrizará en algunos organismos públicos. De hecho, la activación de ALIA llega acompañada de la puesta en marcha de dos proyectos piloto: un chatbot interno que promete agilizar el trabajo de la Agencia Tributaria, y una solución destinada a la medicina de atención primaria que permitirá "un diagnóstico precoz y más preciso de las insuficiencias cardíacas".
ALIA ya está disponible para todos
Cuando hablamos de ALIA estamos haciendo referencia a una serie de recursos de IA financiados con fondos públicos y verificados por la Agencia Española de Supervisión de la Inteligencia Artificial (AESIA). En el caso de los modelos de lenguaje, estos han sido entrenados utilizando parte de la infraestructura del Barcelona Supercomputing Center, en concreto supercomputador MareNostrum 5, una pieza clave para las ambiciones científicas de España que está en funcionamiento desde 2023 y ha tenido un coste de más de 200 millones de euros.
Al momento de escribir este artículo se han publicado cinco modelos bajo licencia Apache 2.0 con su correspondiente documentación en Hugging Face y GitHub. Esto permite que aquellos interesados en sumergirse en ALIA puedan descargar los modelos y ajustarlos a sus propias necesidades. Cabe señalar que acceder a ellos no es tan fácil como abrir la aplicación de ChatGPT y comenzar a chatear. Es necesario contar con ciertos conocimientos técnicos para ponerlos en marcha. A continuación, los modelos disponibles:
- ALIA-40B: modelo de lenguaje grande entrenado de 40 mil millones de parámetros, entrenado desde cero con 9,2 billones de tokens. Comprende 36 idiomas.
- Salamandra-7b: modelo de lenguaje grande de 7 mil millones de parámetros, entrenado desde cero con 7,8 billones de tokens. Comprende 36 idiomas.
- Salamandra-7b-instruct: modelo de lenguaje grande entrenado con 276 mil instrucciones en inglés, castellano y catalán recogidas de varios corpus abiertos.
- Salamandra-2b: modelo de lenguaje grande de 2 mil millones de parámetros, entrenado desde cero con 7,8 billones de tokens. Comprende 35 idiomas.
- Salamandra-2b-instruct: modelo de lenguaje grande con 276 mil instrucciones en inglés, castellano y catalán recogidas de varios corpus abiertos.
Una pregunta que nos hacemos a menudos es con qué datos han sido entrenados los modelos de IA. No todos los actores del mundo de la IA son transparentes en este caso, pero esto no debería ser un problema en el caso de ALIA, donde se promete la transparencia. Poniendo como ejemplo ALIA-40B, podemos decir que se han utilizado una variedad de fuentes. Aquí encontramos datos de Common Crawl, GitHub, Wikimedia (Wikimedia, incluidas Wikipedia, Wikilibros, Wikinoticias, Wikiquote, Wikisource y Wikivoyag), EurLex, entre otros.
Pues bien, ahora que ya están aquí los primeros modelos puede que también te preguntes qué viene a continuación. En principio, más modelos de IA de la familia ALIA con el paso del tiempo. Adicionalmente, el Gobierno ha prometido destinar 150 millones de euros para ayudar a las empresas españoles a integrar el uso de la IA. No se trata de una promesa nueva, sino de una que se remonta a la Estrategia de Inteligencia Artificial 2024. Una porción de dinero (20 millones de euros) se destinará a 500 pequeñas y medianas empresas.
Imágenes | La Moncloa | ALIA
Ver 42 comentarios
42 comentarios
grebleips
Una IA entrenada en el socialismo, en el lado correcto de la historia. No sólo proporcionará las respuestas más feministas y diversas, también las más tronchantes.
yuri_primero
Con dataset incluido!!.
Esto si es Open Source. Y no miro a nadie META.
Esto es una gran noticia, no es la panacea, no es lo top, pero es por el buen camino.
Pero vendrán los de siempre, que ni lo entienden ni lo quieren entender, a tirar mierda. Con paridas como el sanchismo, comunismo y gilipolleces varias. En fin, que se vayan a tomar la cervecita al bar y hablar de futbol que es lo suyo.
PadreAppeles
Es una buena noticia independientemente del color que seas....pero.... no va a ser así....si no se hace, porque "llegamos tarde, somos un país de camareros". Ahora que nos subimos, modestamente al carro (Que esto acaba de empezar) ..será "dilapidar dinero para que se enriquezcan los políticos..."
ultraverse
ALIA..DE
La IA más sostenible, inclusiva, resiliente y ecofeminista de todas. Aplauses..!!
pacoco123
No me extrañaría nada que la IA hubiese sido entrenada en parte por el hermano acéfalo de Sánchez. Pero bueno, supongo que al principio la IA será neutral, y que pasado un tiempo comenzarán a incorporar sesgos social comunistas que es lo que pretenden. ¿Se puede esperar otra cosa de este enfermo que tenemos de presi?
mistercarter7
Otro pozo sin fondo donde tirar nuestros impuestos como las archiconocidas e infrautilizadas apps del ministerio de igualdad. Cuánto se ha llevado el amigo de turno por hacer dicha app??
bocadill
Suerte que no llama "Carmen"... del software español no me espero nada bueno... véase todas las apps y webs gubernamentales... que si cl@ave pin, sepe, Itv, mi salud, agencia tributaria... etc, Todo rebuscado y nada amigable.
TOVI
Tiene pinta de estar elaborada con las sobras de otros... El tiempo dirá el recorrido que tiene, que no le auguro mucho.
tomjoma2024
No les doy ni un año de vida. Con la fama que les precede con la tecnología deberían haberlo llamado la TIA.
wiredbrain
Que asco dais los que estáis con la política todo el rato; y es que además os insultáis unos a otros cuando todos los políticos están hasta el cuello de mierda.
Siempre hay unos en el poder robando y la oposición llamándolos ladrones; luego se cambian las tornas pero es lo mismo, los que antes acusaban pasan a estar en el poder y a robar, y los que antes robaban pasan a estar en la oposición llamando ladrones a los que están en el poder.
gorbea0
De los creadores de la app "me toca" la IA progre. Un nuevo éxito asegurado cuando la impongan por Decreto.
laperca
"No todos los actores del mundo de la IA son transparentes en este caso, pero esto no debería ser un problema en el caso de ALIA"
Transparencia no es precisamente algo que haya caracterizado a este gobierno, difícil veo trasladar eso. Todos los partidos políticos mienten, pero lo de este gobierno (por culpa de P.S) ha superado todos los récords de mentiras y falta de transparencia.
El PP lo va a tener difícil para superar esto una vez nuestro amado líder salga por donde entró.
fomlimalma
Mas dinero botado al tacho por su gobierno comunista... luego se indignan cuando los llaman españistan
elruedas98
Probablemente su hermano consiga un puesto en el consejo de dirección buscando por internet
wiredbrain
He probado el modelo con LM studio (está para descargar) y se siente un poco cutre, pero creo que es por la implementación que le han hecho y la versión del mismo que han utilizado. Supongo que mejorará en los próximos días, voy a probar otra implementación que hay disponible a ver si mejora.
Ignarregui
Es un comienzo, me la bajaré para probarla.
A nivel de Benchmarks sabemos con qué modelos se puede comparar ?
ikergernika
A gastar en catetadas, después del desastre de las cajas no sé cómo en este país alguien apoya este tipo de iniciativas públicas que no sirven para nada, somos una caricatura.
togepix
Las Administradiones públicas están para esto : para impulsar proyectos abiertos .
También añadiría que está muy bien esto . Pero que en las administraciones públicas , de cualquier tipo , a estas alturas , y en educación , deberían de APOSTAR YA por Linux .
Y os lo dice un usuario de MacOs.
No puede ser que salgas del colegio sin saber ni utilizar herramientas , programas y sistemas operativos LIBRES .