Ha sido, sin lugar a dudas, el nombre de empresa más cacareado en los últimos días.
DeepSeek es
la startup china cuyos modelos de IA del mismo nombre han dejado asombrados a propios y extraños. En diciembre ya lanzaron
DeepSeek V3, pero hace una semana fueron más allá con su modelo que razona,
DeepSeek R1.
¿Por qué es
tan importante este lanzamiento? Por varias razones. Es un modelo Open Source, lo que permite que cualquiera pueda usarlo en su PC gratuitametne (o1, su rival de OpenAI, obliga a pagar 200 dólares al mes). Pero es que además es asombrosamente eficiente. Si nos fiamos de la compañía –y
hay quien no lo hace–, el coste de entrenar este modelo ha sido unas 20 veces más barato de lo que GPT-4 le costó a OpenAI.
Para lograr esa eficiencia
han aplicado un montón de técnicas
llamativas sobre las que destaca el
aprendizaje por refuerzo. Lo de que "
más es igual a mejor" ya no parece tan válido, y de repente quizás quien gane la carrera es no quien invierta menos,
sino quien invierta mejor. Sobre todo cuando uno compara cómo se comporta DeepSeek frente a ChatGPT, Claude o Gemini:
es igual de bueno, o mejor.
El impacto de la llegada de DeepSeek ha sido tan grande que NVIDIA perdió
400.000 millones de dólares en bolsa en una sola jornada. Hay desde luego suspicacias crecientes, como la que habla de qué está haciendo
con nuestros datos, pero esa política Open Source que ha demostrado su potencial más que nunca
puede darle un vuelco a la situación actual.
Lo que está claro es que DeepSeek no ha dejado indiferente a nadie.
Desde OpenAI lo acusan de usar sus datos y el CEO de Anthropic advirte de
quién está por detrás. Mientras algunos países ya
mueven ficha y en España se baraja un debate sobre la
inversión en centros de datos. Una cosa está clara: DeepSeek ha logrado que muchos se den cuenta de que había otras formas de seguir avanzando en IA. Y eso, como poco, es buena noticia.