DeepSeek, una empresa china de inteligencia artificial, se ha convertido en la aplicación más descargada en la App Store de Apple, desplazando al popular ChatGPT de OpenAI. Este logro no solo destaca su éxito comercial, sino también avances significativos en la creación de modelos de IA eficientes y de bajo costo.
El modelo R1, desarrollado por DeepSeek, es el responsable de este fenómeno. Según documentos publicados recientemente, la compañía logró igualar y, en algunos casos, superar los resultados de los modelos más avanzados de OpenAI. Lo sorprendente es que DeepSeek entrenó su modelo utilizando hardware más antiguo y con un presupuesto significativamente menor. Mientras OpenAI invirtió más de 100 millones de dólares en el entrenamiento de GPT-4, DeepSeek gastó menos de 6 millones en su modelo R1.
Eficiencia y creatividad tecnológica
DeepSeek aprovechó técnicas de optimización para diseñar un modelo eficiente en memoria y rendimiento, a diferencia del enfoque tradicional de las grandes empresas tecnológicas, que suelen depender de hardware avanzado y costosos centros de datos. Este logro, según Karl Freund, fundador de Cambrian AI Research, subraya que las restricciones tecnológicas, como el embargo de chips avanzados de EE. UU. a China, obligaron a DeepSeek a innovar en lugar de aumentar los recursos.
Entre los avances más destacados, DeepSeek introdujo el modelo R1-Zero, el cual prescinde del aprendizaje por retroalimentación humana, una técnica común en la industria. En su lugar, desarrollaron algoritmos capaces de autoverificar y corregir sus errores, lo que permite al modelo razonar y resolver problemas complejos de forma autónoma.
Impacto global en la industria
Los expertos señalan que esta innovación representa un “llamado de atención” para las empresas estadounidenses. Según Bill Hannas y Huey-Meei Chang, del Centro de Seguridad y Tecnología Emergente de Georgetown, la capacidad de China para observar e implementar las mejores prácticas tecnológicas de Occidente ha permitido a empresas como DeepSeek superar obstáculos como las restricciones comerciales.
El modelo R1 ya ha superado a GPT-o1, el modelo líder de OpenAI, en conjuntos de problemas matemáticos y de codificación, demostrando que una IA eficiente puede competir a nivel global. Este avance no solo redefine el desarrollo de modelos de IA, sino que también impulsa un cambio hacia soluciones más accesibles y sostenibles.
La historia de DeepSeek no solo destaca su ingenio técnico, sino también una estrategia que podría transformar la industria tecnológica: hacer más con menos.