DeepSeek, una startup china de inteligencia artificial (IA) que escaló por sorpresa al primer puesto de las aplicaciones más descargadas para teléfonos móviles, amenaza con alterar el orden mundial de la tecnología, alimentando debates sobre la competencia económica y geopolítica entre Estados Unidos y China en el desarrollo de esta tecnología.

El asistente de IA de DeepSeek, competidor de ChatGPT, está sacudiendo a Silicon Valley y a los mercados. Parte de lo que preocupa a algunos observadores de la industria tecnológica de Estados Unidos es la idea de que la startup china ha alcanzado a las empresas estadounidenses en la vanguardia de la IA generativa a una fracción del costo.

Su origen

DeepSeek fue fundada en 2023 en Hangzhou, China, y lanzó su primer modelo de lenguaje de IA a gran escala ese mismo año. Su director general (CEO) y accionista mayoritario, Liang Wenfeng, anteriormente cofundó uno de los principales fondos de inversión de China, High-Flyer, también propietaria de patentes relacionadas con clusters de chips usados para entrenar modelos de IA, según los registros corporativos chinos.

Como sus rivales occidentales, DeepSeek se apoya en un modelo extenso de lenguaje (LLM), formado a partir de inmensas cantidades de textos, para dominar las sutilezas de lenguaje natural. Pero a diferencia de sus competidores, que desarrollan modelos privados, utiliza código abierto (“open source”). Esto significa que el código de la aplicación es accesible a todos, lo que permite comprender su funcionamiento y modificarlo.

Funciones

Disponible en app o para computadora, propone muchas funcionalidades parecidas a las de sus rivales: por ejemplo, escribir letras de canciones, ayudar a afrontar situaciones de la vida cotidiana o proponer una receta con lo que hay en el refrigerador. Puede comunicar en varios idiomas, pero domina más el inglés y el chino. Los expertos han elogiado sus capacidades para problemas matemáticos difíciles y otras cuestiones.

Este desempeño sorprende todavía más sabiendo que para crear el modelo de DeepSeek se ha utilizado una cantidad mucho más pequeña de chips que en los otros gigantes tecnológicos. No obstante, el dispositivo tiene los mismos límites que otros agentes conversacionales chinos: por ejemplo, cuando se le pregunta sobre temas delicados, como el Presidente Xi Jinping, prefiere evitar el tema y propone “hablar de otra cosa”.

El revuelo

DeepSeek-V3 y DeepSeek-R1, los dos modelos de IA que han sido objeto de elogios, están a la altura de los más avanzados de OpenAI, desarrollador de ChatGPT, y Meta, según la startup china. La empresa ha atraído la atención después de afirmar que sólo invirtió 5.6 millones de dólares para desarrollar DeepSeek-V3, una suma ínfima comparada con los miles de millones que gastaron las compañías estadounidenses.

El chatbot se hizo más accesible cuando apareció en las tiendas de apps de Apple y Google a principios de este año. En tanto, el DeepSeek-R1, lanzado en la semana de juramentación del Presidente Donald Trump, muestra habilidades avanzadas de “razonamiento” y es entre 20 y 50 veces más barato que un modelo similar vendido por OpenAI, llamado o1, dependiendo de la tarea, según DeepSeek.

La sacudida

DeepSeek ha suscitado dudas sobre las enormes cantidades de dinero que las tecnológicas estadounidenses han destinado y planean invertir en centros de datos y chips para impulsar avances en IA. Las acciones de varias compañías se han visto afectadas, incluida Nvidia, que perdió 589 mil millones de dólares en capitalización de mercado el lunes 27 de enero, la mayor pérdida de valor de la historia bursátil.

Marc Andreessen, inversionista de capital de riesgo, calificó a DeepSeek como un giro para la IA, como lo fue Sputnik para la espacio, en alusión al lanzamiento del satélite soviético en 1957 que desató la carrera espacial en la Guerra Fría. “DeepSeek R1 es uno de los logros más increíbles que jamás he visto. Deepseek R1 es el ‘momento Sputnik’ de la IA”, señaló Andreessen, quien ha asesorado a Trump sobre política tecnológica.

Las dudas

Alexandr Wang, CEO de la empresa norteamericana Scale AI, reconoció que ha constatado que DeepSeek está al nivel de los mejores modelos estadounidenses, pero a la vez aseguró, sin aportar pruebas, que cuenta con 50 mil chips Nvidia H100, que, según dijo, no se revelarían porque violarían los controles de exportación de Estados Unidos que prohíben vender chips de IA tan avanzados a empresas chinas.

Analistas de la firma de inversión Bernstein describieron la reacción de Wall Street como exagerada y cuestionaron la veracidad de los costos totales de formación de DeepSeek para sus modelos V3 y R1. “Los modelos que construyeron son fantásticos, pero tampoco son milagros. No están usando ninguna innovación que sea desconocida o secreta o algo por el estilo. Son cosas con las que todos están experimentando”, señalaron.

La carrera de la IA

China aspira a convertirse en líder de la IA hacia 2030. El 20 de enero, día en que DeepSeek-R1 se hizo público, su fundador, Liang Wenfeng, asistió a una reunión a puerta cerrada con el Primer Ministro chino, Li Qiang, una señal de que el éxito de DeepSeek podría ser importante para el objetivo político de China de superar los controles de exportación de Estados Unidos y lograr la autosuficiencia en industrias estratégicas como la IA.

“La innovación tecnológica es real, pero el momento del lanzamiento es político. Demostrar que los controles de exportación son inútiles o contraproducentes es un objetivo realmente importante de la política exterior china en este momento”, explicó Gregory Allen, director del Centro de IA Wadhwani en el Centro de Estudios Estratégicos e Internacionales.

Fuentes: AP, AFP y Reuters