El “chatGPT” chino DeepSeek-R1, imparable

DeepSeek, «el ChatGPT chino».. Imagen: Imagen web

Viene con código abierto modificable y su costo al público y de producción es muy inferior. Lidera en la App-store en número de descargas en el mundo.

function body_3(chk,ctx){return chk.f(ctx.getPath(false, ["author","title"]),ctx,"h");}

La start-up china DeepSeek, fundada en 2023, lanzó la semana pasada al ciberespacio de aplicaciones de celular, un modelo de chatbot y búsquedas con IA que le compite a ChatGPT de OpenAI, a Gemini de Google y a Meta IA de Mark Zuckerberg. Como viene sucediendo hace décadas, desde el sudeste asiático se estudian las innovaciones occidentales, las copian y aspiran a superarlas: muchas veces, sucede.

El buscador interactivo desarrollado por DeepSeek se llama R1 y puede hacer más o menos las misma acciones que sus competidores occidentales: puede escribir un mini ensayo sobre un libro de Byung Chul-han, conversa amablemente y por sobre todo, es un agudo buscador con respuestas concretas y sofisticadas con redacción perfecta. Resuelve problemas matemáticos complejos y crea software a pedido del usuario. Si superará a sus adversarios en efectividad, es algo que habrá que estudiar. En varios aspectos, así parece ser.

DeepSeek-R1 comenzó a liderar las listas de descargas a los celulares en la tienda de aplicaciones App Store, no solo en China sino en EE.UU. superando a ChatGPT. Habrá que ver la aceptación que tenga, y en dicho caso evaluar si puede o no desplazar a las aplicaciones occidentales. El hecho es que este es un episodio central en la Guerra Fría tecnológica por el liderazgo geopolítico y económico mundial.

Uno de los mayores diferenciales de DeekSeek-R1 es que fue lanzado totalmente con código abierto: cualquier persona puede acceder al código fuente del software. Esto permite no solo ver cómo está construido el algoritmo, sino adaptarlo según sus necesidades, facilitando la innovación en comunidad. ChatGPT también lo es, pero de manera mucho más limitada.

Lo más sorprendente –en principio— sería el bajo costo que tuvo la creación de este modelo de IA: según los voceros de la empresa china, su modelo fue entrenado durante 55 días con un presupuesto de 5,57 millones de dólares, utilizando procesadores gráficos H800 de Nvidia (este no es uno de los microchips más avanzados de la empresa y por lo tanto es más económico). La cifra es apenas el 10 por ciento de lo invertido en el entrenamiento de ChatGPT 4 (esto implica la contratación de miles de personas a bajo costo haciendo trabajos monónotos frente a la pantalla que van “educando” a la IA).

ChatGPT y DeepSeek cobran por sus servicios sin límite, pero con una gran diferencia: Lo que en ChatGPT cuesta 15 dólares, DeepSeek lo ofrece de manera similar por solo 0.14 dólares. Detrás de DeekSeek está la empresa de inversiones Huanfang Quan.

DeepSeek asegura que su R1 utiliza técnicas muy avanzadas de aprendizaje automático que permitirían «mejorar notablemente» la capacidad para realizar tareas complejas con menos datos previos. Y publicaron los detalles técnicos de los procesos de entrenamiento del modelo, algo que le puede servir a los usuarios expertos para inspirarse y desarrollar otras herramientas. En concreto, es una tecnología de mucho menos costo que ChatGPT pero acaso igual de eficiente o más.

Al igual que los buscadores chinos clásicos como Ernie Bot de Baidu, R1 viene con restricciones en la búsqueda de temas políticos espinosos: no ofrece información sobre la Masacre de Tiananmen en 1989 bajo la premisa de evitar que se generen «contenidos que atenten contra la seguridad nacional, la unidad territorial y la estabilidad social». En 2023 China reguló los servicios de IA para que respeten «los valores socialistas fundamentales». Si le preguntan a R1 si Taiwán forma parte de China, se niega amablemente comentar y sugiere al usuario que mejor pregunte sobre problemas de «matemáticas, codificación y lógica».

El contexto geopolítico

Desde China lanzaron la IA DeepSeek el 20 de enero, casi al mismo tiempo en que un Donald Trump recién asumido anunciaba el proyecto ‘Stargate’, que invertirá 500.000 millones de dólares en los próximos cuatro años para construir nuevos centros de datos y apoyar proyectos de IA. Los contendientes tienen claro que esta rama de la tecnología es la clave para el predominio mundial a futuro: si alguno de los dos gana esta carrera con claridad, tendrá su predominio asegurado.

DeepSeek apareció al mismo tiempo en que Washington comenzó a profundizar sus restricciones a la exportación de chips de alto rendimiento a China desarrollados por Nvidia y AMD, algo a lo que Beijing respondió con llamadas a la innovación para suplirlos con producción propia. Todo indica que –Huwiei mediante— China está comenzando a acercarse a EE.UU y su aliado Taiwán, en la producción de super-microchips. Aunque aún está lejos.

La disrruptiva aparición de DeepSeek demuestra que las sanciones que viene aplicando progresivamente EE.UU. a China no están retrasando el desarrollo chino: incluso lo podría impulsar por un proceso de sustitución de importaciones con innovación autóctona.

Las reacciones contra DeekSeek no se hicieron esperar: la empresa denunció este lunes que es blanco de un ciberataque «malicioso a gran escala» que los obligó a limitar temporalmente las inscripciones de usuarios. Aunque quienes ya tenían una cuenta activa, pueden seguir accediendo al servicio sin inconvenientes.

El éxito de DeepSeek perjudicó las acciones de grandes empresas del mundo high-tech. Nvidia, líder en el mercado de microchips, sufrió una caída del 13% en el valor de sus acciones, una pérdida de capitalización bursátil de 400.000 millones de dólares

Consultada por Página/12, la economista Cecilia Rikap subrayó el peso geopolítico de la noticia: “esto posiciona a China en un lugar no de vanguardia tecnológica –R1 sigue siendo el mismo tipo de desarrollo que ChatGPT– pero ante una posibilidad de quebrar o ensanchar uno de los cuellos de botella de cómo funciona la IA. Sin embargo, desde una perspectiva geopolítica, sabemos que Huawei empujó la frontera tecnológica cuando fue la primera empresa que logró dominar el 5G; pero eso no la convirtió en líder global. Y fue así, principalmente, por la influencia de EE.UU. frenando la adopción de la tecnología de Huawei en gran parte del mundo. Pero hay algo que es marginalmente distinto: con DeepSeek R1 aparece una empresa que compite, no con las grandes empresas de tecnología digital al estilo Amazon, Microsoft o Google, sino contra OpenAI. Es decir: la empresa china se suma al séquito de startups que están desarrollando modelos de IA generativa».

–¿Por qué cayeron las acciones de NVIDIA, el mayor fabricante de microchips en EE.UU. en relación al auge de DeepSeek?

–El negocio de NVIDIA es vender semiconductores. Entonces, si aparece una empresa como DeepSeek que necesita menos semiconductores para tener un modelo de IA generativa suficientemente bueno, el mercado a la larga va a demandar menos semiconductores. Me parece que este es un momento que puede devenir en un punto de inflexión interesante, pero que igualmente no va a cambiar el gran curso de cómo se está desarrollando esta tecnología sumamente dependiente de las nubes de Amazon, Microsoft y Google.

Javier Pallero, experto en políticas públicas de la tecnología, declaró a Página/12 que uno de los aspectos más importantes de la discusión sobre la censura en modelos de IA, tiene que ver con el carácter abierto o no de sus modelos. Agregó: “El sesgo de un modelo o un resultado de una censura, depende de varios factores: cómo está entrenado ese modelo y cómo se implementa. Los modelos de código abierto como DeepSeek tienen la ventaja de poder ser auditados y modificados para lograr versiones sin censura o con otros tipos de uso. Esto es siempre más positivo que los modelos cerrados de ChatGPT o Gemini, que no pueden ser modificados. Esas empresas norteamericanas también tienen sus sesgos, resultado de su entrenamiento y de las implementaciones que instauran reglas de uso, como cuando les preguntamos sobre violaciones de derechos de autor o ciberseguridad, por ejemplo.”