Tecnología

Una pequeña tecnológica china hace tambalear a Silicon Valley y Trump

Por Carlos del Castillo

Si hay algo que define a la inteligencia artificial son sus precios. Entrenar nuevos modelos es muy caro, reunir las bases de datos para ello es muy caro y ponerla a disposición de los usuarios es muy caro, debido a sus enormes requerimientos computacionales y energéticos. Lejos de intentar controlar esta escalada, Silicon Valley y Washington la usaron como filtro: sin unos cuantos cientos de millones dólares en la cuenta y el sello para importar chips, estás fuera de la carrera.

Desde 2022, cuando apareció ChatGPT, esa cadena de precios astronómicos impulsó el valor de los gigantes estadounidenses que se reparten el pastel. El de Microsoft aumentó un 85%. El de Google, un 105%. El de Meta, un 580%. El de Nvidia, un 840%. OpenAI está valorada en más de 150.000 millones de dólares tras la mayor entrada de capital riesgo en una sola firma de la historia, mientras que xAI, la empresa que Elon Musk se sacó de la manga con los datos de X, alcanzó los 50.000 millones. En el ámbito de las ayudas públicas, el baremo ahora son los 500.000 millones que Donald Trump puso encima de la mesa para construir centros de datos.

Mientras el mundo se iba acostumbrando a esas cifras, una empresa china dio una patada al tablero. Este lunes su efecto volatilizó cientos de miles de millones en el valor de las grandes tecnológicas estadounidenses. Esa empresa china se llama DeepSeek y su órdago se llama R-1, una inteligencia artificial con capacidades muy similares a las de los últimos modelos de OpenAI, pero que asegura que solo costó 5,5 millones entrenar. Un 90% menos que lo invertido por su máximo rival estadounidense.

El precio no es el único martillazo a los cimientos de la industria de la IA que dio DeepSeek. También está el de los componentes. Oficialmente, la empresa -fundada en 2023 y con unos 150 empleados- no tuvo acceso a los chips más avanzados de Nvidia debido al veto a las exportaciones de Washington. Es decir, entrenó a su IA con un proceso mucho más barato y con menos recursos computacionales que los que emplea Silicon Valley.

Esto tuvo un efecto devastador en la cotización de Nvidia, que se dejó más de medio billón de dólares en una sola jornada, la mayor destrucción de valor bursátil de la historia. Un duro correctivo para la compañía liderada por Jensen Huang, que había escalado hasta ser la más valiosa del mundo gracias a su ventaja competitiva en sus chips para la IA. Ahora se abre la duda de si esos componentes superavanzados son realmente necesarios para desarrollar algoritmos punteros.

Finalmente, la empresa china dio un último golpe a Trump y su corte de tecnólogos abriendo el código de su máquina casi por completo. Esto significa que cualquier otra persona u organización puede examinarlo, copiarlo y modificarlo en función de sus necesidades. En la práctica, significa que está dando gratis un producto por el que OpenAI cobra. La compañía de Sam Altman no cotiza en bolsa, por lo que impidió que el efecto DeepSeek suponga un correctivo automático a su valor.

Más barato, más eficiente, replicable

"El modelo razonador DeepSeek R-1 logra colocarse al nivel de los modelos razonadores o1-mini y o1 de OpenAI de acuerdo a lo publicado en su artículo. Es capaz de superar a o1 en algunas de las tareas evaluadas y supera con creces las capacidades de o1-mini. La gran ventaja ahora mismo es que se trata de un modelo más eficiente, que responde más rápido y además es de código abierto con licencia de uso comercial", expone Mikel Galar, catedrático de Ciencia de la Computación e Inteligencia Artificial de la Universidad Pública de Navarra.

El especialista explica que DeepkSeek ha utilizado 21 conjuntos de pruebas para testar sus inteligencias artificiales y compararlas con las estadounidenses. Estos se dividen en diferentes tipos de tareas: diez pruebas de Inglés, cinco de programación de código, tres de matemáticas y tres en chino. Aunque en algunas tareas queda por detrás, en la mayoría de ellas R-1 alcanza o rebasa en algunos puntos la puntuación de o1.

Técnicamente, el o1 no es el modelo más potente de OpenAI, pero sí el último que está disponible para el público. Los más modernos son más potentes, pero simplemente consumen demasiados recursos como para sacarlos al mercado. "OpenAI anunció su modelo o3 hace unas semanas, con una mejora clara frente a sus modelos de la familia o1, pero este no está disponible por el alto costo que conlleva su uso", recuerda Galar.

DeepSeek se convirtió este fin de semana en la aplicación más descargada en EEUU, por delante de ChatGPT. La demanda fue tan alta que este lunes la compañía china tenía muchos problemas para registrar nuevos usuarios o dar servicio en países como España, aunque la empresa denunció que se debió a "un ciberataque a gran escala". A última hora de este lunes, la compañía china contraatacaba con otro as más, al publicar un modelo de IA que bate a sus rivales también en generación de imágenes, según sus pruebas.

Según el Wall Street Journal, el trasvase a la IA de DeepSeek ya comenzó en Silicon Valley. Anthony Poo, cofundador de una startup que utiliza IA para predecir rentabilidades financieras, reveló que su empresa lo hizo en septiembre. Sus pruebas demostraron que DeepSeek ofrecía un rendimiento similar por una cuarta parte del costo. "El modelo de OpenAI es el mejor en rendimiento, pero tampoco queremos pagar por capacidades que no necesitamos", afirma Poo.

"No es perfecto y tiene algunos tics. Por ejemplo, es un modelo que a veces, al hacerle una pregunta en inglés, te contesta una parte en chino", dice Robert Clarisó, profesor de los Estudios de Informática, Multimedia y Telecomunicación de la Universitat Oberta Catalunya, sobre su modelo de generación de texto. "Las personas que están empezando a utilizarlo, lo que comentan es que realmente la apariencia que da es de que sí, que tiene una calidad parecida a los modelos de OpenAI", continúa.

En cualquier caso, Clarisó pide prudencia y tiempo a la hora de evaluar el modelo chino. "La mayor innovación son las optimizaciones en la forma como se ha entrenado el modelo, para emplear menos recursos. Todavía falta ver si estos trucos han tenido alguna repercusión en su rendimiento y se ha perdido algo por el camino", destaca.

¿Un veto que impulsó la innovación?

Nvidia y los gigantes de la IA estadounidenses no son los únicos que vivieron una jornada negra por la irrupción de DeepSeek. Las políticas de mano dura con las exportaciones de chips de Joe Biden y que Donald Trump se mostró partidario de mantener e incluso aumentar también quedaron en entredicho. Numerosos analistas señalan que son estas medidas las que impulsaron a las empresas de IA chinas a hacer más con menos.

"La verdad incómoda para los responsables políticos estadounidenses es que los estrictos controles a las exportaciones han obligado a las empresas tecnológicas chinas a volverse más autosuficientes, estimulando avances que de otra manera tal vez no habrían ocurrido", dice en una tribuna del Financial Times Ángela Zhang, profesora de la Universidad del Sur de California y autora de High Wire: Cómo regula China las grandes tecnológicas y gobierna su economía.

La experta recuerda que Pekín intentó impulsar su industria de la IA desde hace años sin demasiado éxito. "Las iniciativas estatales suelen dar lugar a ineficiencia, corrupción y despilfarro", afirma. "Lo que las restricciones estadounidenses consiguieron sin querer fue un poderoso incentivo comercial para que el sector privado chino ocupara el lugar que le correspondía. Y si bien EEUU suele dominar en materia de investigación innovadora, las empresas chinas sobresalen en ejecución, asequibilidad y difusión de productos. En comercio electrónico, vehículos eléctricos, paneles solares y baterías, han demostrado una capacidad impresionante para crecer", remarca.

Clarissó concuerda: "La industria china es muy buena tomando un producto y refinándolo para hacerlo más eficiente o más barato". "Además, en esto también partían con un poco de ventaja, porque ellos ya sabían lo que estaban haciendo los estadounidenses y cuáles son los problemas de base", añade.

"Reivindicaciones sospechosas"

DeepSeek encarna a la perfección el mito de David contra Goliat en el campo de la IA. Con todo, otros especialistas consultados destacan que algunas de sus explicaciones sobre cómo entrenaron a sus modelos son "sospechosas".

Así lo expresa Julián Estévez, profesor de Robótica e Inteligencia Artificial en la Universidad del País Vasco. Una de esas aseveraciones es el hecho de que no hayan tenido acceso a los chips más avanzados. "China tiene sanciones para importar chips de Nvidia, como sabemos. Sin embargo, está empleando a terceros países como intermediarios. El principal de ellos es Singapur, y es un secreto a voces", destaca.

"En el Foro de Davos, entrevistaron al CEO de ScaleAI, y él declaró que sospechaba que DeepSeek entrenaba con unos 50.000 GPU de Nvidia, pero que no lo podían decir por las sanciones", continúa el profesor, que tampoco da por sentado que esa cifra sea la real. En septiembre Financial Times reveló que había cientos de miles de chips avanzados de Nvidia en China, y que alquilar su potencia de cálculo era incluso más barato que en EEUU.

Por último, Estévez destaca que las métricas para comparar inteligencias artificiales generativas de texto "han quedado inservibles desde hace un tiempo. Se pueden emplear para engañar con estadística, o incluso se puede entrenar al modelo para que se superen esos tests". Por ello, "hay que tomar con pinzas las reivindicaciones grandilocuentes" de las empresas de IA sobre sus modelos, tanto de DeepSeek como sus contrapartes estadounidenses.

Fuente: elDiarioAr