IA

DeepSeek abarató la IA y la burbuja de Estados Unidos apostó a lo contrario

Susan Hill

DeepSeek, un laboratorio chino surgido de un fondo de inversión cuantitativo, insiste en hacer aquello que la industria estadounidense de la IA daba por imposible. Construye modelos que rinden cerca de la frontera tecnológica, los entrena por una fracción de lo que gastan sus rivales en Estados Unidos y después publica los pesos para que cualquiera los descargue y los ejecute. Cada lanzamiento reabre el mismo debate: que la valoración de todo el sector estadounidense de la IA se apoya en una premisa que DeepSeek desmonta poco a poco, la de que la inteligencia tiene que seguir siendo cara.

Esa premisa no es abstracta. Sostiene cientos de miles de millones de dólares en construcción de centros de datos, la cotización de los fabricantes de chips y los proveedores de nube que figuran dentro de casi cualquier fondo indexado, y la suscripción mensual que muchos lectores ya pagan por un chatbot. Si un competidor ofrece resultados comparables por mucho menos y regala el software, la prima asociada a una computación escasa y costosa empieza a parecer menos una barrera defensiva y más una apuesta.

La afirmación de DeepSeek va de eficiencia, no de magia. Sus ingenieros recurrieron a un diseño de mezcla de expertos que solo activa una parte del modelo en cada consulta, al uso intensivo de cálculos de menor precisión y a procesos de entrenamiento ajustados para funcionar con menos chips y, en parte, con chips restringidos por las sanciones. La cifra que más se ha repetido para uno de sus entrenamientos principales quedó por debajo de los seis millones de dólares. Los entrenamientos equivalentes en Estados Unidos cuestan muchas veces esa cantidad cuando se suma la factura completa.

Importa tanto cómo se publica el modelo como lo que costó. DeepSeek libera los pesos abiertos, así que una persona que programa en São Paulo, un laboratorio universitario en Varsovia o una empresa en Seúl pueden descargar el modelo y ejecutarlo en sus propios equipos, sin pagar a un proveedor estadounidense por cada consulta y sin enviar sus datos al extranjero. Hay una ironía en ello: los controles de exportación pensados para frenar a la IA china cortándole los chips más potentes parecen haber empujado a DeepSeek a exprimir más con menos, y esos métodos eficientes viajan ahora a todas partes con los pesos abiertos.

Para quien simplemente usa estas herramientas, el efecto inmediato es poder elegir. Los modelos más baratos presionan a la baja los precios de las suscripciones, llevan asistentes más capaces a equipos corrientes y debilitan el argumento para atarse a un único proveedor. Lo que parecía un servicio que se alquila empieza a parecerse a un software que se puede tener en propiedad.

El relato de la burbuja exige matices, y son grandes. Esa cifra de menos de seis millones de dólares cubre un único entrenamiento final, no la investigación, los callejones sin salida, los sueldos ni el hardware que lo hicieron posible, de modo que compararla con el gasto total de un laboratorio estadounidense es comparar cosas distintas. Los pesos abiertos tampoco son código abierto: los datos de entrenamiento y el método completo siguen siendo privados. Y el argumento de la eficiencia corta por los dos lados. Preguntada por DeepSeek, la dirección de Microsoft echó mano de la paradoja de Jevons, la vieja observación de que, cuando un recurso se vuelve más barato de usar, su consumo total tiende a subir en lugar de bajar. Una inteligencia más barata puede significar simplemente que el mundo compre mucha más, lo que sería una buena noticia para quienes venden computación, no mala.

Tampoco es la primera vez que se declara muerta la burbuja. Ese mismo laboratorio provocó la mayor pérdida de valor bursátil en un solo día de la historia de Estados Unidos, borró cerca de seiscientos mil millones de dólares de un fabricante de chips en una tarde y después vio cómo la acción recuperaba casi todo en cuestión de semanas. Las grandes empresas estadounidenses de IA no respondieron gastando menos. Levantaron más dinero y construyeron más grande. Cualquier afirmación de que la burbuja por fin estalló tiene que sobrevivir al hecho de que quienes más dinero se juegan siguen redoblando la apuesta.

Lo que DeepSeek ha hecho en realidad cuesta más de dramatizar que una burbuja que revienta. Ha retirado la comodidad de suponer que los laboratorios estadounidenses líderes están protegidos por un muro de capital que nadie más puede escalar. Si una capacidad de frontera se puede aproximar barata y repartir gratis, el valor deja de estar en poseer el modelo. Se desplaza a la distribución, a los productos construidos alrededor del modelo y a quien controla al cliente. La próxima prueba ya está en el calendario, aunque nadie le haya puesto fecha: cada nuevo lanzamiento de DeepSeek reabre la misma pregunta y aterriza en un mercado que se ha comprometido a gastar más, no menos, convencido de que la escala sigue ganando. Donde se resolverá es en las presentaciones de resultados y en las previsiones de inversión de los próximos trimestres, no en un hilo de foro que da la pelea por terminada.

Debate

Hay 0 comentarios.