IA

LongCat 2.0, la IA china que superó a GPT-5.5 sin un solo chip de Nvidia

Susan Hill

LongCat 2.0 tiene 1,6 billones de parámetros, procesa una ventana de contexto de un millón de tokens y acaba de superar a GPT-5.5 de OpenAI en el benchmark de referencia para ingeniería de software real. Lo ha construido Meituan, una empresa que la mayoría de personas fuera de China conoce, si es que la conocen, como una app de reparto de comida.

El modelo obtuvo 59,5 puntos en SWE-bench Pro frente a los 58,6 de GPT-5.5. La diferencia parece pequeña, pero el contexto es lo que hace notable el logro: Meituan entrenó LongCat 2.0 en más de 50.000 aceleradores de IA de fabricación china, sin hardware de Nvidia, que China no puede importar en cantidad desde 2022. El fabricante no ha sido confirmado, pero en la comunidad técnica apuntan al Huawei Ascend 910B. Si es así, sería la primera vez que un modelo entrenado con hardware Huawei alcanza rendimiento de frontera en benchmarks públicos contrastables.

LongCat 2.0 emplea una arquitectura Mixture-of-Experts, que activa solo una fracción de la red para cada tarea: entre 33.000 y 56.000 millones de parámetros por consulta. Eso lo mantiene ágil sin exigir hardware de gama alta. La ventana de contexto de un millón de tokens le permite leer una base de código entera en una sola sesión. En SWE-bench Multilingual obtuvo 77,3; en Terminal-Bench, que evalúa la capacidad de navegar entornos Unix reales, alcanzó 70,8.

Antes del anuncio oficial, el modelo estuvo en OpenRouter con el nombre «Owl Alpha» durante dos meses. Quienes lo usaron notaron su capacidad inusual para el código pero no sabían su origen. Meituan confirmó tras el lanzamiento que Owl Alpha era LongCat 2.0 en fase de evaluación.

La licencia MIT no cuenta toda la historia. Los pesos del modelo aún no están disponibles: el repositorio de GitHub y la ficha en Hugging Face dicen «próximamente». Por ahora solo existe acceso vía API alojada, lo que impide descargarlo, ajustarlo o ejecutarlo localmente.

Meituan procesa más de 50 millones de pedidos diarios y desarrolló en silencio un modelo interno llamado Zhichi antes de lanzarse al mercado externo. LongCat 2.0 es su primer modelo público y, por rendimiento en benchmarks, uno de los más capaces disponibles con licencia abierta.

Cuando lleguen los pesos, LongCat 2.0 competirá directamente con Llama 4.1 de Meta y DeepSeek-V4 Pro por el título de modelo de codificación abierto más potente. La pregunta sobre los chips domésticos que lo hicieron posible tendrá respuesta tarde o temprano, y afectará bastante más allá del mundo de la IA.

Etiquetas: , , , , ,

Debate

Hay 0 comentarios.