Inteligencia Artificial 2026-05-12 ⏱ 9 min de lectura
📄 Artículo Volver

La IA que promete leerlo todo: SubQ y la batalla por romper el gran límite de los modelos actuales

Subquadratic acaba de presentar SubQ 1M-Preview, un modelo que promete procesar contextos largos con coste lineal en lugar de cuadrático. Analizamos si estamos ante una revolución técnica o ante una promesa todavía insuficientemente demostrada.

Portada

Artículo basado en el anuncio de Subquadratic sobre SubQ 1M-Preview, publicado el 05/05/2026.

La inteligencia artificial generativa tiene un problema menos visible que las alucinaciones, pero igual de decisivo: leer mucho contexto sigue siendo caro, frágil y difícil de escalar.

Subquadratic acaba de presentar SubQ 1M-Preview, un modelo que la compañía define como el primer LLM construido sobre una arquitectura completamente subcuadrática. Traducido a lenguaje menos técnico, su promesa es que el coste de procesar textos muy largos no se dispare a medida que crece el contexto, sino que aumente de forma mucho más controlada.

La idea es ambiciosa. Si se confirma en producción y con evaluaciones externas amplias, SubQ no sería simplemente otro modelo con una ventana de contexto más grande. Podría cambiar cómo se construyen sistemas de IA para programar, analizar documentos extensos, revisar expedientes, estudiar bases de datos, trabajar con hojas de cálculo enormes o mantener historiales largos de interacción.

Pero precisamente porque la promesa es tan grande, conviene leerla con una mezcla de interés y prudencia. Hay una diferencia importante entre una arquitectura prometedora, unos benchmarks llamativos y una revolución demostrada en entornos reales.

SubQ - Nueva arquitectura
SubQ se presenta como una nueva arquitectura diseñada para superar el límite cuadrático de los transformers.

1. El verdadero cuello de botella: los modelos no pueden mirar todo sin pagar un peaje enorme

Durante años hemos celebrado que los modelos de IA acepten cada vez más texto. Sin embargo, el problema de fondo no es solo cuánto cabe en la ventana de contexto, sino cuánto cuesta procesarlo y con qué fiabilidad lo utiliza el modelo.

Los transformers, la arquitectura que ha marcado la última década de la IA moderna, comparan cada token con los demás tokens del contexto. Cuando el texto crece, esas comparaciones aumentan de forma cuadrática. Es decir, más contexto no implica solo más trabajo, sino muchísimo más trabajo.

Por eso muchas soluciones actuales no envían todo el conocimiento al modelo. Antes filtran, trocean, recuperan fragmentos y preparan cuidadosamente la información. Técnicas como RAG (generación aumentada por recuperación), chunking (troceado), recuperación semántica y orquestación de agentes no son simples refinamientos. En muchos casos son parches necesarios alrededor de una restricción estructural.

La propuesta de SubQ es atacar esa restricción desde la arquitectura, no rodearla con más capas. Esa es la razón por la que el anuncio resulta interesante incluso para quien no esté obsesionado con los detalles técnicos del aprendizaje profundo.

"Efficiency is intelligence."

"La eficiencia es inteligencia."

La frase funciona como manifiesto. Si usar más información sale demasiado caro, la inteligencia práctica de un sistema queda limitada. No basta con que el modelo sea capaz de razonar. También tiene que poder permitirse leer lo necesario para razonar bien.

2. La gran afirmación: millones de tokens con coste lineal

Subquadratic afirma que SubQ 1M-Preview se basa en una arquitectura donde el cómputo crece de forma lineal con la longitud del contexto. En términos prácticos, eso permitiría aumentar mucho la cantidad de información disponible para el modelo sin pagar el impuesto cuadrático que penaliza a los transformers tradicionales.

La afirmación más llamativa es que, en un resultado de investigación con 12 millones de tokens, la arquitectura de SubQ reduciría el cómputo de atención casi 1.000 veces frente a otros modelos frontera.

Curvas de escalado SubQ
La promesa central de SubQ: que el coste de procesar contexto largo crezca de forma lineal, no cuadrática.

La intuición es sencilla de explicar, aunque muy difícil de ejecutar: en vez de comparar todo con todo, el modelo debe concentrar su esfuerzo en las relaciones que importan. Si realmente consigue hacerlo sin perder precisión, el cambio no sería solo técnico. Cambiaría la economía de muchas aplicaciones de IA.

Hoy se diseñan muchos sistemas preguntándose qué fragmentos merece la pena enseñar al modelo. Con un contexto largo realmente útil, la pregunta podría cambiar: ¿qué podría hacer el modelo si tuviera una visión mucho más completa del problema desde el principio?

3. SubQ no quiere resumir tu repositorio, quiere leerlo entero

Uno de los casos de uso más evidentes está en programación. Subquadratic anuncia SubQ Code, un agente de código accesible mediante CLI (interfaz de línea de comandos), capaz de cargar bases de código completas en una sola ventana de contexto.

La diferencia con muchas herramientas actuales es relevante. Hoy, un asistente de programación suele ver archivos concretos, fragmentos recuperados o resúmenes parciales. SubQ plantea otro escenario: que el modelo pueda tener delante el repositorio completo para planificar, ejecutar y revisar cambios en una sola pasada.

Esto no solo afecta al código. La misma lógica podría aplicarse a contratos largos, historiales de cliente, expedientes administrativos, documentación técnica, tablas de bases de datos o grandes hojas de cálculo. En todos esos contextos, una parte importante del error no nace de que el modelo razone mal, sino de que no ve todo lo que tendría que ver.

También se anuncia una API de contexto completo y SubQ Search, una herramienta de búsqueda de contexto largo con capacidades tipo Deep Research (investigación profunda), pero con una velocidad más cercana a la de un chatbot. La promesa, de nuevo, es reducir la distancia entre buscar información y razonar con ella.

4. Los benchmarks llaman la atención, pero no cierran la discusión

Subquadratic presenta resultados llamativos. En RULER 128K, un benchmark orientado a evaluar razonamiento sobre entradas largas, declara un 95 % de precisión para SubQ 1M-Preview. También afirma que su mecanismo de atención dispersa es 52 veces más rápido que FlashAttention en una comparación de arquitectura, con un 63 % menos de cómputo.

En MRCR v2, una prueba diseñada para recuperar y razonar sobre varias piezas de información distribuidas en contextos largos, la compañía comunica un resultado de investigación de 83 y una puntuación de 65,9 para el modelo de producción verificada por terceros. Además, declara una puntuación de 81,8 en SWE-Bench Verified, un benchmark muy usado para medir capacidades de resolución de incidencias de software.

La lectura prudente es clara: estos números justifican interés, no coronación. Son resultados que merecen atención, pero todavía necesitan contraste público amplio, reproducción independiente y evaluación en tareas más variadas.

Hay que distinguir con cuidado entre tres planos: lo que la empresa afirma, lo que ha sido verificado por terceros y lo que los usuarios podrán comprobar en producción. En IA, esa diferencia suele ser decisiva.

5. La pregunta incómoda: ¿revolución técnica o promesa todavía insuficientemente demostrada?

SubQ ataca un problema real. Eso no significa que ya lo haya resuelto de forma concluyente. Cuando una empresa afirma haber superado una de las grandes limitaciones de los transformers, el listón de prueba debe ser alto.

Hace falta un informe técnico detallado, benchmarks reproducibles, comparativas amplias, evaluaciones de razonamiento general, pruebas multilingües, análisis de seguridad, métricas de coste reales y resultados en cargas de trabajo empresariales.

La propia diferencia entre los resultados de investigación y los resultados del modelo de producción invita a la cautela. En MRCR v2, pasar de 83 en investigación a 65,9 en producción no invalida la propuesta, pero sí recuerda que el camino desde el laboratorio hasta el producto rara vez es lineal.

La pregunta no es si SubQ es interesante. Lo es. La pregunta es si sus capacidades pueden mantenerse cuando el sistema salga de los ejemplos controlados y empiece a enfrentarse a documentación desordenada, código heredado, permisos, datos contradictorios, cambios de versión y usuarios reales.

6. Por qué esto importa para empresas, consultoría y trabajo del conocimiento

La promesa de SubQ no es solo técnica. Es organizativa. Muchas empresas tienen más información de la que sus sistemas de IA pueden usar bien. El problema no es la falta de datos, sino la dificultad de ponerlos en contexto de forma completa, barata y fiable.

Pila de soluciones actuales
RAG, chunking, recuperación y orquestación han sido respuestas prácticas a una limitación estructural del contexto largo.

Si una arquitectura como SubQ funciona, podría reducir la dependencia de cadenas complejas de recuperación, selección y resumen. No eliminaría RAG ni las capas de gobernanza, porque seguirán siendo necesarias la trazabilidad, la gestión de permisos, la actualización de fuentes y el control de calidad. Pero podría cambiar el equilibrio.

En lugar de diseñar sistemas alrededor de la pregunta "¿qué fragmento recupero?", muchas soluciones podrían empezar por otra pregunta más ambiciosa: "¿qué puede hacer el modelo si entiende el conjunto completo del problema?".

Eso afectaría a consultoría, auditoría, legal, desarrollo de software, soporte técnico avanzado, análisis de expedientes, revisión documental y gestión del conocimiento. En todas esas áreas, la capacidad de mantener continuidad sobre contextos largos puede ser mucho más valiosa que una respuesta brillante pero aislada.

7. La tesis de fondo: la próxima IA puede no ser solo más grande, sino menos derrochadora

Durante años, la mejora en IA se ha asociado a modelos más grandes, más datos y más cómputo. SubQ apunta a otra dirección: hacer que el modelo desperdicie menos esfuerzo mirando relaciones irrelevantes.

Esa idea tiene una consecuencia interesante. Quizá parte de la inteligencia no consiste en mirar más, sino en mirar mejor. No se trata solo de ampliar la ventana, sino de usarla con eficiencia.

Subquadratic sostiene que, a escalas como 50 millones de tokens, el espacio de diseño de las aplicaciones de IA cambiaría de forma fundamental. Conviene tratar esa cifra como una visión de futuro, no como una capacidad cotidiana ya demostrada para cualquier usuario. Pero la dirección estratégica sí está clara: si el contexto deja de ser el cuello de botella principal, muchas aplicaciones que hoy parecen demasiado caras o inestables podrían volverse viables.

Conclusión: SubQ merece atención, pero todavía no obediencia

SubQ es una de esas promesas que conviene seguir de cerca porque se dirige a un problema de verdad: el coste y la fragilidad del contexto largo. No es una mejora cosmética. Si se valida, podría cambiar cómo se diseñan productos de IA para empresas y conocimiento intensivo.

Pero todavía hay que separar entusiasmo de evidencia. Una arquitectura prometedora necesita pruebas públicas, documentación técnica, acceso real, reproducción independiente y rendimiento estable en producción.

Si SubQ cumple, no estaríamos ante un simple aumento de ventana de contexto. Estaríamos ante una posible ruptura de una de las restricciones que ha condicionado la IA moderna. Si no cumple, será otro recordatorio de que en inteligencia artificial las promesas espectaculares envejecen muy rápido.

La pregunta que deja sobre la mesa es más profunda de lo que parece: ¿la próxima gran mejora de la IA vendrá de construir modelos cada vez más grandes o de enseñarles a no malgastar tanto cómputo para encontrar lo importante?

Fuente: subq.ai/introducing-subq