Google lanzó Gemini 3.1 con una ventana de contexto de 2 millones de tokens. Todos los titulares lo presentaron como un avance revolucionario. Y para casos de uso concretos —procesar bases de código completas, analizar libros, buscar entre horas de vídeo—, lo es. Pero el marketing generó una suposición peligrosa: contexto más grande = mejor resultado.
No es así. En la mayoría de las tareas del mundo real, la calidad de tu contexto importa más que la cantidad. Un prompt enfocado de 5 000 tokens con exactamente la información correcta produce mejores resultados que un volcado de 500 000 tokens de todo lo vagamente relacionado.
Punto clave
Las ventanas de contexto son como el espacio de almacenamiento: tener un garaje más grande no te convierte en mejor conductor. Lo que importa es lo que colocas en el contexto, no cuánto espacio tienes disponible. La ingeniería de contexto (seleccionar el contexto CORRECTO) es la habilidad que produce mejores resultados, no el tamaño de la ventana de contexto.
¿Por qué más contexto no equivale a mejores resultados?
El problema de "perderse en el medio". Las investigaciones demuestran sistemáticamente que los LLM prestan menos atención al contenido ubicado en la parte media de contextos largos. La información al principio y al final se procesa con mayor precisión que la que queda enterrada en la posición 100 000. No es un fallo, es una propiedad fundamental de los mecanismos de atención de los transformadores. Volcar 2M tokens de contexto significa que una parte significativa de ese contexto es prácticamente invisible para el modelo.
Relación señal-ruido. Cuando subes una base de código completa a una ventana de contexto de 2M tokens, la mayoría de ese código es irrelevante para tu pregunta concreta. El modelo tiene que averiguar qué archivos importan, y no siempre acierta. Subir de forma selectiva los 3-5 archivos relevantes produce respuestas más precisas que volcar todo el repositorio.
El coste en tokens escala con el contexto. Procesar 2M tokens cuesta mucho más que procesar 5K. Para tareas habituales —redactar correos, escribir resúmenes, responder preguntas— estás pagando 400 veces más por una mejora marginal (o nula) en calidad.
| Enfoque de contexto | Calidad del resultado | Coste | Velocidad |
|---|---|---|---|
| 5K tokens de contexto enfocado | Excelente — el modelo se centra exactamente en lo que importa | Mínimo | Rápido |
| 50K tokens de documentos relevantes | Muy bueno — más contexto ayuda en tareas complejas | Moderado | Bueno |
| Volcado completo de 500K+ tokens | Variable — depende de la tarea y de los efectos de "perderse en el medio" | Alto | Lento |
| Relleno máximo de 2M tokens | Útil solo en tareas específicas (búsqueda en bases de código, análisis de libros) | Muy alto | Muy lento |
📬 ¿Te resulta útil? Cada semana desglosamos el marketing de la IA con análisis prácticos. Recíbelo en tu bandeja →
---¿Cuándo importan realmente las ventanas de contexto grandes?
Las ventanas de contexto grandes realmente ayudan en exactamente tres escenarios:
1. Buscar información específica en documentos extensos. "Encuentra todas las menciones de 'política de cancelación' en estos 50 contratos." Esto es recuperación, no análisis: más contexto significa más documentos para buscar.
2. Cruzar información entre varias fuentes. "Compara las secciones de metodología de estos 20 artículos de investigación." Requiere mantener varios documentos simultáneamente, algo imposible con ventanas de contexto pequeñas.
3. Analizar bases de código completas. "Encuentra todas las funciones que llaman a la API de pagos y verifica el manejo de errores." Necesita visibilidad en todo el proyecto. Claude Code lo gestiona mediante archivos CLAUDE.md en lugar de contexto bruto, pero el enfoque de Gemini de cargar todo también funciona.
Para todo lo demás —escribir, redactar, resumir, analizar documentos individuales, responder preguntas, crear contenido—, la calidad del contexto siempre supera a la cantidad. Siempre.
La habilidad que importa es la ingeniería de contexto: seleccionar los 5 000 tokens correctos de la información disponible. El Optimizador de Prompts ayuda con esto reestructurando los prompts para incluir el contexto más relevante en el formato más efectivo.
---📬 ¿Quieres más contenido como este? Análisis contraintuitivo de la IA respaldado por investigación. Suscríbete gratis →
---Preguntas frecuentes
¿Entonces el contexto de 2M de Gemini es inútil?
En absoluto. Para los casos de uso específicos mencionados (búsqueda en documentos grandes, cruce de referencias, análisis de bases de código), es realmente transformador. El problema es que el tamaño de la ventana de contexto se comercializa como una mejora general de calidad cuando en realidad es una capacidad especializada. La mayoría de las tareas diarias con IA se benefician de un contexto enfocado, no de un contexto masivo.
¿Debo elegir mi modelo de IA según el tamaño de la ventana de contexto?
Solo si trabajas habitualmente con documentos o bases de código muy extensos. Para la mayoría de los usuarios, las diferencias de calidad entre modelos (la calidad de escritura de Claude, el rendimiento de GPT, las capacidades multimodales de Gemini) importan mucho más que el tamaño de la ventana de contexto.
¿Cuál es la longitud ideal de un prompt?
Para la mayoría de las tareas, entre 200 y 500 palabras de contexto bien estructurado (el marco ICCSSE) producen los mejores resultados. Más allá de eso, los beneficios disminuyen a menos que estés incluyendo documentos de referencia reales que la IA necesite analizar.
Divulgación: algunos enlaces de este artículo son enlaces de afiliados. Solo recomendamos herramientas que hemos probado personalmente y que utilizamos de forma habitual. Consulta nuestra política completa de divulgación.