● Observatorio independiente de modelos de IA

Los modelos de IA más poderosos.
Y cuánto valen de verdad.

Texto, código, agentes, imagen, voz, música, video y velocidad: quién manda en cada categoría, qué cuesta cada modelo y dónde está el sweet spot entre precio e inteligencia. Sin humo: benchmarks independientes, actualizados cada día a las 6:00 am.

Modelos evaluados

Categorías

—

Última actualización

Solo con precio

¿Cómo leer esta tabla?

Inteligencia / Calidad / Velocidad es la métrica principal de cada categoría: índices 0–100 de Artificial Analysis (texto, código, agentes), Elo de arenas con votación a ciegas (imagen, voz, música, video) o tokens por segundo (velocidad). Valor = calidad²/√precio, reescalado a 100: cuánta calidad recibes por cada dólar. Los discos 01–03 marcan la posición; los colores marcan premios: coral más poderoso o más rápido, oro mejor valor, verde más barato o gratis. Sweet spot = mucha calidad a buen precio (frontera de Pareto con Valor ≥ 60). En Velocidad, ⚡ es la latencia: segundos hasta la primera palabra. Los precios de texto, código, agentes y velocidad van en USD por 1M de tokens, con entrada y salida por separado.

#	Modelo	Inteligencia	Precio	Valor ⓘ

//Precio vs. inteligencia

Cada punto es un modelo. Arriba a la izquierda = mucha inteligencia por poco dinero: la zona sweet spot.

//Metodología

Transparencia total: así se construye este ranking.

¿De dónde salen los datos?

Las puntuaciones de inteligencia y calidad provienen de Artificial Analysis, el evaluador independiente de referencia: para texto, código y agentes usamos los índices de Artificial Analysis (0–100, combina los benchmarks más exigentes) y para imagen, voz, música y video el Elo de sus arenas, donde miles de personas votan a ciegas entre resultados de dos modelos. La velocidad (tokens por segundo y latencia hasta la primera palabra) también proviene de Artificial Analysis, medida en condiciones reales de API. Los precios de texto provienen de la misma fuente: mostramos el precio de entrada y el de salida por separado (USD por millón de tokens), porque casi todas las APIs cobran distinto por lo que envías y por lo que el modelo responde; para ordenar el Valor y el gráfico usamos su mezcla estándar 3:1. Los de las demás categorías son tarifas de lista oficiales de cada proveedor, revisadas por el equipo de IA Lab. Como segunda fuente independiente, validamos texto, imagen y video contra el leaderboard público de LMArena: cuando un modelo aparece en su top 10, mostramos su Elo de Arena junto al creador.

¿Cómo se calcula el Valor?

El Valor responde una sola pregunta: ¿cuánta inteligencia recibes por cada dólar? La fórmula es calidad² ÷ √precio, reescalada para que el mejor equilibrio de cada categoría sea 100. Elevar la calidad al cuadrado premia a los modelos realmente buenos (no gana el más mediocre solo por ser regalado) y la raíz del precio evita que un modelo carísimo se hunda si su calidad lo justifica. El sello Sweet spot se otorga a los modelos eficientes: nadie ofrece más calidad por menos dinero (frontera de Pareto) y su Valor es alto. Cada categoría incluye a los 30 mejores por calidad y los 20 mejores por Valor (sin duplicados, fusionando variantes de configuración del mismo modelo): así las joyas baratas-brillantes como DeepSeek V4 Flash compiten junto a los gigantes, en vez de quedar fuera por no estar en el top absoluto de inteligencia.

¿Por qué no promediamos las dos fuentes? Porque Arena solo publica su top 10: combinar ambas puntuaciones premiaría o castigaría únicamente a esos pocos modelos y dejaría al resto medido con otra vara — un sesgo de cobertura clásico. La decisión estadística más limpia es ordenar con la fuente de cobertura completa (Artificial Analysis) y usar Arena como contraste visible: cuando ambas coinciden en la cima, la señal es robusta; cuando divergen, el lector lo ve y juzga por sí mismo.

Unidades de precio por categoría

Texto: USD por 1 millón de tokens, precio de entrada y de salida por separado (la mezcla 3:1 se usa solo para calcular el Valor) · Imagen: USD por imagen (~1024 px) · Voz: USD por 1 millón de caracteres · Música: USD por canción (~3 min) · Video: USD por segundo generado. Son tarifas de lista de las API oficiales; los proveedores pueden cambiarlas y algunos modelos solo se ofrecen por suscripción (se indica el equivalente estimado).

Los modelos de IA más poderosos.Y cuánto valen de verdad.

//Precio vs. inteligencia

//Metodología

Los modelos de IA más poderosos.
Y cuánto valen de verdad.