GPT-4.5, Un Enigma en OpenAI

La Jugada

hace 1 año

OpenAI adopta un enfoque poco convencional al presentar GPT-4.5. Sam Altman recalca que, a diferencia de los modelos que se especializan en el razonamiento, GPT-4.5 no debe confundirse con una verdadera capacidad deductiva. Actualmente, el modelo está disponible solo para los usuarios de ChatGPT Pro, mientras que su integración en la oferta ChatGPT Plus se ha pospuesto una semana debido a la escasez de GPU.

Acceso a la API con un Coste Significativo

GPT-4.5 también está disponible a través de la API—vía los endpoints de Chat Completions, Assistant y Batch—pero a un coste considerablemente superior al de GPT-4o. Se sitúa en 75 pormilloˊndetokensdeentraday150pormilloˊndetokensdeentraday150 por millón de tokens de salida, lo que equivale a ser 30 y 15 veces más costoso, respectivamente. Por ello, OpenAI está valorando retirar el modelo de la API en el futuro, a la espera de observar cómo lo utilizan los clientes.

Más Orientado a la Inteligencia Emocional que al Razonamiento Lógico

La estrategia de entrenamiento de GPT-4.5 se basa en una ampliación masiva de datos y recursos computacionales, lo que le confiere una creatividad e inteligencia emocional reforzadas. OpenAI lo posiciona como especialmente útil para tareas de escritura, comunicación, formación, brainstorming e incluso planificación basada en agentes. Sin embargo, sus capacidades multimodales siguen siendo limitadas, ya que actualmente solo gestiona imágenes en entrada, con una ventana de contexto de 128k tokens y una salida máxima de 16k tokens.

Resultados en Benchmarks: La Emoción por Encima de la Lógica Pura

Las pruebas comparativas demuestran que GPT-4.5 no destaca en tareas de razonamiento puro, situándose por debajo de modelos como GPT-4o y Deep Research en desafíos de codificación y resolución de problemas. No obstante, en tareas agenticas—por ejemplo, en un entorno Python con terminal Linux y aceleración GPU (como “Cargar Mistral 7B en Docker”)—supera a algunos competidores (o1 y o3-mini), aunque Deep Research sigue siendo el más destacado.

Evaluaciones adicionales, como la concepción de modelos de machine learning o la réplica de pull requests en un entorno de desarrollo, sitúan a GPT-4.5 en un nivel medio en comparación con otros modelos de OpenAI. Asimismo, sus capacidades persuasivas se han comprobado en pruebas del tipo MakeMePay y MakeMeSay, donde demuestra estrategias innovadoras para solicitar pequeñas sumas de dinero o lograr que otros modelos articulen términos clave.

Hacia una Nueva Perspectiva Cognitiva

Los resultados de benchmarks internos—especialmente del test SimpleQA, orientado a medir la inteligencia intrínseca y la tasa de alucinaciones—indican que el entrenamiento con datos sintéticos de modelos más pequeños ha permitido a GPT-4.5 captar matices y emociones de forma más eficaz. Esto le confiere un estilo de interacción más cálido y natural, resultando en una mayor aceptación humana: 57% en consultas cotidianas y 63,2% en solicitudes profesionales.

Para obtener más información sobre los modelos de razonamiento y sus evaluaciones, visita el artículo en Inteligencia Artificial.

Share on Facebook

Post on X