GPT-4.5, Une Énigme chez OpenAI

La Jugada

1 année ago

OpenAI adopte une stratégie particulière en dévoilant GPT-4.5. Sam Altman tient à préciser que, contrairement aux modèles spécialisés en raisonnement, GPT-4.5 ne doit pas être interprété comme doté d’une intelligence de raisonnement complète. Ce modèle est actuellement proposé aux utilisateurs de ChatGPT Pro, alors que son intégration à l’offre ChatGPT Plus sera décalée d’une semaine en raison d’un manque de GPU.

Un Accès API au Coût Significatif

Disponible également via l’API—intégrant les endpoints Chat Completions, Assistant et Batch—GPT-4.5 affiche des tarifs nettement supérieurs à ceux de GPT-4o : 75 parmilliondetokensentrantset150parmilliondetokensentrantset150 par million de tokens sortants. Ces coûts, 30 fois et 15 fois plus élevés respectivement, poussent OpenAI à envisager le retrait futur du modèle de l’API afin d’observer précisément son usage par les clients.

Une Intelligence Émotionnelle Avant Tout

La conception de GPT-4.5 repose sur une stratégie « à l’ancienne » d’augmentation massive des données et des ressources de calcul. Ce modèle se distingue par une créativité et une intelligence émotionnelle accrues, particulièrement utiles pour des applications telles que l’écriture, la communication, la formation et le brainstorming. Bien que considéré comme expérimental, GPT-4.5 reste limité d’un point de vue multimodal, gérant uniquement les images en entrée avec une fenêtre de contexte de 128k tokens et une sortie maximale de 16k tokens.

Benchmarks et Performances : L’Émotion en Tête

Les tests comparatifs montrent que GPT-4.5 ne brille pas dans les tâches de raisonnement pur. Par exemple, en résolvant des problèmes de codage ou des défis logiciels, il se positionne en deçà de modèles comme GPT-4o ou Deep Research. Cependant, pour les tâches agentiques—telles que l’exécution d’opérations dans un environnement Python avec terminal Linux et accélération GPU—il offre des résultats supérieurs par rapport à certains modèles concurrents (o1 et o3-mini), bien que Deep Research conserve une avance notable.

D’autres évaluations, portant sur la conception de modèles de machine learning ou l’exécution de pull requests, démontrent que GPT-4.5 se situe en moyenne par rapport aux références internes d’OpenAI. Ses capacités persuasives sont quant à elles mises en exergue à travers des tests comme MakeMePay et MakeMeSay, où le modèle développe des stratégies innovantes pour obtenir de petites sommes ou faire dire des mots-clés à d’autres modèles.

Vers Une Nouvelle Approche Cognitive

Les résultats des benchmarks internes, notamment via le test SimpleQA, montrent que l’entraînement sur des données synthétiques issues de modèles plus modestes a permis à GPT-4.5 d’affiner sa compréhension des nuances et des émotions. Cette approche lui confère une “chaleur” et une “naturelleté” qui se traduisent par une préférence humaine accrue : 57 % sur des requêtes quotidiennes et 63,2 % pour des requêtes professionnelles.

Pour approfondir vos connaissances sur les modèles de raisonnement et leur évaluation, consultez l’article sur l’intelligence artificielle.

Share on Facebook

Post on X