Une IA qui réfléchit avant de parler? Claude 3.7 Sonnet dévoile un raisonnement hybride

Image by TechCrunch, from Flickr

Une IA qui réfléchit avant de parler? Claude 3.7 Sonnet dévoile un raisonnement hybride

Temps de lecture: 3 minute

Anthropic a déployé Claude 3.7 Sonnet, une nouvelle version de son modèle IA qui introduit un mode « réflexion étendue » en option, donnant aux utilisateurs plus de contrôle sur la manière dont le modèle traite les tâches complexes.

Pressée ? Voici les Faits Importants !

  • Le modèle améliore le raisonnement et la résolution de problèmes en permettant l’auto-réflexion avant de répondre.
  • Le mode de réflexion prolongée n’est disponible que sur les plans payants.
  • Claude Code, un assistant de codage, est en aperçu limité pour les développeurs

Anthropic a lancé Claude 3.7 Sonnet, un modèle IA mis à jour qui introduit le raisonnement hybride, permettant aux utilisateurs de choisir entre des réponses rapides et une réflexion prolongée.

Cette nouvelle approche vise à améliorer la résolution de problèmes en permettant au modèle de prendre plus de temps pour évaluer et affiner ses réponses si nécessaire.

En mode standard, Claude 3.7 Sonnet fonctionne comme une amélioration itérative par rapport à son prédécesseur, Claude 3.5 Sonnet. Cependant, en mode de réflexion prolongée, le modèle se livre à une auto-réflexion avant de produire une réponse.

Michael Gerstenhaber, responsable produit chez Anthropic pour l’IA, a décrit cette fonctionnalité comme un moyen pour les utilisateurs d’équilibrer le temps de réponse et la profondeur du raisonnement. « L'[utilisateur] a beaucoup de contrôle sur le comportement – combien de temps il réfléchit, et peut échanger raisonnement et intelligence avec le temps et le budget », a-t-il déclaré, comme rapporté par WIRED.

Ce processus vise à améliorer la précision dans les domaines nécessitant un raisonnement en plusieurs étapes, tels que les mathématiques, la physique, la programmation et le suivi des instructions. Les utilisateurs interagissant avec le modèle via l’API peuvent spécifier une limite sur le nombre de jetons qu’il utilise pour « réfléchir », permettant de contrôler la vitesse de réponse et le coût.

WIRED note que la mise à jour comprend également une fonctionnalité de « bloc-notes », qui rend visibles les étapes de raisonnement du modèle lorsqu’il traite une demande. Cette approche est similaire aux techniques utilisées dans d’autres modèles d’IA, comme ceux de DeepSeek.

Anthropic affirme que Claude 3.7 Sonnet a été optimisé pour des applications réelles plutôt que pour des benchmarks de style compétitif. Les premiers tests suggèrent que le mode de raisonnement étendu améliore les performances sur des tâches impliquant des bases de code complexes, l’utilisation d’outils avancés et le développement de logiciels full-stack.

Le modèle a été évalué sur SWE-bench Verified et TAU-bench, où il surpasse apparemment les versions précédentes, comme l’a rapporté Anthropic.

CNN note que Anthropic a maintenu le prix de Claude 3.7 au même niveau que les modèles précédents, le positionnant en dessous des dernières offres d’OpenAI. Il coûte 3$ par million de tokens d’entrée et 15$ par million de tokens de sortie, comparativement à 15$ et 60$ d’OpenAI pour des tiers similaires.

Vous avez aimé cet article ? Notez-le !
Mauvais Je n'ai pas vraiment aimé C'était bien Plutôt bien ! J'ai aimé !

Nous sommes heureux que vous ayez apprécié notre service !

En tant que fidèle lecteur de notre contenu, pourriez-vous nous donner un coup de pouce en nous laissant une petite évaluation sur Trustpilot ? C'est rapide et cela nous aide beaucoup. Merci pour votre fidélité !

Évaluez notre service sur Trustpilot
0 Évalué par 0 utilisateurs
Titre
Commentaire
Merci pour votre avis
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Laisser un commentaire

Loader
Loader En savoir plus...