
Image by TechCrunch, from Flickr
Une IA qui réfléchit avant de parler? Claude 3.7 Sonnet dévoile un raisonnement hybride
Anthropic a déployé Claude 3.7 Sonnet, une nouvelle version de son modèle IA qui introduit un mode « réflexion étendue » en option, donnant aux utilisateurs plus de contrôle sur la manière dont le modèle traite les tâches complexes.
Pressée ? Voici les Faits Importants !
- Le modèle améliore le raisonnement et la résolution de problèmes en permettant l’auto-réflexion avant de répondre.
- Le mode de réflexion prolongée n’est disponible que sur les plans payants.
- Claude Code, un assistant de codage, est en aperçu limité pour les développeurs
Anthropic a lancé Claude 3.7 Sonnet, un modèle IA mis à jour qui introduit le raisonnement hybride, permettant aux utilisateurs de choisir entre des réponses rapides et une réflexion prolongée.
Cette nouvelle approche vise à améliorer la résolution de problèmes en permettant au modèle de prendre plus de temps pour évaluer et affiner ses réponses si nécessaire.
En mode standard, Claude 3.7 Sonnet fonctionne comme une amélioration itérative par rapport à son prédécesseur, Claude 3.5 Sonnet. Cependant, en mode de réflexion prolongée, le modèle se livre à une auto-réflexion avant de produire une réponse.
Michael Gerstenhaber, responsable produit chez Anthropic pour l’IA, a décrit cette fonctionnalité comme un moyen pour les utilisateurs d’équilibrer le temps de réponse et la profondeur du raisonnement. « L'[utilisateur] a beaucoup de contrôle sur le comportement – combien de temps il réfléchit, et peut échanger raisonnement et intelligence avec le temps et le budget », a-t-il déclaré, comme rapporté par WIRED.
Ce processus vise à améliorer la précision dans les domaines nécessitant un raisonnement en plusieurs étapes, tels que les mathématiques, la physique, la programmation et le suivi des instructions. Les utilisateurs interagissant avec le modèle via l’API peuvent spécifier une limite sur le nombre de jetons qu’il utilise pour « réfléchir », permettant de contrôler la vitesse de réponse et le coût.
WIRED note que la mise à jour comprend également une fonctionnalité de « bloc-notes », qui rend visibles les étapes de raisonnement du modèle lorsqu’il traite une demande. Cette approche est similaire aux techniques utilisées dans d’autres modèles d’IA, comme ceux de DeepSeek.
Anthropic affirme que Claude 3.7 Sonnet a été optimisé pour des applications réelles plutôt que pour des benchmarks de style compétitif. Les premiers tests suggèrent que le mode de raisonnement étendu améliore les performances sur des tâches impliquant des bases de code complexes, l’utilisation d’outils avancés et le développement de logiciels full-stack.
Le modèle a été évalué sur SWE-bench Verified et TAU-bench, où il surpasse apparemment les versions précédentes, comme l’a rapporté Anthropic.
CNN note que Anthropic a maintenu le prix de Claude 3.7 au même niveau que les modèles précédents, le positionnant en dessous des dernières offres d’OpenAI. Il coûte 3$ par million de tokens d’entrée et 15$ par million de tokens de sortie, comparativement à 15$ et 60$ d’OpenAI pour des tiers similaires.
Laisser un commentaire
Annulez