
Image by Matheus Bertelli, from Pexels
L’IA de DeepSeek Apprend à Penser par Elle-même
La startup chinoise DeepSeek, en partenariat avec l’Université Tsinghua, affirme avoir développé une méthode plus intelligente pour aider les modèles d’intelligence artificielle à penser de manière plus efficace et rapide, sans nécessiter de grands ordinateurs ou de ressources coûteuses.
Pressée ? Voici les faits en bref :
- DeepSeek a créé une IA auto-améliorante en utilisant l’Ajustement de Critique Auto-Principié (SPCT).
- Le SPCT enseigne à l’IA à juger son propre travail en utilisant des règles qu’elle génère elle-même.
- La méthode améliore les performances sans nécessiter une énorme puissance de calcul.
La percée provient d’une nouvelle technique appelée Self-Principled Critique Tuning (SPCT). Le SPCT est différent de simplement rendre les modèles d’IA plus grands pour améliorer les performances – le SPCT ne nécessite pas beaucoup d’énergie et de puissance de calcul pour enseigner à l’IA à juger son propre travail en utilisant un ensemble de règles qu’elle a créées elle-même.
La façon dont cela fonctionne est via un « juge » intégré qui vérifie que la réponse de l’IA respecte à la fois ses règles de raisonnement internes et semble appropriée pour une sortie humaine. Lorsque l’IA fournit une réponse solide, elle reçoit des commentaires positifs, ce qui l’aide à améliorer sa capacité à répondre à des questions similaires dans de futurs cas.
DeepSeek met en œuvre cette méthode dans le cadre de son système DeepSeek-GRM, qui signifie Modélisation de Récompense Générative. Le GRM fonctionne différemment des méthodes traditionnelles car il effectue des vérifications parallèles pour améliorer à la fois la précision et la cohérence.
« Nous proposons le Self-Principled Critique Tuning (SPCT) pour favoriser des comportements de génération de récompenses évolutifs, » ont écrit les chercheurs dans leur article. « Le SPCT permet à [le modèle] de poser de manière adaptative des principes et des critiques basés sur la requête d’entrée et les réponses, conduisant à de meilleures récompenses de résultats. »
Avec ce système, DeepSeek prétend que son IA peut maintenant se comporter mieux que ses concurrents tels que Gemini de Google, Llama de Meta et GPT-4o d’OpenAI, surtout lorsqu’il s’agit de tâches complexes comme le raisonnement ou la prise de décision, comme l’a souligné Euronews.
Il est important de noter que DeepSeek annonce son intention de publier ces nouveaux outils en tant que logiciel open-source, bien qu’aucune date de sortie n’ait été communiquée.
Laisser un commentaire
Annulez