Google DeepMind lance un outil de filigrane open-source pour aider à détecter le texte généré par l’IA
Pressée ? Voici les Infos Rapides !
- Google DeepMind a lancé SynthID-Text, un nouvel outil gratuit en open source
- La technologie SynthID peut désormais détecter les textes, audios, vidéos et images générés par l’IA
- La recherche a été publiée dans Nature avec plus de détails techniques
Google DeepMind a lancé ce mercredi un outil de filigrane open-source appelé SynthID-Text pour aider à détecter les textes générés par l’IA. L’outil est disponible gratuitement pour les entreprises et les développeurs et fonctionne en intégrant des filigranes invisibles – indétectables à l’œil humain – dans le texte pendant la génération, en modifiant les probabilités des mots.
«Ici, nous décrivons SynthID-Text, un système de filigranage de texte prêt à l’emploi qui préserve la qualité du texte et permet une détection de haute précision, avec un minimum de latence», déclare le résumé de la recherche publiée dans Nature. «Pour permettre le filigranage à grande échelle, nous développons un algorithme intégrant le filigranage avec l’échantillonnage spéculatif, une technique d’efficacité souvent utilisée dans les systèmes de production.»
Selon la MIT Technology Review, le laboratoire de recherche en intelligence artificielle du géant de la technologie a développé la technologie SynthID pour créer plusieurs outils de filigrane IA qui peuvent maintenant reconnaître le texte, la musique, la vidéo et les images générés par l’IA. Google DeepMind a partagé une vidéo expliquant comment la technologie fonctionne sur plusieurs types de médias.
Voici comment SynthID marque le contenu généré par l’IA à travers différentes modalités. ↓ pic.twitter.com/CVxgP3bnt2
— Google DeepMind (@GoogleDeepMind) 23 octobre 2024
SynthID est disponible via la boîte à outils Google Responsible Generative AI Toolkit de l’entreprise, et les chercheurs travaillent en collaboration avec Hugging Face — une plateforme collaborative pour les développeurs qui héberge d’autres projets open-source comme le tutoriel de LeRobot pour la construction de robots alimentés par l’IA à la maison — pour le partager sur leur site également.
« Maintenant, les autres développeurs d’IA [générative] pourront utiliser cette technologie pour les aider à détecter si les textes produits proviennent de leurs propres [grands modèles linguistiques], ce qui rendra plus facile pour de nombreux développeurs de construire de l’IA de manière responsable », a déclaré Pushmeet Kohli, le vice-président de la recherche chez Google DeepMind, à MIT Technology Review.
SynthID a été testé dans les produits Gemini de Google, et des millions d’utilisateurs n’ont pas pu différencier le contenu avec filigrane de celui sans filigrane. Cependant, les chercheurs ont reconnu qu’il a des limites lorsque le texte a été modifié ou traduit, mais ils restent optimistes et croient que l’outil pourrait aider à lutter contre la désinformation et à améliorer la sécurité de l’IA.
Plusieurs entreprises technologiques ont annoncé des stratégies d’étiquetage de l’IA au cours des derniers mois. Meta a annoncé en février un système pour identifier le contenu de l’IA sur Instagram, Facebook et Threads, Google a exigé que les utilisateurs étiquettent le contenu de l’IA en mars, et Tiktok a ajouté des étiquettes au contenu généré par l’IA en mai.
Laisser un commentaire
Annulez