![Les Meta Emails Révèlent le Téléchargement en Torrent de Livres Piratés pour la Formation d’IA](https://fr.wizcase.com/wp-content/uploads/2025/02/Screenshot-2025-02-10-at-17.11.58.webp)
Image by Nokia621, from Wiki Commons
Les Meta Emails Révèlent le Téléchargement en Torrent de Livres Piratés pour la Formation d’IA
Des emails récemment dévoilés ont émergé comme ce que les auteurs de livres qualifient de « preuve la plus accablante » contre Meta dans un procès en cours pour violation de droits d’auteur, comme l’a d’abord rapporté Ars Technica.
Pressée ? Voici les faits essentiels !
- Meta a téléchargé illégalement 81,7 téraoctets de livres piratés à partir de bibliothèques clandestines comme LibGen et Z-Library.
- Des courriels internes montrent que des employés de Meta ont soulevé des préoccupations juridiques concernant le téléchargement illégal et la diffusion de matériel sous droit d’auteur.
- Meta aurait dissimulé le téléchargement illégal en évitant les serveurs de Facebook et en minimisant l’activité de diffusion.
Ars Technica rapporte que les auteurs allèguent que Meta a illégalement formé ses modèles d’IA sur des livres piratés, et les courriels révèlent des préoccupations internes quant à la légalité du torrenting et du seeding de matériel protégé par copyright.
Le mois dernier, Meta a admis avoir téléchargé en torrent un ensemble de données controversé connu sous le nom de LibGen, qui contient des dizaines de millions de livres piratés.
Cependant, les détails sont restés flous jusqu’à ce que les emails non censurés soient rendus publics.
Selon la déposition des auteurs au tribunal, Meta aurait téléchargé illégalement « au moins 81,7 téraoctets de données à travers plusieurs bibliothèques fantômes via le site Anna’s Archive, y compris au moins 35,7 téraoctets de données provenant de Z-Library et LibGen. » De plus, « Meta a également précédemment téléchargé illégalement 80,6 téraoctets de données de LibGen. »
« L’ampleur du schéma de téléchargement illégal de Meta est stupéfiante », a déclaré le dépôt des auteurs, notant que même « des actes de piratage de données beaucoup plus petits – seulement 0,008 pourcent de la quantité d’œuvres protégées par le droit d’auteur que Meta a piratées – ont conduit les juges à renvoyer l’affaire au bureau des procureurs des États-Unis pour enquête criminelle. »
Ars Technica note que les emails révèlent également un malaise interne parmi les employés de Meta. En avril 2023, l’ingénieur de recherche Nikolay Bashlykov a écrit : « Télécharger via torrent depuis un ordinateur portable d’entreprise ne semble pas correct », ajoutant un émoji souriant.
Il a exprimé sa préoccupation quant à l’utilisation des adresses IP de Meta « pour charger du contenu piraté via des torrents ». En septembre 2023, Bashlykov avait perdu son sens de l’humour, consultant l’équipe juridique de Meta et avertissant que « l’utilisation de torrents impliquerait de ‘semer’ les fichiers – c’est-à-dire, partager le contenu à l’extérieur, cela pourrait juridiquement ne pas être OK ».
Malgré ces avertissements, les auteurs allèguent que Meta a continué à télécharger et à partager du contenu piraté, tentant même de dissimuler ses activités.
Ars Technica rapporte que des messages internes montrent que Meta a évité d’utiliser les serveurs de Facebook pour télécharger l’ensemble de données afin d' »éviter » le « risque » que quelqu’un « remonte jusqu’à l’uploader/downloader », comme l’a décrit le chercheur Frank Zhang.
Michael Clark, un cadre de Meta, a également admis lors d’un dépôt que les paramètres ont été modifiés « afin que la plus petite quantité possible de semis puisse avoir lieu. »
Les auteurs soutiennent maintenant que le personnel de Meta impliqué dans la décision de torrenting doit être déposé à nouveau, car les nouvelles preuves contrediraient soi-disant « le témoignage de dépôt précédent. »
Par exemple, alors que le PDG Mark Zuckerberg a affirmé ne pas être impliqué dans l’utilisation de LibGen pour la formation de l’IA, des messages non censurés suggèrent que la « décision d’utiliser LibGen a eu lieu » après « une escalade préalable à MZ. »
Ars Technica rapporte que Meta a soutenu que sa formation de l’IA sur LibGen constitue une « utilisation équitable » et a nié toute distribution illégale des œuvres des auteurs. Cependant, les révélations sur le torrent ont compliqué sa défense, permettant aux auteurs d’élargir leurs accusations de violation directe du droit d’auteur.
Au fur et à mesure que l’affaire progresse, Meta fait face à un examen de plus en plus minutieux concernant sa gestion du matériel protégé par des droits d’auteur, les auteurs étant déterminés à tenir le géant de la tech responsable de ce qu’ils qualifient de « système massif de téléchargement illégal ».
Laisser un commentaire
Annulez