Alibaba lance le nouveau modèle d’IA Qwen et affirme qu’il surpasse le DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba lance le nouveau modèle d’IA Qwen et affirme qu’il surpasse le DeepSeek-V3

Temps de lecture: 2 minute

Le géant chinois Alibaba a dévoilé la dernière version de son modèle phare d’IA, Qwen, ce mercredi. La société prétend qu’il peut surpasser le populaire DeepSeek-V3.

Pressé(e)? Voici les faits rapides!

  • Alibaba a dévoilé son dernier modèle de raisonnement, le Qwen 2.5-Max, ce mercredi.
  • Le géant chinois prétend qu’il surpasse des modèles populaires tels que DeepSeek-V3, GPT-4o et Llama-3.1-405B.
  • L’entreprise a également lancé le Qwen2.5-VL cette semaine, un modèle d’IA capable de traiter des images et d’agir en tant qu’agent d’IA utilisant des ordinateurs et des mobiles pour accomplir des tâches.

Selon Reuters, Alibaba a lancé le nouveau Qwen 2.5-Max, comme il a nommé le nouveau modèle de raisonnement, en plein pendant les vacances du Nouvel An lunaire en Chine, pour rejoindre les énormes développements de l’IA des derniers jours et ajouter une concurrence domestique.

Lundi, DeepSeek a atteint la première place sur l’App Store d’Apple aux États-Unis, surpassant ChatGPT, inquiétant d’autres entreprises dans l’industrie de l’IA et alarmant les investisseurs—les actions de Nvidia ont chuté de 17% en une seule journée.

Maintenant, Alibaba a annoncé les dernières versions de son modèle Qwen—il a lancé 100 modèles d’IA en open-source pour la suite Qwen en septembre dernier—promettant de meilleurs résultats que les modèles populaires de pointe.

« Qwen 2.5-Max surpasse (…) presque partout GPT-4o, DeepSeek-V3 et Llama-3.1-405B », a écrit l’entreprise sur son compte WeChat officiel.

La nouvelle API du modèle de raisonnement Qwen 2.5-Max est disponible via le cloud d’Alibaba et les utilisateurs peuvent également tester le modèle sur sa page de chat.

« Nous développons Qwen2.5-Max, un modèle MoE à grande échelle qui a été pré-entraîné sur plus de 20 trillions de tokens et post-entraîné avec les méthodologies soigneusement sélectionnées de Supervised Fine-Tuning (SFT) et de Reinforcement Learning from Human Feedback (RLHF) », a écrit l’équipe Qwen sur Github.

Le géant chinois a également lancé Qwen2.5-VL lundi, une série de modèles d’IA multimodaux qui peuvent également traiter des images et accéder à des mobiles et des ordinateurs pour effectuer des tâches. OpenAI a annoncé une fonctionnalité similaire, Operator, permettant à ChatGPT d’effectuer des tâches de manière autonome en prenant le contrôle de l’ordinateur de l’utilisateur.

Selon l’équipe d’Alibaba, tous les modèles Qwen surpassent les versions similaires d’OpenAI, Microsoft, Google, Meta et DeepSeek.

Vous avez aimé cet article ? Notez-le !
Mauvais Je n'ai pas vraiment aimé C'était bien Plutôt bien ! J'ai aimé !

Nous sommes heureux que vous ayez apprécié notre service !

En tant que fidèle lecteur de notre contenu, pourriez-vous nous donner un coup de pouce en nous laissant une petite évaluation sur Trustpilot ? C'est rapide et cela nous aide beaucoup. Merci pour votre fidélité !

Évaluez notre service sur Trustpilot
0 Évalué par 0 utilisateurs
Titre
Commentaire
Merci pour votre avis
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Laisser un commentaire

Loader
Loader En savoir plus...