Alibaba lance le nouveau modèle d’IA Qwen et affirme qu’il surpasse le DeepSeek-V3
Le géant chinois Alibaba a dévoilé la dernière version de son modèle phare d’IA, Qwen, ce mercredi. La société prétend qu’il peut surpasser le populaire DeepSeek-V3.
Pressé(e)? Voici les faits rapides!
- Alibaba a dévoilé son dernier modèle de raisonnement, le Qwen 2.5-Max, ce mercredi.
- Le géant chinois prétend qu’il surpasse des modèles populaires tels que DeepSeek-V3, GPT-4o et Llama-3.1-405B.
- L’entreprise a également lancé le Qwen2.5-VL cette semaine, un modèle d’IA capable de traiter des images et d’agir en tant qu’agent d’IA utilisant des ordinateurs et des mobiles pour accomplir des tâches.
Selon Reuters, Alibaba a lancé le nouveau Qwen 2.5-Max, comme il a nommé le nouveau modèle de raisonnement, en plein pendant les vacances du Nouvel An lunaire en Chine, pour rejoindre les énormes développements de l’IA des derniers jours et ajouter une concurrence domestique.
Lundi, DeepSeek a atteint la première place sur l’App Store d’Apple aux États-Unis, surpassant ChatGPT, inquiétant d’autres entreprises dans l’industrie de l’IA et alarmant les investisseurs—les actions de Nvidia ont chuté de 17% en une seule journée.
Maintenant, Alibaba a annoncé les dernières versions de son modèle Qwen—il a lancé 100 modèles d’IA en open-source pour la suite Qwen en septembre dernier—promettant de meilleurs résultats que les modèles populaires de pointe.
« Qwen 2.5-Max surpasse (…) presque partout GPT-4o, DeepSeek-V3 et Llama-3.1-405B », a écrit l’entreprise sur son compte WeChat officiel.
La nouvelle API du modèle de raisonnement Qwen 2.5-Max est disponible via le cloud d’Alibaba et les utilisateurs peuvent également tester le modèle sur sa page de chat.
« Nous développons Qwen2.5-Max, un modèle MoE à grande échelle qui a été pré-entraîné sur plus de 20 trillions de tokens et post-entraîné avec les méthodologies soigneusement sélectionnées de Supervised Fine-Tuning (SFT) et de Reinforcement Learning from Human Feedback (RLHF) », a écrit l’équipe Qwen sur Github.
Le géant chinois a également lancé Qwen2.5-VL lundi, une série de modèles d’IA multimodaux qui peuvent également traiter des images et accéder à des mobiles et des ordinateurs pour effectuer des tâches. OpenAI a annoncé une fonctionnalité similaire, Operator, permettant à ChatGPT d’effectuer des tâches de manière autonome en prenant le contrôle de l’ordinateur de l’utilisateur.
Selon l’équipe d’Alibaba, tous les modèles Qwen surpassent les versions similaires d’OpenAI, Microsoft, Google, Meta et DeepSeek.
Laisser un commentaire
Annulez