MiniMax M3 : le modèle open weight le plus puissant
MiniMax a dévoilé M3, un modèle open weight avec une fenêtre contextuelle de 1 million de jetons et des performances accrues. Il réduit les coûts de calcul par 20 et est 9 fois plus rapide que M2. Les benchmarks montrent des scores supérieurs à GPT-5.5 et Gemini 3.1 Pro.
« M3 réduit de vingt fois le coût de calcul par jeton lorsqu’il travaille sur un contexte d’un million de jetons. » — Le Big Data
Que faut-il retenir ?
- M3 a une fenêtre contextuelle de 1 million de jetons avec un minimum garanti de 512 000 jetons.
- Le modèle réduit les coûts de calcul par 20 et est 9 fois plus rapide que M2.
- M3 obtient 59 % sur SWE-Bench Pro, surpassant GPT-5.5 et Gemini 3.1 Pro.
- La vitesse de production avoisine les 100 jetons par seconde, soit trois fois celle de Claude Opus.
Pourquoi cette nouvelle compte-t-elle ?
M3 représente une avancée majeure dans les modèles open weight avec des performances supérieures aux leaders du marché. Ses capacités en programmation et en traitement multimédia en font un outil précieux pour les développeurs et les entreprises cherchant à intégrer des solutions IA avancées. Les réductions de coûts et les gains de vitesse pourraient révolutionner les applications en temps réel.
100 jetons par seconde de vitesse de production
Public concerné : développeurs, entreprises
Quelles sont les principales améliorations de M3 par rapport à M2 ?
M3 introduit la technologie MiniMax Sparse Attention, réduisant les coûts de calcul par 20 et améliorant la vitesse de traitement par 9. Il offre également une fenêtre contextuelle de 1 million de jetons et des performances supérieures sur les benchmarks.