Intelligence Artificielle

LLM open source : la Chine et Mistral AI sont en train de redistribuer les cartes

Il y a deux ans, utiliser un LLM open source en production, c’était encore un pari risqué. Aujourd’hui, c’est souvent le choix le plus rationnel. Ce renversement, on le doit en grande partie à des acteurs chinois – et à une startup française qu’on ne présente plus.

Janvier 2025 : le jour où tout a basculé

Souvenez-vous de la réaction de la Silicon Valley quand DeepSeek R1 est sorti en janvier 2025. Des ingénieurs chez OpenAI qui tweetaient leur stupéfaction. Nvidia qui perdait 600 milliards de capitalisation en une journée. Le message était clair : on pouvait faire du très haut niveau à une fraction du coût, depuis la Chine, en open source.

Ce n’était pas juste un bon modèle de plus. C’était la preuve que le monopole américain sur l’IA de pointe était terminé – et que l’accès fermé n’était plus une nécessité technique, mais un choix commercial.

Selon le rapport State of Open Source on Hugging Face – Spring 2026, les modèles chinois ont capturé 41 % des téléchargements de LLM entre février 2025 et février 2026 – devant les États-Unis (36,5 %). Il y a trois ans, personne n’aurait parié là-dessus.

La Chine : pas un acteur, tout un écosystème

Ce qui est frappant avec la montée en puissance chinoise, c’est que ce n’est pas le fruit d’un seul champion. C’est une dynamique collective, portée par plusieurs acteurs qui se tirent vers le haut.

DeepSeek – l’efficience poussée à l’extrême

DeepSeek V3 affiche 88,5 % sur le benchmark MMLU avec un coût d’inférence dix fois inférieur à GPT-4o. Son architecture MoE (Mixture of Experts) est particulièrement maligne : 122 milliards de paramètres au total, mais seulement 10 milliards actifs à chaque requête. Résultat concret – ça tourne sur un MacBook 64 Go.

Licence MIT, donc utilisable sans restriction commerciale. C’est probablement pour ça que DeepSeek V3.2 est devenu la référence « rapport qualité-coût » de 2026 pour beaucoup d’équipes.

Qwen (Alibaba) – le mastodonte discret

On parle moins de Qwen dans les médias tech grand public, mais sur Hugging Face, les chiffres sont vertigineux : plus de 113 000 modèles dérivés créés par la communauté, dépassant Google et Meta réunis. Près d’un milliard de téléchargements cumulés en mars 2026.

Qwen 3.5 supporte 201 langues. La variante Qwen2.5-Coder est taillée pour la génération de code. Et la gamme couvre tout – des petits modèles embarqués jusqu’aux architectures de 235 milliards de paramètres. Ce n’est pas un modèle, c’est une plateforme.

Kimi K2 (Moonshot AI) – le challenger à surveiller

Moonshot AI est moins connue, mais Kimi K2 et K2.5 montent régulièrement dans les classements de raisonnement longue durée. Ça confirme une tendance : la Chine ne mise pas tout sur un seul cheval. C’est un écosystème entier qui avance en parallèle, ce qui le rend structurellement plus difficile à rattraper.

Mistral AI : ce que réussir en Europe veut dire

Fondée en 2023 à Paris par d’anciens de Google DeepMind et Meta, Mistral AI a fait un pari que beaucoup trouvaient naïf au départ : rester open source, rester compact, et gagner sur l’efficience plutôt que sur la taille brute. En 2026, ce pari est largement validé.

Ce qui distingue Mistral, ce n’est pas uniquement les benchmarks. C’est la combinaison de performances sérieuses et d’une infrastructure souveraine. Leurs modèles sont hébergés en France, chez des partenaires comme Scaleway – ce qui change tout pour les entreprises soumises au RGPD ou à la réglementation européenne sur l’IA.

Mistral Small 3 (24B)

Le couteau suisse. Ultra-rapide, déployable sur des infrastructures modestes, bluffant pour sa taille. Idéal pour les applications temps réel ou les agents no-code.

Mistral Large 3

Le modèle enterprise de Mistral, 80+ langues, raisonnement long contexte. Pour les cas d’usage les plus exigeants.

Devstral / Mistral Small 4

6 milliards de paramètres actifs, spécialisé pour le coding agentique. Probablement le meilleur open source sur ce créneau aujourd’hui.

La Plateforme (API Mistral)

Hébergée en France. Pour les équipes qui veulent la puissance d’une API managée sans dépendre d’un acteur américain.

Mistral Vibe

L’entrée de Mistral dans le vibe coding. Génération d’applications directement depuis Le Chat, sans écrire une ligne de code. Une alternative souveraine à Cursor – hébergée en France, sans dépendance aux infrastructures américaines.

Concrètement, qu’est-ce que ça change pour vous ?

Soyons directs : si vous payez encore une API propriétaire à plein tarif pour un usage volumique, vous payez probablement trop. Les économies réalisables avec un modèle open source self-hosted vont de 70 à 95 % selon les volumes. Mais ce n’est pas seulement une question d’argent.

Ce qui change en profondeur, c’est le rapport de force avec vos fournisseurs. Un modèle self-hosted, c’est un fichier de poids mathématiques sur votre infrastructure. Il ne « téléphone » pas chez son éditeur. Il ne change pas de pricing. Il ne disparaît pas si l’éditeur pivote ou se fait racheter. Et vous pouvez le fine-tuner sur vos propres données métier – quelque chose que les APIs fermées n’autoriseront jamais vraiment.

Le seuil de rentabilité du fine-tuning est souvent cité autour de 500 exemples représentatifs de vos données d’entrée/sortie. En dessous, un modèle généraliste suffit. Au-delà, un modèle spécialisé sur vos données métier surpassera presque toujours un LLM généraliste – même très puissant.