DeepSeek V4 : 1 million de tokens, open source, et des benchmarks qui défient GPT-5

Le 24 avril 2026, DeepSeek rend public DeepSeek-V4 en version preview, sous licence open source. Deux variantes, une fenêtre de contexte portée à 1 million de tokens (soit l'équivalent d'environ 750 000 mots, ou plusieurs milliers de pages de documents traités en une seule requête) et une compatibilité native avec les API OpenAI et Anthropic. Les benchmarks publiés par l'équipe positionnent le modèle au niveau de Claude Opus 4.5 et au-dessus de GPT-5.2, relançant la pression sur les acteurs fermés.

Résumé exécutif

DeepSeek a lancé DeepSeek-V4 en preview le 24 avril 2026, simultanément disponible sur chat.deepseek.com, sur mobile et via API. Le modèle est open source. Il se décline en deux variantes : V4-Pro, avec 1,6 trillion de paramètres totaux dont 49 milliards actifs, et V4-Flash, avec 284 milliards de paramètres totaux dont 13 milliards actifs. La fenêtre de contexte passe à 1 million de tokens contre 128 000 pour V3, soit une multiplication par près de huit. Selon les benchmarks publiés par DeepSeek, V4 Pro surpasse Claude Sonnet 4.5 et approche Claude Opus 4.5, tandis que V4 Pro Max dépasse GPT-5.2 et Gemini 3.0-Pro. Les anciens modèles deepseek-chat et deepseek-reasoner seront désactivés le 24 juillet 2026.

Les faits

DeepSeek-V4 Preview est officiellement disponible depuis le 24 avril 2026, en accès libre sur chat.deepseek.com et via API.
Le modèle est open source.
DeepSeek-V4-Pro : 1,6 trillion de paramètres totaux, 49 milliards actifs. Forces revendiquées : capacités agentiques, connaissance générale, raisonnement STEM, mathématiques et code.
DeepSeek-V4-Flash : 284 milliards de paramètres totaux, 13 milliards actifs. Performances agentiques proches du Pro sur les tâches simples, temps de réponse réduit, tarification API inférieure.
Fenêtre de contexte : 1 million de tokens, contre 128 000 pour V3. Un token correspond grosso modo à un mot ou à un fragment de mot. 1 million de tokens représente environ 750 000 mots, soit plusieurs milliers de pages de texte que le modèle peut lire et analyser en une seule fois, sans découpage ni résumé intermédiaire.
Nouvelle architecture d'attention : "DeepSeek Sparse Attention", avec compression, visant une réduction des coûts computationnels et de la mémoire.
Compatibilité native avec les API OpenAI ChatCompletions et Anthropic. La migration ne nécessite qu'une mise à jour du paramètre modèle.
Support des modes Thinking et Non-Thinking.
Selon les évaluations publiées par DeepSeek : V4 Pro surpasse Claude Sonnet 4.5 et approche le niveau de Claude Opus 4.5. V4 Pro Max dépasse GPT-5.2 et Gemini 3.0-Pro, se situant légèrement en dessous de GPT-5.4 et Gemini 3.1-Pro.
Les modèles deepseek-chat et deepseek-reasoner seront inaccessibles après le 24 juillet 2026 à 15h59 UTC.

Analyse stratégique

Le lancement de DeepSeek V4 s'inscrit dans la continuité d'une stratégie qui a émergé avec R1 en janvier 2025 : proposer des modèles de niveau frontière sous licence ouverte, à un coût d'inférence sensiblement inférieur aux offres fermées. La fenêtre de contexte d'un million de tokens est le signal le plus structurant de cette version. Concrètement : un contrat de fusion-acquisition de 500 pages, l'intégralité du code source d'une application, ou plusieurs années d'historique client peuvent désormais être soumis au modèle en une seule fois, sans découpage ni perte d'information. Elle place DeepSeek dans la même gamme que les modèles Gemini de Google sur ce critère, et élimine le principal obstacle technique aux déploiements sur des corpus documentaires denses.

La dualité Pro/Flash répond à une logique de segmentation qui s'est imposée comme standard dans l'industrie : un modèle maximal pour les tâches complexes, un modèle allégé pour le volume et la latence. La compatibilité native avec les API OpenAI et Anthropic est un geste explicitement destiné aux développeurs déjà intégrés à ces écosystèmes. Le coût de migration est délibérément ramené à une ligne de configuration.

Les benchmarks publiés méritent une lecture prudente : ils proviennent de DeepSeek eux-mêmes. Les évaluations indépendantes des semaines suivantes seront déterminantes pour valider ou nuancer les positions revendiquées. Cela dit, le passé récent de DeepSeek (V3, R1) a montré que ses auto-évaluations résistaient généralement à la vérification externe.

Sur le plan géopolitique, chaque nouvelle version de DeepSeek rouvre le débat sur l'efficacité des contrôles à l'exportation de semiconducteurs. Un modèle à 1,6 trillion de paramètres entraîné avec une architecture sparse et des innovations d'attention réduisant les besoins computationnels représente une avancée d'efficacité, pas seulement de puissance brute.

Impact business / sectoriel

Pour les équipes produit et développeurs : la compatibilité API avec OpenAI et Anthropic transforme DeepSeek V4 en option drop-in pour les applications existantes. La pression tarifaire sur les modèles fermés va s'accentuer, en particulier sur le segment intermédiaire.
Pour les acteurs fermés (OpenAI, Anthropic, Google) : DeepSeek V4 réduit l'avantage différentiel des modèles propriétaires sur les benchmarks publiés. La valeur perçue des offres fermées repose de plus en plus sur l'écosystème (outils, support, fiabilité SLA), pas sur la seule performance brute.
Pour les cas d'usage entreprise : une fenêtre de 1 million de tokens (environ 750 000 mots) change concrètement ce qui est faisable sans RAG ou découpage documentaire. Analyser un dossier juridique complet, auditer un codebase entier ou comparer des centaines de rapports financiers en une seule requête devient possible sans architecture technique complexe. Les secteurs juridique, financier, scientifique et logiciel sont les premiers bénéficiaires.
Pour l'écosystème open source : DeepSeek V4 fournit une base de référence supplémentaire pour les acteurs qui construisent sur des modèles ouverts. La disponibilité de deux variantes à des niveaux de performance différents augmente la flexibilité des déploiements on-premise et cloud souverain.

Ce qu'il faut retenir

DeepSeek V4 confirme que la frontière de performance n'est plus l'apanage des laboratoires fermés. Le saut de contexte de 128 000 à 1 million de tokens est une rupture fonctionnelle autant qu'une démonstration technique. Il élargit le périmètre des applications qui deviennent praticables sans ingénierie documentaire complexe.

La vraie question posée par chaque sortie DeepSeek reste la même : dans un monde où des modèles de niveau frontière sont gratuits, open source et compatibles avec les API des concurrents, quelle est la valeur durable des offres propriétaires ? La réponse se joue moins sur les benchmarks que sur la confiance, l'intégration et la gouvernance des données, trois dimensions que le marché n'a pas encore pleinement arbitrées.

DeepSeek V4 : 1 million de tokens, open source, et des benchmarks qui défient GPT-5

Résumé exécutif

Les faits

Analyse stratégique

Impact business / sectoriel

Ce qu'il faut retenir

Nvidia Nemotron 3 Nano Omni: modele multimodal

IA et satellites: localiser le Charles de Gaulle

GPT-5.5: OpenAI double ses prix