Mistral Medium 3.5 128B
mistral-medium-3.5-128b
Le plus sûr pour réponses métier longues : dense 128B, 128K contexte, outils, modèle le plus récent du catalogue.
- Params
- 128B
- Contexte
- 128K
- Prix
- 1.50€ in / 7.50€ out
Classement opérationnel du plus fiable au moins fiable pour usage assistant / rédaction / raisonnement / code. Source catalogue : console.proxima.green/models, récupérée avec Firecrawl + extraction des logos depuis les assets de la console.
Alibaba
Meta
BAAIScore = fiabilité présumée de livraison client : capacité, contexte, fraîcheur, support outils/reasoning, spécialisation, coût de l’erreur. Ce n’est pas un benchmark d’évaluation live : à confirmer par tests Proxima sur prompts métiers.
mistral-medium-3.5-128b
Le plus sûr pour réponses métier longues : dense 128B, 128K contexte, outils, modèle le plus récent du catalogue.
AlibabaQwen3.5-397B-A17B
Très fort potentiel raisonnement : MoE 397B / 17B actifs, 128K contexte, outils. Moins “prévisible” qu’un dense premium.
gpt-oss-120b
Gros modèle dense avec reasoning. Très bon socle entreprise, mais contexte limité à 32K vs 128K chez Mistral/Qwen.
MetaMeta-Llama-3_3-70B-Instruct
Famille éprouvée, dense 70B, 128K, outils. Moins frais côté connaissance, mais fiable et prévisible.
AlibabaQwen3-32B
Très bon compromis : reasoning + outils + 128K à coût bas. Moins puissant que les gros modèles pour arbitrages sensibles.
gemma-4-26b-a4b-it
Récent, 128K, MoE compact. Bon candidat volume, moins armé que Qwen/Mistral pour raisonnement lourd.
Mistral-Small-3.2-24B-Instruct-2506
Très utile si image+texte. Pour pur texte critique, Medium 3.5 reste devant.
AlibabaQwen3-Coder-30B-A3B-Instruct
Bon pour génération/analyse de code. Moins fiable comme assistant généraliste car spécialisé.
AlibabaQwen2.5-VL-72B-Instruct
Solide pour compréhension image/documents. Moins récent que les modèles texte 2026.
gpt-oss-20b
Reasoning à bas coût, mais taille plus faible et 32K de contexte. À réserver aux tâches simples.
Mistral-Nemo-Instruct-2407
Long contexte 128K et multilingue, mais génération 2024 / 12B : moins fiable sur tâches complexes.
AlibabaQwen3.5-9B
Récent et 128K, mais 9B : fiable pour extraction/réécriture, pas pour décision sensible.
Mistral-7B-Instruct-v0.3
Rapide et peu cher, mais ancien/compact/32K. À éviter pour production client exigeante.
On ne vend pas “le modèle le plus puissant”. On vend le bon routage : premium pour décisions, compact pour volume, spécialisé pour code/vision/audio.
Fiables uniquement dans leur couloir. Les mélanger au classement assistant créerait une fausse lecture.
| Modèle | Usage | Verdict | Params | Contexte | Prix |
|---|---|---|---|---|---|
Qwen3 Embedding 8B | Embedding | Très bon choix embeddings multilingues haut niveau | 8B | 32K | 0.10€ input |
BGE Multilingual Gemma2 | Embedding | Embedding multilingue robuste basé Gemma2 | 9B | 8K | 0.01€ input |
BGE M3 | Embedding | Embedding léger polyvalent, coût bas | 568M | 8K | 0.01€ input |
| STT | Plus précis pour transcription, plus cher | 1.5B | — | 0.00004083€/sec | |
| STT | Plus rapide/moins cher, précision légèrement sacrifiée | 809M | — | 0.00001278€/sec | |
Qwen3 Guard Gen 8B | Guard | Modération principale | 8B | 32K | Free |
Qwen3 Guard Gen 0.6B | Guard | Modération ultra légère | 0.6B | 32K | Free |
STStable Diffusion XL Base v1.0 | Image | Image generation : non comparable à LLM texte | 3.5B | — | Free |
| TTS | TTS gratuit : choix par langue, pas benchmark LLM | — | — | Free | |
| Code | À surveiller : coming soon, donc non fiable aujourd’hui | 123B | 128K | — |