Depuis la sortie de Llama par Meta et la montée en puissance de Mistral, on entend souvent « on va utiliser un modèle open source pour être souverains ». C'est une équation incomplète. Et dans certains cas, c'est exactement l'inverse de ce qui est vrai.
Le mythe de l'open source souverain
Un modèle open source, c'est un modèle dont les poids sont publiés — c'est-à-dire que vous pouvez, en théorie, le télécharger et le faire tourner vous-même. C'est une avancée réelle : cela signifie que vous n'êtes pas dépendant d'un fournisseur unique pour accéder au modèle.
Mais si vous utilisez ce modèle open source via l'API d'OpenAI, d'Anthropic, de Mistral ou de n'importe quel autre fournisseur cloud — vous envoyez vos données à leur infrastructure. Le modèle est open source. L'infrastructure, elle, est celle du fournisseur. Et c'est l'infrastructure qui détermine qui a accès à vos données, pas la licence du modèle.
Utiliser Llama 3 via une API chez un hébergeur américain n'est pas plus souverain qu'utiliser GPT-4. La licence du modèle ne change rien à l'exposition au Cloud Act.
Le modèle propriétaire peut être parfaitement souverain
L'inverse est aussi vrai, et moins connu. Un modèle propriétaire — dont vous avez acheté la licence d'utilisation ou le droit de déploiement — déployé sur votre propre infrastructure ou sur un cloud souverain européen peut offrir des garanties de souveraineté complètes.
Vous ne contrôlez pas les poids du modèle. Mais vous contrôlez où il tourne, qui peut y accéder, et ce que vous envoyez dedans. Les données ne quittent pas votre périmètre. C'est ça, la souveraineté opérationnelle.
La distinction n'est pas open source vs propriétaire. C'est déployé chez vous vs déployé chez le fournisseur.
Les vrais critères de décision
Pour une entreprise qui choisit un LLM, les vraies questions sont dans cet ordre :
Où tourne le modèle ? Sur votre infrastructure, sur un cloud souverain, ou chez un fournisseur soumis à une juridiction tierce ? C'est le premier critère de souveraineté.
Qui contrôle les données d'entrée ? Vos prompts et documents restent-ils dans votre périmètre, ou partent-ils chez un tiers ? Un log de vos requêtes est-il accessible au fournisseur ?
Quelle est la dépendance fournisseur ? Si le fournisseur change sa politique tarifaire ou ses conditions d'utilisation demain, combien ça coûte de migrer ? Un modèle open source déployé on-premise minimise ce risque. Un modèle propriétaire via API l'maximise.
Quelle est la performance sur votre cas d'usage ? Enfin. C'est le quatrième critère, pas le premier. Un modèle open source légèrement moins performant qu'un modèle propriétaire mais déployé dans votre périmètre vaut souvent mieux qu'un modèle propriétaire plus performant mais opaque sur la gestion de vos données.
La position d'Intelligence Privée
Nous utilisons des modèles open source — Llama, Mistral et d'autres — parce qu'ils ont atteint un niveau de performance qui répond aux besoins de la grande majorité des cas d'usage enterprise. Et parce que leur nature open source permet une auditabilité que les modèles fermés ne permettent pas.
Mais ce n'est pas le modèle qui définit notre proposition de valeur. C'est le déploiement souverain — sur infrastructure européenne, dans le périmètre du client, sans transit de données vers des tiers. La souveraineté n'est pas dans la licence. Elle est dans l'architecture.
Ce que ça implique pour votre stratégie IA
Si vous êtes en train de choisir un LLM pour votre entreprise, commencez par poser la question de l'hébergement avant de poser la question du modèle. L'ordre habituel est inverse — on choisit le modèle le plus performant sur le benchmark, puis on essaie de régler les questions de souveraineté. Ce n'est pas la bonne séquence.
La bonne séquence : identifier les données qui passeront dans le système, évaluer leur sensibilité, définir les contraintes d'hébergement qui en découlent, puis chercher le meilleur modèle disponible dans ces contraintes. Dans la majorité des cas, un modèle open source récent déployé en souverain est suffisamment performant pour les cas d'usage enterprise courants — analyse de documents, génération de contenu, assistance à la recherche.
La performance brute des modèles propriétaires les plus avancés n'est pertinente que pour des cas d'usage très spécifiques — recherche scientifique, raisonnement complexe, génération de code avancée. Pour la rédaction d'emails, la synthèse de réunions, l'analyse de contrats standards : les modèles open source actuels font largement le travail.
Le bon cadrage de la décision : « quel est le meilleur modèle que je peux déployer dans mes contraintes de souveraineté ? » — pas « quel est le meilleur modèle, et comment j'arrange la souveraineté autour ? »
À retenir
- Un modèle open source utilisé via une API externe n'est pas souverain — la licence ne change rien à l'infrastructure
- Un modèle propriétaire déployé on-premise peut être parfaitement souverain — l'architecture prime sur la licence
- Les vrais critères : où tourne le modèle, qui contrôle les données, quelle est la dépendance fournisseur