Quelle différence avec des appels directs aux providers ?

Les appels directs lient chaque application au SDK d'un provider, dispersent des clés API brutes dans les environnements et laissent les contrôles de coût et de sécurité à chaque équipe. Une gateway centralise les clés, rend les providers interchangeables derrière une API compatible OpenAI et applique les politiques de dépense et de sécurité en un seul endroit, avant l'exécution de l'appel.

Qu'est-ce qui fait d'une gateway LLM une plateforme de gouvernance ?

Le routing seul est un proxy. La gouvernance ajoute le qui-peut-faire-quoi : droits d'accès par équipe ou par clé, réservation de budget avant exécution, guardrails sur les prompts et les sorties, et enregistrements prêts pour l'audit de chaque décision de model. C'est cette combinaison que des cadres comme le règlement européen sur l'IA exigent en pratique.

Une gateway LLM ajoute-t-elle de la latence ?

Une gateway bien conçue ajoute quelques millisecondes, dominées par des contrôles de politique exécutés en mémoire. Ce surcoût est généralement invisible face au temps d'inférence du model, et il apporte le failover : quand un provider se dégrade, la gateway reroute au lieu de faire échouer votre fonctionnalité.

Peut-on auto-héberger une gateway LLM ?

Oui. Odock est open source et auto-hébergeable : la gateway, ses politiques et ses enregistrements d'usage tournent dans votre infrastructure. C'est important pour la résidence des données, la garde des clés et les revues de conformité où un plan de contrôle externe n'est pas acceptable.

odock.ai

Documentation Réserver une démo

Requête de model gouvernée

Gateway LLM

Gouvernez chaque appel de model de vos équipes

Q: Qu'est-ce qu'une gateway LLM ?

Une gateway LLM est un endpoint contrôlé unique entre vos applications et les providers de models. Elle authentifie les appelants avec ses propres clés, applique des politiques d'accès et des guardrails, fait respecter les budgets, route les requêtes vers des providers approuvés et enregistre l'usage — l'accès aux providers cesse d'être dispersé entre les équipes et les bases de code.

Les providers se multiplient, les clés fuient et les surprises de facturation arrivent en fin de mois. Odock place une gateway LLM gouvernée entre vos applications et chaque provider de models, en appliquant accès, guardrails, budgets et enregistrements d'audit avant qu'une complétion ne soit générée.

Réserver une démo Lire le guide de la gateway LLM

Un chemin gouverné unique pour chaque appel de model.

llm-gateway.request

Gateway LLM

>POST /v1/chat/completionsruntime applicatif

01Auth de l'appelantvérifiée

02Droits models...

03Scan guardrails...

04Réservation budget...

05Routing provider...

06Usage enregistré...

Providers

OpenAI, Anthropic, Azure, auto-hébergés

Contrôles

Clés, budgets, guardrails, audit

Qu'est-ce qu'une gateway LLM ?

Un endpoint contrôlé unique entre vos applications et chaque provider de models

Une gateway LLM est un plan de contrôle placé entre vos applications et les providers de models comme OpenAI, Anthropic, Azure ou des models auto-hébergés. Plutôt que de laisser chaque équipe détenir les keys brutes des providers et appeler les API directement, le trafic des models passe par un seul endpoint qui authentifie l'appelant, applique les guardrails, réserve le budget, route vers un provider approuvé et enregistre le résultat. Elle devient une plateforme de gouvernance lorsqu'elle va au-delà du routing : droits d'accès par équipe, budgets réservés avant le déclenchement de l'appel, détection des prompt injection et des fuites de données, et enregistrements d'usage prêts pour l'audit. C'est précisément ce pour quoi Odock est conçu, et le même plan gouverne aussi le trafic outils des agents via la gateway MCP.

Où les équipes l'utilisent

Accès multi-provider

Donnez à chaque équipe un endpoint compatible OpenAI et des virtual API keys. Ajoutez, remplacez ou auto-hébergez des providers derrière la gateway sans toucher au code applicatif.

Un contrôle des coûts qui bloque, pas qui constate

Définissez budgets et quotas par clé, équipe ou projet. Odock réserve la dépense avant l'exécution de l'appel : un agent hors de contrôle s'arrête à la limite, pas à la facture.

Sécurité et conformité à la gateway

Scannez les prompts contre l'injection et la fuite de données, masquez les champs sensibles, appliquez les politiques de données par provider et produisez des enregistrements d'audit pour chaque décision de model.

Pour aller plus loin

Gateway MCP Comparer les AI gateways Guide de la gateway LLM

Cycle de vie d'une requête LLM

Chaque appel de model suit un chemin gouverné

Aucune requête n'atteint un provider avant d'avoir passé les contrôles d'authentification, d'accès, d'inspection et de coût. Chaque résultat est enregistré avec tokens, latence et coût.

Authentifier

Valider la virtual API key.

Autoriser

Confirmer les droits models et providers.

Inspecter & appliquer

Exécuter les guardrails sur le prompt et le contexte.

Réserver la dépense

Vérifier budgets et quotas avant exécution.

Router

Envoyer vers un provider approuvé avec failover.

Enregistrer le résultat

Journaliser tokens, latence, statut et coût.

Exemple de requête bloquéeRefusée par la gouvernance

{
  "apiKey": "vk_team_marketing",
  "model": "gpt-5.2",
  "method": "chat.completions",
  "reason": "budget_exceeded",
  "status": 402
}

Pourquoi c'est important

Les appels de models sont des événements de dépense, de données et de conformité

Chaque complétion déplace de l'argent, peut transporter des données sensibles et devra peut-être être expliquée à un auditeur. Une gateway LLM donne aux équipes plateforme, sécurité et finance un point d'application unique pour les trois.

Contrôlez les models utilisés par les équipes

Autorisez les providers et models approuvés par équipe ou par clé, bloquez les models obsolètes ou non conformes, et déployez de nouveaux models sans toucher au code applicatif.

Appliquez la politique avant l'exécution

Authentifiez chaque appelant, scannez les prompts contre l'injection et la fuite de données, et rejetez les requêtes qui échouent aux règles de sécurité, de budget ou de conformité avant tout appel provider.

Attribuez chaque token

Reliez chaque requête à une clé, une équipe et un utilisateur avec tokens, latence et coût. Donnez à la finance des données de refacturation et aux auditeurs les enregistrements qu'ils demandent.

Ce que vous configurez

Une surface de contrôle LLM complète, pas seulement un proxy

Odock couvre tout ce dont les équipes plateforme ont besoin pour faire tourner le trafic LLM en production : enregistrement des providers, droits d'accès aux models, guardrails, tarification, budgets et enregistrements d'usage que vos équipes finance et sécurité peuvent réellement lire.

Vues LLM

Vue sélectionnée

Enregistrez les providers une seule fois et exposez les models approuvés via un endpoint compatible OpenAI. Vérifiez le type d'API, la config d'auth, le périmètre et le statut avant qu'une équipe puisse les appeler.

providers-&-models.llm

Live

openai-prod

Catalogue providers

APIOPENAI_API

AuthBEARER

Périmètreorg entière

Accès24 clés accordées

anthropic-prod

Catalogue providers

APIANTHROPIC_API

AuthBEARER

Périmètreorg entière

Accès18 clés accordées

azure-openai-eu

Configuration manuelle

APIOPENAI_API

AuthBEARER

Périmètreteam:eu-products

Accès6 clés accordées

bedrock-us

Catalogue providers

APIBEDROCK_API

AuthOAUTH2

Périmètreteam:platform

Accès4 clés accordées

mistral-eu

Catalogue providers

APIOPENAI_API

AuthBEARER

Périmètreteam:eu-products

Accès5 clés accordées

vllm-selfhosted

Configuration manuelle

APIOPENAI_API

AuthNONE

Périmètreteam:research

Accès3 clés accordées

Un endpoint, deux voies d'accès

Vos applications appellent Odock. Pas le provider

Accédez à Odock via un endpoint unifié OpenAI-style commun à tous les providers, ou via l'endpoint natif et le SDK de chaque provider lorsque vous avez besoin de fonctionnalités propres à un provider. Dans les deux cas, Odock authentifie l'appelant, confirme l'accès au model, exécute les guardrails, réserve le budget, injecte les credentials du provider et enregistre le résultat avant que le provider ne voie la requête.

Ce que la gateway prend en charge

API unifiée OpenAI-style commune à tous les providers, pour que vos SDK existants fonctionnent sans modification.
Endpoints et SDK natifs des providers lorsque vous avez besoin de fonctionnalités propres à un provider.
Virtual API key requise avant qu'un model soit accessible.
Credentials du provider injectés une fois les contrôles de gouvernance validés.
Routing et failover entre providers approuvés.

llm-unified-openai.py

UnifiedOpenAI SDK

Mode

Langage

1# Utilisez l'endpoint unifié d'Odock via un SDK OpenAI-compatible
2import os
3from openai import OpenAI
4 
5client = OpenAI(
6    api_key=os.environ["ODOCK_API_KEY"],
7    base_url=os.environ.get("ODOCK_BASE_URL", "https://api.odock.ai/v1"),
8)
9 
10response = client.chat.completions.create(
11    model=os.environ.get("ODOCK_MODEL", "claude-sonnet-4-5"),
12    messages=[
13        {"role": "user", "content": "Explique le contrôle budgétaire."}
14    ],
15    temperature=0.2,
16    max_tokens=200,
17)
18 
19print(response.choices[0].message.content)

Règlement IA européen & conformité

Une preuve pour chaque décision de model

Les programmes de conformité ont besoin de réponses précises : quelle équipe a utilisé quel model, sous quelle politique, avec quelles protections ? L'accès provider direct ne peut pas répondre à ces questions. Odock le peut.

Faites passer chaque provider par un endpoint unique compatible OpenAI, gouverné et auditable
Appliquez les contrôles de prompt injection et de fuite de données hors du code applicatif
Produisez des preuves pour les revues IA internes, les évaluations fournisseurs et les programmes de conformité au règlement européen sur l'IA
Gardez le trafic LLM et le trafic d'outils MCP dans la même frontière opérationnelle et de politique

FAQ

Les questions que les équipes posent sur les gateways LLM

Voici les questions récurrentes lorsque les équipes passent d'un accès provider direct à une couche gateway gouvernée.

Un endpoint pour chaque model, avec la gouvernance intégrée

Si vos équipes appellent des LLM en production, il vous faut le même contrôle que pour toute dépendance critique. Odock gouverne le trafic de models et d'outils depuis un chemin de requête unique.

Réserver une démo Lire le guide de la gateway LLM

llm-unified-openai.py

# Utilisez l'endpoint unifié d'Odock via un SDK OpenAI-compatibleimport osfrom openai import OpenAI client = OpenAI(    api_key=os.environ["ODOCK_API_KEY"],    base_url=os.environ.get("ODOCK_BASE_URL", "https://api.odock.ai/v1"),) response = client.chat.completions.create(    model=os.environ.get("ODOCK_MODEL", "claude-sonnet-4-5"),    messages=[        {"role": "user", "content": "Explique le contrôle budgétaire."}    ],    temperature=0.2,    max_tokens=200,) print(response.choices[0].message.content)