Nous faisons désormais partie du programme NVIDIA Inception.Lire l'annonce
MX4 Platform Core API

La passerelle sécurisée pour l'IA souveraine

Passerelle API compatible OpenAI pour modèles souverains. Routez, sécurisez et observez chaque requête depuis un seul endpoint.

POST/v1/chat/completions
HTTP
Host: api.your-domainAuth: mx4_sk_•••Content-Type: application/json
{
"model": "auto-router",
"messages": [{"role": "user", "content": "..." }],
"routing": {"profile": "balanced"}
}
200 OKResponse
~220ms
{
"id": "req_7f1a",
"model": "routed-model",
"choices": [{"message": {"role": "assistant", "content": "..."}}]
}

API CENTRALE

Conçue pour la production souveraine

Routage et observabilité intégrés pour l'IA d'entreprise.

Interface unifiée

Un seul endpoint pour des modèles arabes natifs, multilingues et vos modèles fine-tunés.

Coûts prévisibles

Budgets par équipe, quotas de tokens et attribution vérifiable.

Journal d'activité

Journal d'activité local avec preuves de résidence des données.

Faible latence

Inférence on-premise près de vos données, pas à l'autre bout du monde.

DÉMARRER

Lancez en 3 étapes

Votre première requête en quelques minutes.

Étape 1Rapide

Créer une clé API

Clés par équipe, rotation planifiée et listes d'IP autorisées.

Étape 2Rapide

Pointer le baseURL

Utilisez les SDK OpenAI et changez seulement le `baseURL`.

Étape 3Rapide

Envoyer votre premier prompt

Choisissez un modèle ou laissez le routage gérer coût, latence et souveraineté.

INTÉGRATION

Compatibilité immédiate

Passez en quelques minutes. Pointez `baseURL` vers MX4 Platform et gardez vos outils OpenAI.

Client Integration (Node.js / Python)TypeScript
import OpenAI from 'openai';

// Example: point the OpenAI client to MX4 Platform
const client = new OpenAI({
  apiKey: 'mx4_sk_live_...',
  baseURL: 'https://api.your-domain/v1',
});

// Use standard Chat Completions
const completion = await client.chat.completions.create({
  model: 'auto-router',
  messages: [
    { role: 'user', content: 'لخص هذا التقرير المالي' }
  ],
  // Optional MX4 Platform routing hints
  extra_body: {
    routing_preference: 'cost', // cost | performance | balanced
  }
});

console.log(completion.choices[0].message);

Frameworks pris en charge

LangChain
LlamaIndex
Semantic Kernel
AutoGen
Vercel AI SDK
Flowise

Modèles pris en charge

Famille FalconVariableArabe natif
Famille JAISVariableArabe natif
Famille LlamaVariableAnglais / Code
Famille QwenVariableMultilingue

OUTILS DÉVELOPPEUR

SDK officiels

Démarrez rapidement avec les bibliothèques officiellement supportées.

🐍

SDK Python

pip install mx4-atlasDernière version
📦

SDK Node.js

npm install @mx4/atlasDernière version
🐹

SDK Go

go get github.com/mx4/atlas-goDernière version

SDK Java

maven: com.mx4.atlasDernière version

ROUTAGE

Routage intelligent des modèles

Routage piloté par règles : coût, performance, langue et résidence des données.

  • Optimisation des coûts

    Routez les requêtes simples vers des modèles plus petits et plus économiques.

  • Souveraineté des données

    Assurez-vous que les données sensibles restent sur site en imposant des routes locales.

  • Spécialisation linguistique

    Routez automatiquement les prompts en arabe vers des modèles spécialisés.

routing_config.yamlYAML
# Example routing policy (illustrative)
routes:
  # Route Arabic to specialized models
  - name: "arabic-native"
    condition: "language == 'ar'"
    model: "arabic-large"
    
  # Cost optimization for simple queries
  - name: "fast-path"
    condition: "prompt_tokens < 100"
    model: "general-small"

RÉFÉRENCE API

Points de terminaison principaux

Endpoints représentatifs compatibles OpenAI (peuvent varier selon le déploiement).

POST/v1/chat/completions
Génération de chat standard avec routage intelligent
POST/v1/embeddings
Embeddings vectoriels (multilingues + prêts pour l'arabe)
POST/v1/documents/upload
Ingestion de PDF/DOCX dans le magasin de vecteurs souverain
POST/v1/rag/query
Récupération de contexte avec citations et scores de confiance
GET/v1/models
Liste des modèles souverains disponibles
POST/v1/activity/logs
Récupération du journal d'activité infrastructure

En-têtes de sécurité et de souveraineté

En-têteDescription
X-Sovereign-IDIdentifiant unique de l'enclave souveraine traitant la requête.
X-Audit-Trace-IDIdentifiant de trace reliant la requête au journal d'activité infrastructure.
X-Route-PolicyRègle de routage appliquée (ex. local-only, latence optimisée).
X-Data-ResidencyLocalisation confirmée du traitement des données (ex. : "region-1").

Codes d'erreur standard

CodeSignification
400 Bad RequestEntrée invalide ou JSON mal formé.
401 UnauthorizedClé API invalide ou manquante.
403 ForbiddenPermissions insuffisantes (RBAC) ou violation de règle de souveraineté des données.
429 Too Many RequestsLimite de débit dépassée (par clé ou par IP).
451 Unavailable For Legal ReasonsBloqué par Sovereignty Guard (ex. : violation de résidence des données).

SÉCURITÉ

Authentification

Authentification par clé API

Chaque requête inclut une clé valide. Les clés sont associées à des équipes et suivies pour l'usage et les quotas.

Authentication ExampleBash
curl -X POST https://api.your-domain/v1/chat/completions \
  -H "Authorization: Bearer mx4_sk_live_abc123..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "model_chat",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

Gestion des clés

  • Créez plusieurs clés par équipe pour la rotation
  • Définissez des dates d'expiration et des listes d'IP autorisées
  • Surveillez l'utilisation par clé en temps réel
  • Révoquez instantanément les clés compromises

mTLS (Entreprise)

  • TLS mutuel pour les environnements zero-trust
  • Authentification par certificat
  • Intégration avec la PKI interne
  • Requis pour les déploiements air-gapped
Journalisation souveraine

OBSERVABILITÉ

Journal d'activité infrastructure

Les requêtes peuvent être journalisées localement avec une chaîne de hachage et une preuve de résidence.

Append-only

Les entrées sont stockées localement avec chaînage pour l'intégrité.

Rétention locale

Vous contrôlez la rétention, l'accès et l'export sur votre infrastructure.

{
  "timestamp": "2026-02-04T14:23:45Z",
  "request_id": "req-uuid-12345",
  "actor_id": "user-xyz",
  "action": "chat.completions",
  "model": "routed-model",
  "prompt_hash": "sha256:a3f7d2...",
  "routing_policy": "sovereign_enforcement",
  "residency_boundary": "region-1",
  "journal_hash": "sha256:8b12c4...",
  "status": "success"
}

LIMITES DE DÉBIT

Limites de débit et quotas

Limites indicatives ; configurées selon le déploiement.

ForfaitRequêtes/minTokens/jourBurst
DéveloppementFaibleFaiblePetit
ProfessionnelMoyenMoyenModéré
EntreprisePersonnaliséPersonnaliséPersonnalisé

En-têtes de limite de débit

Chaque réponse inclut des en-têtes indiquant vos limites actuelles et votre quota restant :

X-RateLimit-Limit: <limit>
X-RateLimit-Remaining: <remaining>
X-RateLimit-Reset: <unix_ts>

WEBHOOKS

Webhooks (bêta)

Notifications en temps réel pour opérations asynchrones, règles de routage et seuils de coût.

Types d'événements

request.completed
Requête de longue durée terminée
routing.rule
Règle de routage déclenchée
cost.threshold
Seuil budgétaire approché
model.fallback
Modèle principal en échec, modèle de secours utilisé

Payload du webhook

Example PayloadJSON
{
  "event": "guardrail.violation",
  "timestamp": "2026-02-04T14:30:00Z",
  "request_id": "req_abc123",
  "details": {
    "violation_type": "pii_detected",
    "entities": ["email", "phone"],
    "action_taken": "request_blocked"
  },
  "metadata": {
    "team_id": "team_xyz",
    "user_id": "user_789"
  }
}

VERSIONNAGE

Versionnage et journal des modifications

Version actuelle : v1 (stable)

MX4 Platform suit le versionnage sémantique. Les versions exactes sont fixées par déploiement.

Endpoints stables pour un usage en production

Highlights récents (exemple)

v1.x

Récent

  • Webhooks en bêta
  • Amélioration de l'export du journal d'activité
  • Ajustements des politiques de routage

v1.x

Récent

  • Support du streaming
  • Contrôles de routage étendus
  • Optimisations de performance

v1.x

Récent

  • API de complétions de chat
  • Pipeline d'ingestion de documents
  • Authentification mTLS

FAQ

FAQ de l'API

Questions fréquentes sur l'intégration avec MX4 Platform.

Puis-je utiliser directement la bibliothèque Python d'OpenAI ?

Oui. Changez simplement le base_url vers votre instance MX4 Platform et utilisez votre clé API MX4 Platform. Notre API est compatible avec le format de complétions de chat d'OpenAI.

Comment gérer les réponses en streaming ?

Définissez stream: true dans votre requête. MX4 Platform renvoie des Server-Sent Events (SSE) compatibles avec le format de streaming d'OpenAI.

Que se passe-t-il si mon quota est dépassé ?

Vous recevrez une erreur 429 avec des en-têtes indiquant quand votre quota sera réinitialisé. Les forfaits Entreprise peuvent inclure des burst.

Puis-je tester l'API sans déploiement on-prem ?

Nous pouvons provisionner un environnement d'évaluation de courte durée via le Test Access Program. Contactez-nous pour y accéder.

Comment les embeddings sont-ils facturés différemment du chat ?

La tarification varie selon le modèle et le volume. Contactez-nous pour les dernières indications.