MX4 Platform Core API

La passerelle sécurisée pour l'IA souveraine

Passerelle API compatible OpenAI pour modèles souverains. Routez, sécurisez et observez chaque requête depuis un seul endpoint.

Obtenir des clés API Lire la documentation

POST/v1/chat/completions

HTTP

Host: api.your-domainAuth: mx4_sk_•••Content-Type: application/json

{

"model": "auto-router",

"messages": [{"role": "user", "content": "..." }],

"routing": {"profile": "balanced"}

}

200 OKResponse

~220ms

{

"id": "req_7f1a",

"model": "routed-model",

"choices": [{"message": {"role": "assistant", "content": "..."}}]

}

API CENTRALE

Conçue pour la production souveraine

Routage et observabilité intégrés pour l'IA d'entreprise.

Interface unifiée

Un seul endpoint pour des modèles arabes natifs, multilingues et vos modèles fine-tunés.

Coûts prévisibles

Budgets par équipe, quotas de tokens et attribution vérifiable.

Journal d'activité

Journal d'activité local avec preuves de résidence des données.

Faible latence

Inférence on-premise près de vos données, pas à l'autre bout du monde.

DÉMARRER

Lancez en 3 étapes

Votre première requête en quelques minutes.

Étape 1Rapide

Créer une clé API

Clés par équipe, rotation planifiée et listes d'IP autorisées.

Étape 2Rapide

Pointer le baseURL

Utilisez les SDK OpenAI et changez seulement le `baseURL`.

Étape 3Rapide

Envoyer votre premier prompt

Choisissez un modèle ou laissez le routage gérer coût, latence et souveraineté.

INTÉGRATION

Compatibilité immédiate

Passez en quelques minutes. Pointez `baseURL` vers MX4 Platform et gardez vos outils OpenAI.

Client Integration (Node.js / Python)TypeScript

import OpenAI from 'openai';

// Example: point the OpenAI client to MX4 Platform
const client = new OpenAI({
  apiKey: 'mx4_sk_live_...',
  baseURL: 'https://api.your-domain/v1',
});

// Use standard Chat Completions
const completion = await client.chat.completions.create({
  model: 'auto-router',
  messages: [
    { role: 'user', content: 'لخص هذا التقرير المالي' }
  ],
  // Optional MX4 Platform routing hints
  extra_body: {
    routing_preference: 'cost', // cost | performance | balanced
  }
});

console.log(completion.choices[0].message);

Frameworks pris en charge

LangChain

LlamaIndex

Semantic Kernel

AutoGen

Vercel AI SDK

Flowise

Modèles pris en charge

Famille Falcon	Variable	Arabe natif
Famille JAIS	Variable	Arabe natif
Famille Llama	Variable	Anglais / Code
Famille Mistral	Variable	Français / Raisonnement

OUTILS DÉVELOPPEUR

SDK officiels

Démarrez rapidement avec les bibliothèques officiellement supportées.

🐍

SDK Python

pip install mx4-atlasDernière version

📦

SDK Node.js

npm install @mx4/atlasDernière version

🐹

SDK Go

go get github.com/mx4/atlas-goDernière version

☕

SDK Java

maven: com.mx4.atlasDernière version

ROUTAGE

Routage intelligent des modèles

Routage piloté par règles : coût, performance, langue et résidence des données.

Optimisation des coûts
Routez les requêtes simples vers des modèles plus petits et plus économiques.
Souveraineté des données
Assurez-vous que les données sensibles restent sur site en imposant des routes locales.
Spécialisation linguistique
Routez automatiquement les prompts en arabe vers des modèles spécialisés.

routing_config.yamlYAML

# Example routing policy (illustrative)
routes:
  # Route Arabic to specialized models
  - name: "arabic-native"
    condition: "language == 'ar'"
    model: "arabic-large"
    
  # Cost optimization for simple queries
  - name: "fast-path"
    condition: "prompt_tokens < 100"
    model: "general-small"

RÉFÉRENCE API

Points de terminaison principaux

Endpoints représentatifs compatibles OpenAI (peuvent varier selon le déploiement).

POST/v1/chat/completions

Génération de chat standard avec routage intelligent

POST/v1/embeddings

Embeddings vectoriels (multilingues + prêts pour l'arabe)

POST/v1/documents/upload

Ingestion de PDF/DOCX dans le magasin de vecteurs souverain

POST/v1/rag/query

Récupération de contexte avec citations et scores de confiance

GET/v1/models

Liste des modèles souverains disponibles

POST/v1/activity/logs

Récupération du journal d'activité infrastructure

En-têtes de sécurité et de souveraineté

En-tête	Description
X-Sovereign-ID	Identifiant unique de l'enclave souveraine traitant la requête.
X-Audit-Trace-ID	Identifiant de trace reliant la requête au journal d'activité infrastructure.
X-Route-Policy	Règle de routage appliquée (ex. local-only, latence optimisée).
X-Data-Residency	Localisation confirmée du traitement des données (ex. : "region-1").

Codes d'erreur standard

Code	Signification
400 Bad Request	Entrée invalide ou JSON mal formé.
401 Unauthorized	Clé API invalide ou manquante.
403 Forbidden	Permissions insuffisantes (RBAC) ou violation de règle de souveraineté des données.
429 Too Many Requests	Limite de débit dépassée (par clé ou par IP).
451 Unavailable For Legal Reasons	Bloqué par Sovereignty Guard (ex. : violation de résidence des données).

SÉCURITÉ

Authentification

Authentification par clé API

Chaque requête inclut une clé valide. Les clés sont associées à des équipes et suivies pour l'usage et les quotas.

Authentication ExampleBash

curl -X POST https://api.your-domain/v1/chat/completions \
  -H "Authorization: Bearer mx4_sk_live_abc123..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "model_chat",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

Gestion des clés

•Créez plusieurs clés par équipe pour la rotation
•Définissez des dates d'expiration et des listes d'IP autorisées
•Surveillez l'utilisation par clé en temps réel
•Révoquez instantanément les clés compromises

mTLS (Entreprise)

•TLS mutuel pour les environnements zero-trust
•Authentification par certificat
•Intégration avec la PKI interne
•Requis pour les déploiements air-gapped

Journalisation souveraine

OBSERVABILITÉ

Journal d'activité infrastructure

Les requêtes peuvent être journalisées localement avec une chaîne de hachage et une preuve de résidence.

Append-only

Les entrées sont stockées localement avec chaînage pour l'intégrité.

Rétention locale

Vous contrôlez la rétention, l'accès et l'export sur votre infrastructure.

{
  "timestamp": "2026-02-04T14:23:45Z",
  "request_id": "req-uuid-12345",
  "actor_id": "user-xyz",
  "action": "chat.completions",
  "model": "routed-model",
  "prompt_hash": "sha256:a3f7d2...",
  "routing_policy": "sovereign_enforcement",
  "residency_boundary": "region-1",
  "journal_hash": "sha256:8b12c4...",
  "status": "success"
}

LIMITES DE DÉBIT

Limites de débit et quotas

Limites indicatives ; configurées selon le déploiement.

Forfait	Requêtes/min	Tokens/jour	Burst
Développement	Faible	Faible	Petit
Professionnel	Moyen	Moyen	Modéré
Entreprise	Personnalisé	Personnalisé	Personnalisé

En-têtes de limite de débit

Chaque réponse inclut des en-têtes indiquant vos limites actuelles et votre quota restant :

X-RateLimit-Limit: <limit>

X-RateLimit-Remaining: <remaining>

X-RateLimit-Reset: <unix_ts>

WEBHOOKS

Webhooks (bêta)

Notifications en temps réel pour opérations asynchrones, règles de routage et seuils de coût.

Types d'événements

request.completed

Requête de longue durée terminée

routing.rule

Règle de routage déclenchée

cost.threshold

Seuil budgétaire approché

model.fallback

Modèle principal en échec, modèle de secours utilisé

Payload du webhook

Example PayloadJSON

{
  "event": "guardrail.violation",
  "timestamp": "2026-02-04T14:30:00Z",
  "request_id": "req_abc123",
  "details": {
    "violation_type": "pii_detected",
    "entities": ["email", "phone"],
    "action_taken": "request_blocked"
  },
  "metadata": {
    "team_id": "team_xyz",
    "user_id": "user_789"
  }
}

VERSIONNAGE

Versionnage et journal des modifications

Version actuelle : v1 (stable)

MX4 Platform suit le versionnage sémantique. Les versions exactes sont fixées par déploiement.

Endpoints stables pour un usage en production

Publications récentes

v1.3

T1 2026

•Webhooks en bêta
•Amélioration de l'export du journal d'activité
•Ajustements des politiques de routage

v1.2

T4 2025

•Support du streaming
•Contrôles de routage étendus
•Optimisations de performance

v1.1

T3 2025

•API de complétions de chat
•Pipeline d'ingestion de documents
•Authentification mTLS

FAQ

FAQ de l'API

Questions fréquentes sur l'intégration avec MX4 Platform.

Puis-je utiliser directement la bibliothèque Python d'OpenAI ?

Oui. Changez simplement le base_url vers votre instance MX4 Platform et utilisez votre clé API MX4 Platform. Notre API est compatible avec le format de complétions de chat d'OpenAI.

Comment gérer les réponses en streaming ?

Définissez stream: true dans votre requête. MX4 Platform renvoie des Server-Sent Events (SSE) compatibles avec le format de streaming d'OpenAI.

Que se passe-t-il si mon quota est dépassé ?

Vous recevrez une erreur 429 avec des en-têtes indiquant quand votre quota sera réinitialisé. Les forfaits Entreprise peuvent inclure des burst.

Puis-je tester l'API sans déploiement on-prem ?

Nous pouvons provisionner un environnement d'évaluation de courte durée via le Test Access Program. Contactez-nous pour y accéder.

Comment les embeddings sont-ils facturés différemment du chat ?

La tarification varie selon le modèle et le volume. Contactez-nous pour les dernières indications.

SUPPORT

Besoin d'aide pour démarrer ?

Support pratique pour l'intégration, la migration et l'optimisation.

📚