APIMaster.ai
Back to Blog
APIMaster Blog

Aperçu de GPT-5.6 Sol, Terra & Luna — Tarifs, Niveaux et Ce Que les Développeurs Doivent Savoir

OpenAI a présenté GPT-5.6 le 26 juin 2026 avec trois niveaux — Sol (phare), Terra (équilibré) et Luna (rapide). Tarifs officiels de l'API, règles de cache, benchmarks, déploiement de la sécurité et comment préparer votre stack.

GPT-5.6API OpenAISolTerraLunaTarification IA

Published 2026-06-27

Quick Answer

Le 26 juin 2026, OpenAI (~500M visites mensuelles, estimation SimilarWeb) a lancé un aperçu limité de la famille GPT-5.6 : Sol (modèle agentique phare), Terra (travail quotidien équilibré) et Luna (rapide, coût le plus bas). Les tarifs officiels de l'API sont de 5 $ / 30 $, 2,50 $ / 15 $ et 1 $ / 6 $ par million de tokens d'entrée/sortie respectivement, avec 90 % de réduction sur l'entrée en cache et de nouvelles règles de cache de prompt de 30 minutes. Sol ajoute un effort de raisonnement max et un mode ultra multi-sous-agent. L'accès est initialement limité aux partenaires API/Codex de confiance avant une disponibilité plus large dans ChatGPT et l'API dans les semaines à venir.

Si vous avez besoin d'un accès compatible OpenAI aujourd'hui pendant que les créneaux d'aperçu sont limités, comparez les routes en direct sur le marché APIMaster et vérifiez ce que vous recevez réellement avec le testeur de modèle gratuit.

Ce Qu'OpenAI a Annoncé

OpenAI introduit un nouveau schéma de nommage avec GPT-5.6 :

  • Le numéro (5.6) marque la génération.
  • Sol, Terra et Luna sont des niveaux de capacité durables qui peuvent évoluer à leur propre rythme de publication.

Pendant l'aperçu, les trois modèles sont destinés à différents points de coût/latence sur la même génération :

Niveau Positionnement Entrée (par 1M tokens) Entrée en cache Sortie (par 1M tokens)
Sol Phare pour un travail agentique ambitieux 5,00 $ 0,50 $ 30,00 $
Terra Modèle équilibré pour le travail quotidien 2,50 $ 0,25 $ 15,00 $
Luna Travail rapide et abordable à volume élevé 1,00 $ 0,10 $ 6,00 $

Tarifs officiels des niveaux GPT-5.6 Sol, Terra et Luna

OpenAI déclare que Terra correspond aux performances de GPT-5.5 à environ la moitié du coût, tandis que Luna offre une capacité solide au prix le plus bas de la famille.

Sol : Capacités Phares Qui Intéressent les Développeurs

GPT-5.6 Sol est présenté comme le modèle le plus puissant d'OpenAI à ce jour pour les workflows à long terme utilisant des outils.

Points saillants de l'annonce :

  • Terminal-Bench 2.1 — nouvel état de l'art sur les tâches d'agent en ligne de commande (planification, itération, coordination multi-outils).
  • GeneBench v1 — analyse améliorée en biologie/génomique par rapport à GPT-5.5 avec moins de tokens.
  • Cybersécurité — compétitif sur ExploitBench² et ExploitGym³ avec une forte efficacité ; OpenAI met l'accent sur les cas d'utilisation défensifs (correction, révision, éducation) plutôt que sur l'automatisation offensive.
  • Effort de raisonnement max — donne à Sol plus de temps pour raisonner profondément sur des problèmes difficiles.
  • Mode ultra — coordonne des sous-agents pour un travail complexe au-delà d'une simple boucle d'agent.

Pour les stacks de codage en production (Codex, Cursor, agents personnalisés), Sol est le niveau à surveiller lorsque votre goulot d'étranglement est la qualité et la fiabilité multi-étapes, et non les tokens bruts par seconde.

Terra et Luna : Quand Choisir Quel Niveau

Utilisez ce cadre de décision :

Si votre charge de travail est… Commencez par… Pourquoi
Refactorisations multi-fichiers, longues exécutions d'agents, recherche en sécurité, raisonnement profond Sol Plafond de capacité le plus élevé ; nouveaux modes max / ultra
Chat quotidien, RAG, codage modéré, la plupart des fonctionnalités SaaS Terra Classe ~GPT-5.5 à un prix officiel 2× inférieur à Sol
Classification, extraction, chat à haut QPS, résumé en masse Luna $/token le plus bas ; idéal pour le volume

Règle empirique : Luna pour le débit, Terra pour la production par défaut, Sol pour les tâches agentiques difficiles où le coût d'échec dépasse le coût des tokens.

Détails de Tarification Qui Changent Votre Facture

Au-delà des taux $/1M annoncés, GPT-5.6 introduit une mise en cache de prompt plus prévisible :

  • Points d'arrêt de cache explicites dans l'API.
  • Durée de vie minimale du cache : 30 minutes sur GPT-5.6 et les modèles ultérieurs.
  • Écritures dans le cache facturées à 1,25× le taux d'entrée non mis en cache.
  • Lectures du cache conservent la réduction de 90 % familière sur l'entrée en cache.

Pour les boucles d'agent qui réutilisent les prompts système, les schémas d'outils ou les préfixes de contexte long, Terra et Luna peuvent sembler beaucoup moins chers en pratique que le prix d'entrée annoncé — mais seulement si votre intégration atteint réellement le cache.

Exemple : sur Sol, l'entrée non mise en cache est de 5 $/M ; l'entrée en cache est de 0,50 $/M — une réduction 10× sur les tokens de préfixe répétés.

Accès à l'Aperçu : Ce Que « Limité » Signifie Aujourd'hui

OpenAI n'ouvre pas GPT-5.6 à tout le monde dès le premier jour.

Contraintes actuelles de l'aperçu (telles que mentionnées dans l'annonce) :

  • Accès initial via l'API et Codex pour un groupe sélectionné de partenaires de confiance.
  • Coordination avec le gouvernement américain pour un déploiement progressif lié aux garanties de cyber-capacité.
  • Disponibilité plus large dans ChatGPT, Codex et l'API prévue dans les semaines à venir.
  • Déploiement Cerebras de Sol à jusqu'à 750 tokens/s ciblé pour juillet 2026, en commençant par des clients limités.

OpenAI déclare explicitement qu'il ne souhaite pas un contrôle gouvernemental permanent sur les versions — l'aperçu est présenté comme une étape à court terme pendant que les cadres de décret exécutif sur le cyber maturent.

Implication pratique pour les développeurs : si votre feuille de route produit suppose GPT-5.6 Sol cette semaine, prévoyez un repli vers GPT-5.5 / les routes de classe Terra jusqu'à ce que votre fournisseur confirme l'accès à l'aperçu.

Stack de Sécurité : Pourquoi Vous Pourriez Voir des Refus ou des Retards

GPT-5.6 est livré avec le stack de sécurité le plus stratifié d'OpenAI à ce jour, en particulier autour des demandes à double usage cyber et biologique.

Attendez-vous pendant l'aperçu :

  • Refus stricts sur l'assistance cyber interdite, y compris les tentatives de jailbreak.
  • Générations mises en pause lorsque les classificateurs signalent une sortie à haut risque pour un examen secondaire.
  • Examen au niveau du compte lorsque les modèles ressemblent à une utilisation abusive persistante par rapport à un travail de sécurité légitime.
  • Occasionnels faux positifs sur la révision de code légitime, la préparation CTF ou les tests défensifs.

OpenAI rapporte 700k+ heures GPU équivalent A100 de red-teaming automatisé plus des tests experts humains continus. Pour les acheteurs d'entreprise, ils mentionnent de futurs contrôles de sécurité préservant la vie privée et contrôles de sécurité gérés par le client.

Si vous exploitez une passerelle IA ou revendez l'accès au modèle, tenez compte d'une latence de queue plus élevée et de blocages non déterministes dans les SLA pendant la fenêtre d'aperçu.

GPT-5.6 vs GPT-5.5 : Ce Qui a Réellement Changé

Dimension GPT-5.5 (génération précédente) Famille GPT-5.6
Nommage des niveaux Étiquette de génération unique Niveaux Sol / Terra / Luna au sein de 5.6
Structure de coûts Tarification liste précédente Terra ~moitié de Sol ; Luna le plus bas
Modes agent Efforts de raisonnement standard Sol ajoute max + sous-agents ultra
Mise en cache Comportement précédent Cache min de 30 min, points d'arrêt explicites, prime d'écriture 1,25×
Évaluations cyber Fort Sol/Terra/Luna s'améliorent tous ; Sol le plus capable
Version Chemins GA Aperçu progressif avec des garanties plus fortes

Comment Acheter GPT-5.6 ?

L'aperçu d'OpenAI est sur invitation uniquement pour de nombreux développeurs. Sur APIMaster.ai, vous pouvez acheter un accès API compatible OpenAI de la même manière que vous utilisez déjà GPT-5.5 — payez à l'utilisation à partir de 1 $, sans abonnement, compatible SDK OpenAI.

Guide étape par étape

  1. Inscrivez-vous — compte gratuit, email ou OAuth.
  2. Rechargez à partir de 1 $ — portefeuille dans la console ; prend en charge PayPal, carte et d'autres méthodes listées lors du paiement (souvent plus facile que de lier une carte directement sur platform.openai.com).
  3. Ouvrez le marché — recherchez GPT-5.6, Sol, Terra ou Luna au fur et à mesure que les routes deviennent disponibles. Comparez les prix $/1M token en direct entre les canaux (souvent en dessous de la liste officielle pendant le déploiement).
  4. Créez une clé API dans la console → copiez-la une fois.
  5. Pointez votre SDK vers l'URL de base d'APIMaster et le slug du modèle indiqué sur la carte du marché :
from openai import OpenAI

client = OpenAI(
    api_key="VOTRE_CLE_APIMASTER",
    base_url="https://apimaster.ai/v1",
)

resp = client.chat.completions.create(
    model="gpt-5.6-terra",  # utilisez le slug exact du marché lorsqu'il est listé
    messages=[{"role": "user", "content": "Répondez exactement par : ok"}],
    max_tokens=16,
)
print(resp.choices[0].message.content)
  1. Vérifiez avant de passer à l'échelle — exécutez la même clé via le testeur d'empreinte de modèle gratuit. Pendant la rareté de l'aperçu, certains relais rétrogradent silencieusement le niveau du modèle ; la détection d'APIMaster vous aide à confirmer que vous obtenez ce pour quoi vous avez payé.

Choix du niveau sur APIMaster : utilisez les routes Luna pour les appels en masse/à faible risque, Terra comme modèle de production par défaut, et Sol lorsque la qualité de l'agent est plus importante que le $/token.

Pas encore listé ? Rechargez quand même — les canaux Sol/Terra/Luna sont ajoutés au marché au fur et à mesure que les partenaires en amont les activent ; le solde du portefeuille est reporté automatiquement.

Suivez APIMaster pour les Mises à Jour du Lancement de GPT-5.6

GPT-5.6 est déployé par phases. Le moyen le plus rapide de savoir quand Sol / Terra / Luna arrivent sur le marché — et à quel prix — est de rester sur les canaux d'APIMaster :

Lorsqu'OpenAI élargit l'accès à l'aperçu, nous publions les canaux APIMaster qui réussissent la vérification d'empreinte afin que vous puissiez changer base_url sans réécrire votre application.

Créez votre compte → · Parcourez le marché → · Rejoignez Telegram →

FAQ

Que sont GPT-5.6 Sol, Terra et Luna ? Ce sont trois niveaux de capacité dans la génération GPT-5.6 d'OpenAI : Sol est le modèle agentique phare, Terra est un niveau équilibré pour le quotidien (~classe GPT-5.5 à moindre coût), et Luna est le niveau rapide au coût le plus bas pour le travail à volume élevé.

Combien coûte GPT-5.6 sur l'API officielle ? Les prix de liste par million de tokens sont Sol 5 $ entrée / 30 $ sortie, Terra 2,50 $ / 15 $, Luna 1 $ / 6 $, avec l'entrée en cache à 10 % du prix d'entrée non mis en cache (90 % de réduction). Les écritures dans le cache coûtent 1,25× l'entrée non mise en cache ; les entrées de cache durent au moins 30 minutes.

GPT-5.6 Sol est-il disponible pour tout le monde aujourd'hui ? Non. OpenAI a commencé par un aperçu limité pour les partenaires API/Codex de confiance en juin 2026 et prévoit une disponibilité plus large dans les semaines à venir. Vérifiez votre organisation OpenAI ou le tableau de bord de votre fournisseur pour l'activation.

Qu'est-ce que le mode ultra de GPT-5.6 Sol ? ultra va au-delà d'un seul agent en orchestrant des sous-agents pour accélérer les tâches complexes. Il cible les charges de travail où l'exploration parallèle bat une longue chaîne sérielle.

Comment GPT-5.6 se compare-t-il à GPT-5.5 pour les développeurs ? Terra est positionné comme compétitif avec GPT-5.5 à environ la moitié du coût officiel. Sol dépasse GPT-5.5 sur les benchmarks agentiques, biologiques et cyber qu'OpenAI a publiés. Luna échange la capacité de pointe contre le $/token le plus bas.

Les passerelles API tierces auront-elles GPT-5.6 dès le premier jour ? Généralement pas de manière uniforme. La rareté de l'aperçu et l'activation spécifique au fournisseur signifient que les passerelles agrégées peuvent déployer Sol/Terra/Luna à des moments différents. Vérifiez toujours le modèle réel avec une empreinte comportementale, pas seulement la chaîne de modèle dans la requête.

Où puis-je lire la source primaire ? L'annonce d'OpenAI : Previewing GPT-5.6 Sol (26 juin 2026). La carte système et les évaluations étendues sont promises lors de la version plus large.

Sources et lectures complémentaires