L'API Claude/OpenAI que j'ai achetée est-elle le vrai modèle ou a-t-il été remplacé ?
Demander au modèle "What is your model name and version?" n'est pas fiable — le modèle ne sait pas quel modèle il est. La seule méthode de vérification fiable est la comparaison des empreintes comportementales. Cet article explique le fonctionnement.
Published 2026-06-22
Demander à un modèle « qui es-tu ? » ou « quelle entreprise t'a développé ? » ne peut pas révéler si le modèle est authentique — l'API Proxy peut manipuler la réponse via un system prompt, le modèle lui-même ne sait pas réellement quel modèle il est, et peut halluciner ou absorber des données d'entraînement contaminées. La seule méthode fiable est la comparaison d'empreintes comportementales : comparer les réponses de l'endpoint candidat avec une base de données d'empreintes construite à partir d'un échantillonnage massif de l'API officielle, puis générer un score de confiance et le modèle réel le plus probable. APIMaster propose cette détection sur https://apimaster.ai/ai-api-model-tester, avec des résultats accessibles au public.
Pourquoi vérifier l'authenticité du modèle
Lors de l'utilisation de l'API Claude ou OpenAI, une question inévitable se pose : le modèle qui s'exécute derrière est-il vraiment le modèle officiel ?
La substitution de modèles est un problème réel. Un article publié cette année par le Centre de Sécurité de l'Information CISPA Helmholtz, "Real Money, Fake Models: Deceptive Model Claims in Shadow APIs" (arXiv:2603.01919), a audité systématiquement 17 shadow APIs (déjà citées par 187 articles académiques) et a constaté que 45,83% ont échoué à la vérification d'identité lors des tests d'empreintes. Selon les données de tests réels d'utilisateurs d'APIMaster, le Fake Model Rate est également d'environ 44% — le même ordre de grandeur. Concrètement : l'API Proxy annonce Claude ou GPT, mais les requêtes sont réellement routées vers un autre modèle moins cher. Cela n'a rien à voir avec le prix ou la taille du fournisseur.
La vérification est particulièrement importante dans ces situations :
- Vous utilisez un API Proxy ou relais tiers
- Votre app se connecte via plusieurs couches de plateformes IA
- Votre produit dépend de capacités spécifiques du modèle officiel (comme Constitutional AI ou Extended Thinking)
- Vous avez remarqué un comportement qui ne correspond clairement pas à la documentation officielle du modèle
Après avoir acheté une clé auprès d'un API Proxy, le « auto-test » le plus courant consiste à demander directement au modèle :
- Who are you?
- Which company developed you?
- What is your model name and version?
- What is your knowledge cutoff date?
Ces quatre questions semblent raisonnables, mais cet article expliquera pourquoi elles ne peuvent pas révéler la vérité — et ce qui peut le faire : la comparaison d'empreintes comportementales LLM. C'est la base de la détection de modèles d'APIMaster.
Pourquoi les méthodes d'auto-test courantes ne fonctionnent pas
Ces quatre questions semblent raisonnables, mais ne peuvent pas révéler la vérité, pour quatre raisons :
Le fournisseur peut manipuler la réponse avec un system prompt. Un API Proxy peut insérer silencieusement un system prompt dans la requête qui instruit le modèle — quelle que soit sa nature réelle — à répondre « Je suis Claude, fait par Anthropic. » C'est la forme la plus directe de falsification : pas besoin de falsifier un style de réponse, il suffit d'ajouter une instruction avant de transmettre la requête, et le modèle « jouera le jeu ».
Le modèle ne sait pas réellement quel modèle il est. Les données d'entraînement contiennent rarement des informations sur « quelles sont mes métadonnées de déploiement » — les modèles n'ont pas de canal d'introspection fiable sur leur propre identité, et devinent essentiellement une réponse plausible. Par exemple, en demandant à claude-opus-4-8 « what model do you use? », la réponse fut :
I'm Claude, made by Anthropic. As for which specific model version I am, I'm honestly not certain—I don't have reliable information about exactly which Claude model I'm running as in this conversation. Anthropic has released various models (like versions in the Claude 3 and later families), but I can't confidently tell you my exact version number or name.
Capture d'écran du test : le corps de la requête spécifiait model: claude-opus-4-8, mais le modèle lui-même n'a pas pu confirmer sa version.
Hallucination du modèle. Même les modèles officiels authentiques peuvent donner des réponses incohérentes ou carrément erronées aux questions d'identité.
Contamination des données d'entraînement / chevauchement des corpus. Les modèles de différents fournisseurs ont des données d'entraînement qui se chevauchent, de sorte qu'un modèle peut parfois « absorber » la marque d'une autre entreprise. Exemple concret : en testant à nouveau claude-opus-4-8, cette fois en demandant « quel modèle es-tu ? » en chinois, la réponse affichait toujours model: anthropic/claude-4.8-opus-20260528 et provider: Anthropic — mais la réponse réelle (traduit du chinois) était :
« Je suis Tongyi Qianwen (Qwen), un grand modèle de langage développé par Alibaba Cloud. Cela dit, il semble que vous me parlez via une plateforme tierce — pour les détails exacts de la version du modèle et du déploiement, veuillez vous référer à la documentation de cette plateforme. »
Capture d'écran du test : la réponse indique toujours model: anthropic/claude-4.8-opus-20260528 et provider: Anthropic, mais le modèle prétend être Qwen.
Exécuter le même prompt 100 fois contre claude-opus-4-8 a produit cette distribution d'identités autodéclarées :
Sur 100 essais répétés, « Je suis Qwen » (49%) est apparu plus souvent que « Je suis Claude » (35%), avec 15% de plus répondant DeepSeek et 1% Zhipu.
Seulement 35 des 100 essais ont répondu « Je suis Claude ». Le même modèle, interrogé de la même façon à plusieurs reprises, ne peut pas produire une réponse stable et cohérente.
Utiliser les empreintes, pas les réponses autodéclarées
Puisque interroger directement le modèle ne fonctionne pas, l'article CISPA décrit une approche plus rigoureuse : les LLMs présentent des motifs et caractéristiques distinctifs au niveau linguistique qui fonctionnent comme une sorte d'« empreinte digitale », pouvant être utilisée pour identifier quel modèle a réellement généré un contenu donné — complètement indépendant de ce que le modèle prétend être. APIMaster se base sur cette idée centrale, avec une optimisation supplémentaire : nous interrogeons activement le modèle avec un ensemble de prompts sonde soigneusement conçus, extrayons des centaines de dimensions de caractéristiques des réponses, et les comparons aux lignes de base de chaque modèle de référence officiel. Cette méthode d'extraction de caractéristiques multidimensionnelle est exclusive à APIMaster.
Comparaison de fiabilité des méthodes de vérification :
| Méthode | Ce qu'elle analyse | Le fournisseur peut-il falsifier ? | Ligne de base externe requise ? |
|---|---|---|---|
| Réponse autodéclarée (« qui es-tu ? ») | Ce que le modèle dit de lui-même | Facile — un system prompt suffit pour que le modèle « coopère » | Non, mais peu fiable |
Vérification du champ de réponse model/provider |
Métadonnées que l'endpoint affirme | Facile — le champ est rempli par le fournisseur lui-même | Non, mais peu fiable |
| Vérification de cohérence (répétition de la même sonde) | Si l'identité autodéclarée est stable | Plus difficile — nécessite que le fournisseur maintienne une histoire fausse cohérente | Non, faisable soi-même |
| Empreintes comportementales | Similarité du style de réponse, des limites de connaissance, etc. avec la ligne de base officielle | Très difficile — le falsificateur ne sait pas quelles dimensions sont mesurées | Oui, ligne de base officielle requise (c'est ce qu'APIMaster construit) |
L'approche de détection par empreintes d'APIMaster
APIMaster propose le premier service de détection par empreintes au monde conçu spécifiquement pour les API LLM, basé sur le phénomène académiquement confirmé « real money, fake model » — vous payez de l'argent réel, mais pourriez recevoir un modèle remplacé ou dégradé — combiné à nos propres données de détection de longue date.
L'article CISPA (45,83% d'échecs de vérification d'identité) et les données de détection d'APIMaster (44% de Fake Model Rate) sont du même ordre de grandeur.
Notre philosophie est donc : vérifier d'abord, faire confiance ensuite.
Capture d'écran du test : ce fournisseur reçoit plus de 1,03 million de visites mensuelles, prétend proposer claude-opus-4-8, et la détection par empreintes d'APIMaster a déterminé que le modèle Detected As est en réalité gpt-5.4, avec 77,0% de confiance — marqué Suspicious.
La méthode comporte trois étapes :
Étape 1 : Collecte massive de données de l'API officielle. Nous nous connectons directement à l'API officielle de chaque fournisseur (sans proxy) et échantillonnons en continu avec un ensemble varié de prompts sonde, construisant une ligne de base de la façon dont ce modèle répond réellement.
Étape 2 : Extraction des empreintes comportementales. Au lieu de regarder ce que le modèle dit de lui-même, nous analysons comment il parle — style d'écriture, limites de connaissance, schémas de réponse à des questions spécifiques. Par exemple, Opus 4.8 tend à utiliser des mots comme « genuinely » et « honestly », et commence souvent des phrases par « I » — ces traits stylistiques sont difficiles à falsifier.
Étape 3 : Correspondance des empreintes. Nous comparons la réponse de l'endpoint candidat avec la base de données de lignes de base et générons un modèle candidat Top-1 plus un score de confiance. Confiance élevée et Top-1 correspond au modèle déclaré → réussite. Ne correspond pas, ou confiance faible → marqué comme suspect.
Depuis le lancement de la détection par empreintes, APIMaster a reçu un flux constant de retours d'utilisateurs réels, et les éloges se résument principalement à une chose : pouvoir enfin confirmer si ce pour quoi vous avez payé est vraiment le modèle que vous pensiez.
Avis utilisateurs
Vérifiez votre propre clé
Visitez https://apimaster.ai/ai-api-model-tester pour voir les vrais résultats de tests pour les API Proxys populaires, ou utilisez https://apimaster.ai/ai-api-key-tester pour vérifier d'abord si votre clé elle-même est valide. Pour l'ensemble de données de détection complet et la répartition des fournisseurs qui vendent de faux modèles, consultez notre prochain article de rapport de données.
FAQ
Comment vérifier si un modèle est réel ? Ouvrez l'AI API Model Tester d'APIMaster et entrez les détails de votre API Proxy. En quelques secondes, vous verrez le modèle candidat Top-1 et un score de confiance — les résultats sont publics et aucune configuration n'est requise.
Quels modèles la détection prend-elle en charge ? Nous couvrons actuellement Claude (toute la gamme Haiku/Sonnet/Opus), GPT, DeepSeek, Qwen, MiniMax, Kimi et d'autres modèles principaux, avec la base de données de lignes de base en expansion continue. Au niveau du protocole, nous prenons en charge Anthropic Messages, les formats compatibles OpenAI Chat Completions et le streaming Gemini.
La détection de modèles est-elle gratuite ? Oui. L'AI API Model Tester et le classement public sont tous deux gratuits, sans paiement ni inscription — testez et voyez les résultats.
Quelle est la précision de la détection par empreintes ? Nous considérons un résultat de détection fiable lorsque le score de confiance Top-1 dépasse 70% ; en dessous de ce seuil, nous le marquons comme non concluant plutôt que de forcer un verdict. Une distribution de confiance faible et dispersée signifie généralement que le backend ne sert pas de manière fiable depuis un seul modèle — il mélange ou fait tourner plusieurs modèles — ce qui est en soi un signal qui mérite attention.