APIMaster Blog

L'API Claude/OpenAI que j'ai achetée est-elle le vrai modèle ou a-t-il été remplacé ?

Demander au modèle "What is your model name and version?" n'est pas fiable — le modèle ne sait pas quel modèle il est. La seule méthode de vérification fiable est la comparaison des empreintes comportementales. Cet article explique le fonctionnement.

API verificationfingerprint detectionClaude APIOpenAI API

Published 2026-06-22

Quick Answer

Demander à un modèle « qui es-tu ? » ou « quelle entreprise t'a développé ? » ne peut pas révéler si le modèle est authentique — l'API Proxy peut manipuler la réponse via un system prompt, le modèle lui-même ne sait pas réellement quel modèle il est, et peut halluciner ou absorber des données d'entraînement contaminées. La seule méthode fiable est la comparaison d'empreintes comportementales : comparer les réponses de l'endpoint candidat avec une base de données d'empreintes construite à partir d'un échantillonnage massif de l'API officielle, puis générer un score de confiance et le modèle réel le plus probable. APIMaster propose cette détection sur https://apimaster.ai/ai-api-model-tester, avec des résultats accessibles au public.

Pourquoi vérifier l'authenticité du modèle

Lors de l'utilisation de l'API Claude ou OpenAI, une question inévitable se pose : le modèle qui s'exécute derrière est-il vraiment le modèle officiel ?

La substitution de modèles est un problème réel. Un article publié cette année par le Centre de Sécurité de l'Information CISPA Helmholtz, "Real Money, Fake Models: Deceptive Model Claims in Shadow APIs" (arXiv:2603.01919), a audité systématiquement 17 shadow APIs (déjà citées par 187 articles académiques) et a constaté que 45,83% ont échoué à la vérification d'identité lors des tests d'empreintes. Selon les données de tests réels d'utilisateurs d'APIMaster, le Fake Model Rate est également d'environ 44% — le même ordre de grandeur. Concrètement : l'API Proxy annonce Claude ou GPT, mais les requêtes sont réellement routées vers un autre modèle moins cher. Cela n'a rien à voir avec le prix ou la taille du fournisseur.

La vérification est particulièrement importante dans ces situations :

Vous utilisez un API Proxy ou relais tiers
Votre app se connecte via plusieurs couches de plateformes IA
Votre produit dépend de capacités spécifiques du modèle officiel (comme Constitutional AI ou Extended Thinking)
Vous avez remarqué un comportement qui ne correspond clairement pas à la documentation officielle du modèle

Après avoir acheté une clé auprès d'un API Proxy, le « auto-test » le plus courant consiste à demander directement au modèle :

Who are you?
Which company developed you?
What is your model name and version?
What is your knowledge cutoff date?

Ces quatre questions semblent raisonnables, mais cet article expliquera pourquoi elles ne peuvent pas révéler la vérité — et ce qui peut le faire : la comparaison d'empreintes comportementales LLM. C'est la base de la détection de modèles d'APIMaster.

Pourquoi les méthodes d'auto-test courantes ne fonctionnent pas

Ces quatre questions semblent raisonnables, mais ne peuvent pas révéler la vérité, pour quatre raisons :

Le fournisseur peut manipuler la réponse avec un system prompt. Un API Proxy peut insérer silencieusement un system prompt dans la requête qui instruit le modèle — quelle que soit sa nature réelle — à répondre « Je suis Claude, fait par Anthropic. » C'est la forme la plus directe de falsification : pas besoin de falsifier un style de réponse, il suffit d'ajouter une instruction avant de transmettre la requête, et le modèle « jouera le jeu ».

Le modèle ne sait pas réellement quel modèle il est. Les données d'entraînement contiennent rarement des informations sur « quelles sont mes métadonnées de déploiement » — les modèles n'ont pas de canal d'introspection fiable sur leur propre identité, et devinent essentiellement une réponse plausible. Par exemple, en demandant à claude-opus-4-8 « what model do you use? », la réponse fut :

I'm Claude, made by Anthropic. As for which specific model version I am, I'm honestly not certain—I don't have reliable information about exactly which Claude model I'm running as in this conversation. Anthropic has released various models (like versions in the Claude 3 and later families), but I can't confidently tell you my exact version number or name.

Résultat du test : claude-opus-4-8 répond « pas certain » quand on lui demande sa version exacte Capture d'écran du test : le corps de la requête spécifiait model: claude-opus-4-8, mais le modèle lui-même n'a pas pu confirmer sa version.

Hallucination du modèle. Même les modèles officiels authentiques peuvent donner des réponses incohérentes ou carrément erronées aux questions d'identité.

Contamination des données d'entraînement / chevauchement des corpus. Les modèles de différents fournisseurs ont des données d'entraînement qui se chevauchent, de sorte qu'un modèle peut parfois « absorber » la marque d'une autre entreprise. Exemple concret : en testant à nouveau claude-opus-4-8, cette fois en demandant « quel modèle es-tu ? » en chinois, la réponse affichait toujours model: anthropic/claude-4.8-opus-20260528 et provider: Anthropic — mais la réponse réelle (traduit du chinois) était :

« Je suis Tongyi Qianwen (Qwen), un grand modèle de langage développé par Alibaba Cloud. Cela dit, il semble que vous me parlez via une plateforme tierce — pour les détails exacts de la version du modèle et du déploiement, veuillez vous référer à la documentation de cette plateforme. »

Résultat du test : claude-opus-4-8 prétend être Qwen Capture d'écran du test : la réponse indique toujours model: anthropic/claude-4.8-opus-20260528 et provider: Anthropic, mais le modèle prétend être Qwen.

Exécuter le même prompt 100 fois contre claude-opus-4-8 a produit cette distribution d'identités autodéclarées :

Distribution d'identité autodéclarée sur 100 essais contre claude-opus-4-8 Sur 100 essais répétés, « Je suis Qwen » (49%) est apparu plus souvent que « Je suis Claude » (35%), avec 15% de plus répondant DeepSeek et 1% Zhipu.

Seulement 35 des 100 essais ont répondu « Je suis Claude ». Le même modèle, interrogé de la même façon à plusieurs reprises, ne peut pas produire une réponse stable et cohérente.

Utiliser les empreintes, pas les réponses autodéclarées

Puisque interroger directement le modèle ne fonctionne pas, l'article CISPA décrit une approche plus rigoureuse : les LLMs présentent des motifs et caractéristiques distinctifs au niveau linguistique qui fonctionnent comme une sorte d'« empreinte digitale », pouvant être utilisée pour identifier quel modèle a réellement généré un contenu donné — complètement indépendant de ce que le modèle prétend être. APIMaster se base sur cette idée centrale, avec une optimisation supplémentaire : nous interrogeons activement le modèle avec un ensemble de prompts sonde soigneusement conçus, extrayons des centaines de dimensions de caractéristiques des réponses, et les comparons aux lignes de base de chaque modèle de référence officiel. Cette méthode d'extraction de caractéristiques multidimensionnelle est exclusive à APIMaster.

Comparaison de fiabilité des méthodes de vérification :

Méthode	Ce qu'elle analyse	Le fournisseur peut-il falsifier ?	Ligne de base externe requise ?
Réponse autodéclarée (« qui es-tu ? »)	Ce que le modèle dit de lui-même	Facile — un system prompt suffit pour que le modèle « coopère »	Non, mais peu fiable
Vérification du champ de réponse `model`/`provider`	Métadonnées que l'endpoint affirme	Facile — le champ est rempli par le fournisseur lui-même	Non, mais peu fiable
Vérification de cohérence (répétition de la même sonde)	Si l'identité autodéclarée est stable	Plus difficile — nécessite que le fournisseur maintienne une histoire fausse cohérente	Non, faisable soi-même
Empreintes comportementales	Similarité du style de réponse, des limites de connaissance, etc. avec la ligne de base officielle	Très difficile — le falsificateur ne sait pas quelles dimensions sont mesurées	Oui, ligne de base officielle requise (c'est ce qu'APIMaster construit)

L'approche de détection par empreintes d'APIMaster

APIMaster propose le premier service de détection par empreintes au monde conçu spécifiquement pour les API LLM, basé sur le phénomène académiquement confirmé « real money, fake model » — vous payez de l'argent réel, mais pourriez recevoir un modèle remplacé ou dégradé — combiné à nos propres données de détection de longue date.

L'article CISPA (45,83% d'échecs de vérification d'identité) et les données de détection d'APIMaster (44% de Fake Model Rate) sont du même ordre de grandeur.

Notre philosophie est donc : vérifier d'abord, faire confiance ensuite.

Résultat du test : le Target Model déclaré était claude-opus-4-8, la détection par empreintes l'a marqué Suspicious, le Detected As est en réalité gpt-5.4 (confiance 77,0%) Capture d'écran du test : ce fournisseur reçoit plus de 1,03 million de visites mensuelles, prétend proposer claude-opus-4-8, et la détection par empreintes d'APIMaster a déterminé que le modèle Detected As est en réalité gpt-5.4, avec 77,0% de confiance — marqué Suspicious.

La méthode comporte trois étapes :

Étape 1 : Collecte massive de données de l'API officielle. Nous nous connectons directement à l'API officielle de chaque fournisseur (sans proxy) et échantillonnons en continu avec un ensemble varié de prompts sonde, construisant une ligne de base de la façon dont ce modèle répond réellement.

Étape 2 : Extraction des empreintes comportementales. Au lieu de regarder ce que le modèle dit de lui-même, nous analysons comment il parle — style d'écriture, limites de connaissance, schémas de réponse à des questions spécifiques. Par exemple, Opus 4.8 tend à utiliser des mots comme « genuinely » et « honestly », et commence souvent des phrases par « I » — ces traits stylistiques sont difficiles à falsifier.

Étape 3 : Correspondance des empreintes. Nous comparons la réponse de l'endpoint candidat avec la base de données de lignes de base et générons un modèle candidat Top-1 plus un score de confiance. Confiance élevée et Top-1 correspond au modèle déclaré → réussite. Ne correspond pas, ou confiance faible → marqué comme suspect.

Depuis le lancement de la détection par empreintes, APIMaster a reçu un flux constant de retours d'utilisateurs réels, et les éloges se résument principalement à une chose : pouvoir enfin confirmer si ce pour quoi vous avez payé est vraiment le modèle que vous pensiez.

Avis utilisateurs

Vérifiez votre propre clé

Visitez https://apimaster.ai/ai-api-model-tester pour voir les vrais résultats de tests pour les API Proxys populaires, ou utilisez https://apimaster.ai/ai-api-key-tester pour vérifier d'abord si votre clé elle-même est valide. Pour l'ensemble de données de détection complet et la répartition des fournisseurs qui vendent de faux modèles, consultez notre prochain article de rapport de données.

FAQ

Comment vérifier si un modèle est réel ? Ouvrez l'AI API Model Tester d'APIMaster et entrez les détails de votre API Proxy. En quelques secondes, vous verrez le modèle candidat Top-1 et un score de confiance — les résultats sont publics et aucune configuration n'est requise.

Quels modèles la détection prend-elle en charge ? Nous couvrons actuellement Claude (toute la gamme Haiku/Sonnet/Opus), GPT, DeepSeek, Qwen, MiniMax, Kimi et d'autres modèles principaux, avec la base de données de lignes de base en expansion continue. Au niveau du protocole, nous prenons en charge Anthropic Messages, les formats compatibles OpenAI Chat Completions et le streaming Gemini.

La détection de modèles est-elle gratuite ? Oui. L'AI API Model Tester et le classement public sont tous deux gratuits, sans paiement ni inscription — testez et voyez les résultats.

Quelle est la précision de la détection par empreintes ? Nous considérons un résultat de détection fiable lorsque le score de confiance Top-1 dépasse 70% ; en dessous de ce seuil, nous le marquons comme non concluant plutôt que de forcer un verdict. Une distribution de confiance faible et dispersée signifie généralement que le backend ne sert pas de manière fiable depuis un seul modèle — il mélange ou fait tourner plusieurs modèles — ce qui est en soi un signal qui mérite attention.