TECH-KULTUR

Im Inneren des Schwarzmarkts für Claude-Tokens und Schatten-APIs

Claude-Tokens 70–90 % günstiger: Chinesische Händler betreiben mittels Identitätsdiebstahl, Model-Spoofing und npm-Malware eine Schatten-API-Ökonomie.

Veröffentlicht am 29.6.2026

Eine Schatten-API-Ökonomie im digitalen Untergrund bietet Entwicklern Premium-Zugang zu Spitzenmodellen zu einem Bruchteil der regulären Preise. Chinesische Händler bewerben Token für High-End-Modelle mit Rabatten von 70 % bis 90 % unter den Tarifen von Anthropic. Dieser Graumarkt umgeht Geosperren sowie Sicherheitsprüfungen und betreibt eine komplexe Lieferkette aus Account-Farmen, synthetischen Identitätsdokumenten und gestohlenen Verbraucher-Abonnements.

Transit Stations in the Shadow API Economy

Transit-Stationen sind Proxy-Knotenpunkte, die als Vermittler zwischen Nutzern hinter Firewalls und westlichen KI-Anbietern fungieren. Diese Knoten leiten API-Anfragen aus eingeschränkten Regionen wie China über unblockierte Zwischenserver um, maskieren den Ursprung des Datenverkehrs und liefern die Modellausgaben zurück.

Sie arbeiten ähnlich wie virtuelle private Netzwerke (VPNs), leiten jedoch API-Nutzdaten weiter. Diese Systeme umgehen Exportkontrollen sowie IP-Sperren der Anbieter und öffnen Entwicklern sowie böswilligen Akteuren ein Einfallstor.

Händler stellen diese Dienste als alternative Router dar, die öffentliche Aggregatoren nachahmen, während sie außerhalb von Compliance-Vorgaben agieren. Durch die Umleitung des Datenverkehrs über diese Knotenpunkte können die Betreiber jeden Prompt und jede Antwort mitlesen.

Bypassing KYC and Identity Verification

Account-Händler umgehen die Identitätsprüfung mithilfe von Anti-Detect-Browsern, automatisierten Verifizierungsumgehungen und synthetischen Anmeldedaten. Über Netzwerke zur Massenregistrierung erstellen sie täglich Tausende Entwickler-Accounts, um die drei Säulen der Nutzerverifizierung auszuhebeln.

Die Registrierung von Accounts erfordert die Neutralisierung von Erkennungsmechanismen auf Netzwerkebene. Die Ersteller nutzen Anti-Detect-Browser anstelle einfacher Bibliotheken zur Browser-Automatisierung und präsentieren authentische Geräte-Fingerabdrücke sowie Residential-IP-Proxys, die wie typischer Nutzer-Datenverkehr aussehen.

Virtuelle SIM-Dienste umgehen die Telefonverifizierung und verkaufen SMS-Codes für weniger als einen Cent. Wenn Anbieter Regierungsdokumente für Know Your Customer (KYC)-Prüfungen verlangen, kaufen Händler synthetische Identitäten auf Telegram. Die Verkäufer liefern gefälschte Pässe und Führerscheine mit gültigen MRZ-Prüfsummen (Machine Readable Zone).

Erfordern Bots Live-Gesichtsscans, heuern Vermittler Einheimische in Entwicklungsländern an, die ihre Gesichter gegen eine geringe Gebühr scannen lassen. Die Vermittler bündeln diese Scans und verkaufen sie an Technologieentwickler in Beijing.

The Economics of Discounted API Tokens

Händler senken ihre Kosten und Token-Preise durch Model-Spoofing, Zahlungsbetrug und den Weiterverkauf von Nutzerdaten, die für das Modelltraining eingereicht wurden. Während Käufer glauben, direkten Zugriff auf Spitzenmodelle zu erwerben, erhalten sie in Wahrheit heruntergestufte Compute-Streams.

Das Hauptwerkzeug der Händler ist Model-Spoofing, bei dem Anfragen an günstigere Modelle umgeleitet werden. Ein Händler wirbt beispielsweise mit Premium-Zugang zu Claude Sonnet, leitet die Anfrage jedoch an Haiku oder eine Open-Source-Plattform weiter.

API-DienstBeworbenes ModellTatsächliches zugrundeliegendes ModellGenauigkeit im MedQA-Benchmark
Offizielle Anbieter-APIClaude 3.5 SonnetClaude 3.5 Sonnet83,8 %
Händler-Schatten-APIClaude 3.5 Sonnet (Behauptet)Model-Spoofing / Haiku / Flash37,0 %

Dieser Austausch verringert die Leistung bei spezialisierten Benchmarks. Tests zeigen: Während offizielle APIs bei medizinischen Benchmarks hohe Werte erzielen, verzeichnen Schatten-APIs einen Einbruch der Genauigkeit, da die Anfrage an minderwertige Modelle weitergeleitet wird.

Gestohlene Kreditkarten finanzieren die Premium-Accounts und generieren reinen Gewinn, bevor die Anbieter die Konten sperren. Die Betreiber greifen zudem von Entwicklern eingegebene Textdaten ab und verkaufen diese Trainingspaare an regionale Labore, um ihre eigenen Modellentwicklungsprogramme zu finanzieren.

The NPM Malware Connection to Stolen Subscriptions

Infizierte npm-Pakete enthalten Skripte, die API-Schlüssel von Entwicklerrechnern stehlen. Diese Angriffe auf die Abhängigkeitskette verbreiten sich über öffentliche Bibliotheken, kompromittieren Entwicklerumgebungen und kapern kostenpflichtige Abonnements.

Die Wurmfamilie Shy Halude veranschaulicht diese Taktik. Sobald ein Entwickler ein infiziertes Paket installiert, scannt das Skript lokale Verzeichnisse nach aktiven Umgebungsvariablen und API-Schlüsseln. Anschließend startet das Skript einen Hintergrundprozess und nutzt den Rechner als lokale Transit-Station.

Händler leiten Anfragen über diese Opfer-Rechner um, um deren kostenpflichtige Limits auszunutzen. Die Betroffenen wundern sich, warum ihre Nutzungslimits aufgebraucht sind, ohne zu ahnen, dass ihr Rechner als Knotenpunkt in einem globalen Schatten-API-Netzwerk dient.

Key Takeaways

  • Chinesische Händler bieten Claude-Tokens in einer Schatten-API-Ökonomie um 70 % bis 90 % unter den offiziellen Preisen an.
  • Proxy-Server namens Transit-Stationen ermöglichen es Entwicklern hinter geografischen Sperren, Exportkontrollen zu umgehen.
  • Account-Farmen umgehen KYC-Prüfungen mittels Anti-Detect-Browsern, günstigen SMS-Pools und auf Telegram verkauften synthetischen Pässen.
  • Händler halten die Preise niedrig, indem sie Model-Spoofing betreiben und Premium-Modelle durch günstigere Alternativen wie Haiku ersetzen.
  • Infizierte Abhängigkeiten in Paketmanagern wie der Wurm Shy Halude kapern kostenpflichtige Abonnements von Entwicklern, um Hintergrundanfragen auszuführen.
  • Betreiber von Schatten-APIs erfassen und verkaufen Protokolle von Nutzeranfragen an regionale Labore, die damit Konkurrenzmodelle trainieren.

FAQ

Transit Stations in the AI Gray Market

Eine Transit-Station ist ein zwischengeschalteter Server, der als Proxy fungiert und API-Anfragen aus Ländern mit geografischen Einschränkungen an westliche KI-Anbieter weiterleitet. Dies ermöglicht es Entwicklern hinter Firewalls, auf Modelle wie Claude oder GPT-4o zuzugreifen, während ihr tatsächlicher Standort vor den Anbietern verborgen bleibt.

Economics of Cheap API Tokens

Händler senken ihre Kosten, indem sie Anfragen an billigere Modelle umleiten (Model-Spoofing), gestohlene Kreditkarten zur Zahlung nutzen und kostenpflichtige Account-Abonnements bündeln. Zudem greifen sie Nutzeranfragen ab und verkaufen diese als Trainingsdaten an einheimische Forschungslabore, um die Token-Kosten auszugleichen.

Model Spoofing Explained

Model-Spoofing liegt vor, wenn ein Betreiber einer Schatten-API vorgibt, ein Premium-Modell wie Claude Sonnet auszuführen, die Anfrage des Nutzers jedoch heimlich an ein günstigeres, leistungsschwächeres Modell wie Haiku oder ein kleineres Open-Source-Modell weiterleitet und die Differenz einstreicht.

Malware Key Theft Mechanics

Malware wie der Wurm Shy Halude wird über infizierte Open-Source-Pakete in Paketmanagern wie npm verbreitet. Einmal installiert, scannt sie das System des Entwicklers nach gespeicherten Anmeldedaten, stiehlt dessen API-Schlüssel und leitet externe Anfragen über dessen kostenpflichtiges Konto um.

Sources

Weiterlesen

Empfohlene Berichte