Die Token-Kosten-Illusion: Billiger pro Token, teurer pro Monat

Token-Kosten: Warum niedrigere Preise nicht niedrigere Rechnungen bedeuten

Eine der wichtigsten Debatten der KI-Branche in diesem Frühjahr dreht sich nicht um Modell-Qualität, sondern um die Rechnung am Monatsende. Die Stückpreise pro Token fallen, aber die tatsächlichen Ausgaben von Unternehmen steigen rasant. Der Grund: KI-Agenten verbrauchen ein Vielfaches an Tokens im Vergleich zu einfachen Chatbot-Anfragen.

Die konkreten Zahlen sind ernüchternd: Uber hat bestätigt, dass 84 Prozent seiner 5.000 Entwickler Claude Code nutzen und die monatlichen API-Kosten pro Ingenieur zwischen 500 und 2.000 Dollar liegen. Das gesamte KI-Budget 2026 war nach vier Monaten aufgebraucht. Microsoft fährt die Claude-Code-Nutzung in seiner Experiences-and-Devices-Sparte bis Ende Juni 2026 herunter, auch aus Kostengründen.

Gleichzeitig steigen die Listenpreise bei den großen Anbietern verdeckt: OpenAI hat mit GPT-5.5 den Token-Preis auf 5 Dollar Input und 30 Dollar Output pro Million verdoppelt. Anthropic hat bei Claude Opus 4.7 zwar den Token-Preis beibehalten, aber einen neuen Tokenizer eingeführt, der mehr Tokens pro Wort erzeugt und Rechnungen unsichtbar um bis zu 27 Prozent anhebt.

Goldman Sachs prognostiziert einen 24-fachen Anstieg des Token-Verbrauchs bis 2030 durch agentenbasierte KI. Die eigentliche Kennzahl ist nicht mehr der Preis pro Token, sondern die Gesamtkosten pro erledigter Aufgabe.

Token-Kosten: Warum niedrigere Preise nicht niedrigere Rechnungen bedeuten

Quellen: