Qwen 3.7 Max: Alibabas Agent-Modell mit 1 Million Token Kontext

Qwen 3.7 Max: Wenn ein Agent 35 Stunden alleine arbeitet

Am 20. Mai hat Alibabas Qwen-Team auf dem Cloud Summit ein Modell vorgestellt, das konsequent auf autonomes Arbeiten ausgelegt ist. Qwen 3.7 Max kombiniert ein Kontextfenster von 1 Million Tokens mit einem nativen Extended-Thinking-Modus, der das Modell bei komplexen Aufgaben eigenständig nachdenken lässt.

Die Benchmark-Ergebnisse sprechen für sich: Auf SWE-Pro (agentenbasiertes Coding) erreicht Qwen 3.7 Max 60,6 Punkte und übertrifft damit sowohl Claude Opus 4.6 als auch DeepSeek V4 Pro. Auf Terminal-Bench 2.0 kommt es auf 69,7, auf GPQA Diamond (wissenschaftliches Reasoning) auf 92,4. Laut Alibaba kann das Modell autonome Tasks über 35 Stunden durchführen, ohne dass ein Mensch eingreifen muss.

Anders als die Open-Source-Modelle aus der Qwen-Familie (Qwen 3.6 ist frei verfügbar) ist 3.7 Max ein reines API-Produkt. Es läuft auf Alibaba Cloud, OpenRouter und Together AI. Die Preise sind kompetitiv: 2,50 Dollar pro Million Input-Tokens und 7,50 Dollar für Output, mit 0,25 Dollar für gecachte Tokens. Günstiger als Anthropic und OpenAI, aber nicht so aggressiv wie DeepSeek.

Das Kontextfenster wurde gegenüber dem Vorgänger Qwen 3.6 Max von 256.000 auf 1 Million Tokens vervierfacht. Damit können ganze Codebasen, lange Verträge oder umfangreiche Forschungspapiere in einem Durchgang verarbeitet werden, ohne dass Kontext verloren geht.

Qwen 3.7 Max: Wenn ein Agent 35 Stunden alleine arbeitet

Quellen: