Alpha Arena enthüllt KI-Handelsmängel: Westliche Modelle verlieren innerhalb einer Woche 80 % ihres Kapitals
Der Markt ist der ultimative Test für KI.
Autor: Juan Galt
Übersetzung: AididiaoJP, Foresight News
Kann KI mit Kryptowährungen handeln? Jay Azhang, ein Computer-Ingenieur und Finanzprofi aus New York, testet diese Frage mit Alpha Arena. In diesem Projekt treten die leistungsstärksten Large Language Models gegeneinander an, wobei jedes Modell über ein Kapital von 10.000 US-Dollar verfügt, um zu sehen, welches im Krypto-Handel das meiste Geld verdient. Zu diesen Modellen gehören Grok 4, Claude Sonnet 4.5, Gemini 2.5 pro, ChatGPT 5, Deepseek v3.1 und Qwen3 Max.
Jetzt denken Sie vielleicht: „Wow, das ist eine geniale Idee!“ Und Sie werden überrascht sein: Zum Zeitpunkt der Erstellung dieses Artikels befinden sich drei der fünf KIs im Minus, während Qwen3 und Deepseek, zwei chinesische Open-Source-Modelle, vorne liegen.

Richtig, die mächtigsten, proprietären, von Giganten wie Google und OpenAI betriebenen westlichen KIs, haben in etwas mehr als einer Woche bereits über 8.000 US-Dollar verloren, was 80 % ihres Krypto-Handelskapitals entspricht, während ihre Open-Source-Pendants aus dem Osten Gewinne erzielen.
Der bisher erfolgreichste Trade? Qwen3 bleibt profitabel und erzielt kontinuierlich Gewinne – und das nur durch eine einfache 20-fache Bitcoin-Long-Position. Grok 4 setzte während des Großteils des Wettbewerbs erwartungsgemäß auf eine 10-fache Long-Position bei Dogecoin und lag zeitweise zusammen mit Deepseek an der Spitze, steht jetzt aber kurz vor einem Verlust von 20 %. Vielleicht sollte Elon Musk ein Dogecoin-Meme posten, um Grok aus der Klemme zu helfen.

Unterdessen ist Google’s Gemini gnadenlos bärisch und setzt auf Short-Positionen bei allen handelbaren Krypto-Assets – eine Haltung, die ihrer generellen Krypto-Politik der letzten 15 Jahre entspricht.
Am Ende hat es eine Woche lang alle möglichen Fehltrades gemacht – so schlecht zu sein, erfordert auch Talent, besonders wenn Qwen3 einfach nur Bitcoin long geht. Wenn das das Beste ist, was proprietäre KI leisten kann, sollte OpenAI vielleicht besser weiterhin Closed Source bleiben, um uns vor Verlusten zu bewahren.
Der neue Benchmark für KI
Die Idee, KI-Modelle in einer Krypto-Handelsarena gegeneinander antreten zu lassen, bietet einige sehr tiefgehende Erkenntnisse. Erstens kann KI die Antworten auf Krypto-Handelsfragen nicht im Pre-Training erhalten, da diese unvorhersehbar sind – ein Problem, das viele andere Benchmarks betrifft. Mit anderen Worten: Viele KI-Modelle bekommen während des Trainings einige Antworten auf diese Tests, weshalb sie bei den Tests gut abschneiden. Einige Studien zeigen jedoch, dass schon kleine Änderungen an diesen Tests zu drastisch anderen Benchmark-Ergebnissen führen können.
Diese Kontroverse wirft die Frage auf: Was ist der ultimative Test für Intelligenz? Laut Grok 4-Schöpfer und Iron-Man-Fan Elon Musk ist die Vorhersage der Zukunft das ultimative Maß für Intelligenz.

Und wir müssen zugeben: Es gibt kaum eine ungewissere Zukunft als den kurzfristigen Preis von Kryptowährungen. Wie Azhang sagt: „Unser Ziel mit Alpha Arena ist es, Benchmarks näher an die reale Welt zu bringen, und dafür sind Märkte perfekt. Sie sind dynamisch, kompetitiv, offen und immer unvorhersehbar. Sie stellen KI auf eine Weise auf die Probe, wie es statische Benchmarks nicht können. Märkte sind der ultimative Test für KI.“
Diese Erkenntnis über Märkte ist tief in den libertären Prinzipien verankert, aus denen Bitcoin entstanden ist. Ökonomen wie Murray Rothbard und Milton Friedman wiesen schon vor über hundert Jahren darauf hin, dass Märkte grundsätzlich nicht von Zentralregierungen vorhergesagt werden können – rationale wirtschaftliche Kalkulation ist nur möglich, wenn Einzelpersonen, die Verluste tragen müssen, echte wirtschaftliche Entscheidungen treffen.
Mit anderen Worten: Märkte sind am schwersten vorherzusagen, weil sie von den individuellen Meinungen und Entscheidungen intelligenter Menschen weltweit abhängen – und sind daher der beste Test für Intelligenz.
Azhang erwähnt in seiner Projektbeschreibung, dass KI nicht nur auf Rendite handeln soll, sondern auch das risikoadjustierte Ergebnis berücksichtigen muss. Diese Risikokomponente ist entscheidend, denn ein schlechter Trade kann alle vorherigen Gewinne auslöschen – wie beim Zusammenbruch des Portfolios von Grok 4 zu sehen war.
Ein weiteres Problem ist, ob diese Modelle aus ihren Krypto-Handelserfahrungen lernen – technisch ist das nicht einfach, da das Pre-Training von KI-Modellen sehr teuer ist. Sie können mit ihrer eigenen oder fremden Trading-Historie feinjustiert werden, oder sie behalten die letzten Trades im Kurzzeitgedächtnis bzw. Kontextfenster, aber das bringt sie nur bis zu einem gewissen Punkt. Das letztlich richtige KI-Trading-Modell muss vermutlich wirklich aus eigener Erfahrung lernen – diese Technologie wurde kürzlich in der Wissenschaft angekündigt, ist aber noch weit von einem Produkt entfernt. Das MIT nennt sie selbstanpassende KI-Modelle.
Wie wissen wir, dass es nicht nur Glück ist?
Eine weitere Analyse dieses Projekts und seiner bisherigen Ergebnisse ist, dass es sich möglicherweise nicht von einem „Random Walk“ unterscheidet. Ein Random Walk ist wie das Würfeln bei jeder Entscheidung. Wie sieht das im Chart aus? Es gibt tatsächlich einen Simulator, mit dem Sie das testen können – und tatsächlich sieht es nicht viel anders aus.

Das Glücksproblem am Markt wurde auch von Intellektuellen wie Nassim Taleb in seinem Buch „Antifragilität“ ausführlich beschrieben. Er argumentiert darin, dass es aus statistischer Sicht völlig normal und möglich ist, dass ein Trader – zum Beispiel Qwen3 – eine ganze Woche lang einfach Glück hat, sodass er wie ein brillanter Denker wirkt. Taleb geht noch weiter: Er meint, dass es an der Wall Street so viele Trader gibt, dass einer von ihnen 20 Jahre lang Glück haben und einen gottgleichen Ruf aufbauen kann, sodass alle denken, er sei ein Genie – bis das Glück aufgebraucht ist.
Damit Alpha Arena also wirklich wertvolle Daten liefert, muss sie tatsächlich über einen langen Zeitraum laufen, und ihre Muster und Ergebnisse müssen unabhängig repliziert werden, wobei echtes Kapitalrisiko besteht, bevor sie als vom Random Walk verschieden angesehen werden kann.
Bislang ist es jedenfalls interessant zu sehen, dass Open-Source-Modelle wie DeepSeek, die kosteneffizient sind, besser abschneiden als ihre proprietären Konkurrenten. Alpha Arena war bisher eine großartige Unterhaltungsquelle, da sie letzte Woche auf X.com viral ging. Wie es weitergeht, kann niemand vorhersagen; wir müssen abwarten, ob sich das Glücksspiel des Schöpfers auszahlt: Fünf Chatbots mit 50.000 US-Dollar für Krypto-Wetten auszustatten.
Haftungsausschluss: Der Inhalt dieses Artikels gibt ausschließlich die Meinung des Autors wieder und repräsentiert nicht die Plattform in irgendeiner Form. Dieser Artikel ist nicht dazu gedacht, als Referenz für Investitionsentscheidungen zu dienen.
Das könnte Ihnen auch gefallen
70.000 On-Chain-Transaktionen beleuchten den Meteora-Airdrop: 4 Whale-Adressen erhalten 28,5 %, während über 60.000 Kleinanleger nur 7 % bekommen.
Im Rahmen des Airdrops tauchten auch umstrittene Adressen auf, darunter Personen, die mit internen Handels-Skandalen in Verbindung stehen, sowie auffällig handelnde Großinvestoren. Dies verschärft die Vertrauenskrise in der Community weiter und setzt das Projekt einem Risiko von Sammelklagen aus.

Die Geschichte der x402 Stiftung: Von der Förderung des x402 Protokolls bis zum goldenen Schlüssel für AI-Zahlungen
Wie verwandelt die x402 Stiftung eine einzige Codezeile in den goldenen Schlüssel für KI-Zahlungen?

Die Rückkehr des Großen Heiligen: Wie Sun Yuchen's „Sun Wukong“ zur nachträglich führenden Legende im Kontraktgeschäft wurde?
Der Aufstieg von Sun Wukong ist nicht nur ein weiteres präzises Positionieren von Justin Sun im Bereich der dezentralisierten Verträge, sondern symbolisiert auch das Wiedererstarken der chinesischsprachigen DEX-Narrative.

ClearBank leitet eine neue Ära der Blockchain-Zahlungen ein
ClearBank tritt dem CPN bei, um blockchain-basierte Zahlungen mit Circle-Integration zu verbessern. Die Zusammenarbeit konzentriert sich auf regulierte internationale Überweisungen mit Stablecoins. Es werden Innovationen erwartet, die die Kosten senken und die Abhängigkeit von traditionellen Systemen verringern.

