Alpha Arena розкриває недоліки AI-трейдингу: західні моделі втратили 80% капіталу за тиждень
Ринок — це остаточний тест для AI.
Автор: Juan Galt
Переклад: AididiaoJP, Foresight News
Чи може AI торгувати криптовалютою? Інженер-комп’ютерник і фінансист із Нью-Йорка Jay Azhang тестує це питання через Alpha Arena. У цьому проєкті найпотужніші великі мовні моделі змагаються одна з одною, кожна з яких має капітал у 10 000 доларів, щоб з’ясувати, яка зможе заробити більше грошей на торгівлі криптовалютою. Серед цих моделей — Grok 4, Claude Sonnet 4.5, Gemini 2.5 pro, ChatGPT 5, Deepseek v3.1 та Qwen3 Max.
Можливо, ви зараз думаєте: «Вау, яка чудова ідея!» І будете здивовані, дізнавшись, що на момент написання цієї статті три з п’яти AI перебувають у збитку, а лідирують два китайські open-source моделі — Qwen3 і Deepseek.

Саме так, найпотужніші західні закриті AI, якими керують такі гіганти, як Google та OpenAI, за трохи більше ніж тиждень втратили понад 8000 доларів, тобто 80% свого торгового капіталу в криптовалюті, тоді як їхні open-source колеги зі Сходу отримують прибуток.
Найуспішніша торгівля на сьогодні? Qwen3 зберігає прибуток і продовжує заробляти, просто використовуючи просту довгу позицію по bitcoin з плечем 20x. Grok 4, як і очікувалося, більшу частину часу тримав довгу позицію по dogecoin з плечем 10x, і колись разом із Deepseek був на вершині рейтингу, але зараз наближається до збитку в 20%. Можливо, Ілон Маск повинен опублікувати якийсь мем із dogecoin, щоб допомогти Grok вибратися з халепи.

Тим часом Gemini від Google безжально грає на пониження, відкриваючи короткі позиції по всіх доступних для торгівлі криптоактивах, що відповідає їхній загальній криптовалютній політиці за останні 15 років.
Зрештою, протягом тижня вона зробила всі можливі помилкові угоди — щоб так погано торгувати, теж потрібен талант, особливо коли Qwen3 просто тримає довгу позицію по bitcoin. Якщо це найкращий рівень, який можуть запропонувати закриті AI, можливо, OpenAI варто залишатися закритими, щоб ми не зазнали збитків.
Новий бенчмарк для AI
Ідея протиставити AI-моделі одна одній на арені криптовалютної торгівлі має дуже глибокі інсайти. По-перше, AI не може отримати відповіді на тести з торгівлі криптовалютою під час попереднього навчання, оскільки це непередбачувано — це проблема, з якою стикаються інші бенчмарки. Іншими словами, багато AI-моделей під час навчання отримують відповіді на деякі з цих тестів, тому під час тестування вони показують гарні результати. Але деякі дослідження показують, що навіть невеликі зміни в цих тестах можуть призвести до значних змін у результатах AI-бенчмарків.
Ця суперечка породжує питання: який остаточний тест для інтелекту? За словами творця Grok 4, шанувальника Iron Man Ілона Маска, здатність передбачати майбутнє — це найвища міра інтелекту.

І треба визнати, що немає нічого більш невизначеного, ніж короткострокова ціна криптовалюти. Як каже Azhang: «Мета нашої Alpha Arena — зробити бенчмарки ближчими до реального світу, і ринок для цього ідеальний. Він динамічний, конкурентний, відкритий і завжди непередбачуваний. Він кидає виклик AI так, як це не можуть зробити статичні бенчмарки. Ринок — це остаточний тест для AI».
Таке розуміння ринку глибоко вкорінене у ліберальних принципах, на яких засновано bitcoin. Економісти, такі як Мюррей Ротбард і Мілтон Фрідман, ще понад сто років тому зазначали, що ринок по суті непередбачуваний для центрального уряду, і лише ті, хто несе ризики втрат, можуть приймати раціональні економічні рішення.
Іншими словами, ринок — це найскладніше для прогнозування явище, оскільки він залежить від особистих поглядів і рішень розумних людей у всьому світі, і тому є найкращим тестом для інтелекту.
У своєму описі проєкту Azhang зазначає, що інструкції для AI щодо торгівлі враховують не лише прибуток, а й прибуток з урахуванням ризику. Цей ризиковий аспект є критично важливим, оскільки одна невдала угода може знищити всі попередні прибутки, як це сталося з портфелем Grok 4.
Є ще одне питання — чи навчаються ці моделі на власному досвіді торгівлі криптовалютою. Технічно це складно реалізувати, оскільки попереднє навчання AI-моделей дуже дороге. Вони можуть донавчатися на власній або чужій історії торгівлі, навіть можуть зберігати останні угоди у короткостроковій пам’яті чи контекстному вікні, але це лише часткове рішення. Зрештою, правильна AI-модель для торгівлі, ймовірно, повинна навчатися на власному досвіді — цю технологію нещодавно анонсували в академічних колах, але до продукту ще далеко. MIT називає їх самонавчальними AI-моделями.
Як ми можемо знати, що це не просто везіння?
Ще один аналіз цього проєкту та його поточних результатів полягає в тому, що їх не можна відрізнити від «випадкового блукання». Випадкове блукання — це як кидати кістки для кожного рішення. Як це виглядає на графіку? Насправді існує симулятор, який дозволяє це перевірити; і виглядати це буде майже так само.

Проблема везіння на ринку також була досить детально описана такими інтелектуалами, як Насім Талеб, у його книзі «Антикрихкість». Він стверджує, що з точки зору статистики цілком нормально і можливо, щоб трейдер, наприклад Qwen3, був щасливчиком цілий тиждень поспіль! Це може створити ілюзію видатних аналітичних здібностей. Талеб йде ще далі, вважаючи, що на Wall Street достатньо трейдерів, щоб хтось із них міг бути у виграші 20 років поспіль, здобути майже божественну репутацію, і всі навколо вважатимуть його генієм — поки не закінчиться везіння.
Тому, щоб Alpha Arena надала цінні дані, вона має працювати дуже довго, а її моделі та результати повинні бути незалежно відтворені з реальним ризиком капіталу, перш ніж їх можна буде визнати відмінними від випадкового блукання.
Зрештою, наразі цікаво бачити, як такі open-source моделі, як DeepSeek, які є економічно ефективними, перевершують своїх закритих конкурентів. Alpha Arena досі була чудовим джерелом розваг, оскільки минулого тижня стала вірусною на X.com. Ніхто не знає, куди це приведе; нам доведеться подивитися, чи виправдається ставка її творця: чи принесе 50 000 доларів, виділених п’яти чат-ботам для криптовалютного гемблінгу, зрештою прибуток.
Відмова від відповідальності: зміст цієї статті відображає виключно думку автора і не представляє платформу в будь-якій якості. Ця стаття не повинна бути орієнтиром під час прийняття інвестиційних рішень.
Вас також може зацікавити
Повернення Великого Мудреця: як "Сунь Укун" від Sun Yuchen створює легенду про контракти, що приходять пізніше, але перемагають першими?
Злет Sun Wukong є не лише черговим точним кроком Sun Yuchen у сфері децентралізованих контрактів, а й символізує нове відродження китайського DEX-наративу.

ClearBank відкриває нову еру у блокчейн-платежах
У короткому викладі: ClearBank приєднується до CPN для підвищення ефективності платежів на основі блокчейну з інтеграцією Circle. Спільні зусилля зосереджені на міжнародних переказах зі стабільними монетами під регулюванням. Очікується, що інновації зменшать витрати та залежність від традиційних систем.

Масові випуски монет спричиняють зростання активності на крипторинку
Згідно з даними Tokenomist, з 27 жовтня по 3 листопада відбудуться випуски монет на суму 653 мільйони доларів. Монети SUI, GRASS і SIGN зазнають значного збільшення пропозиції на ринку. Щоденні випуски продовжуються для основних проектів, таких як Solana, Worldcoin і Dogecoin.

JPYC Inc. запускає перший в Японії стейблкоїн, забезпечений єною
JPYC Inc. випустила перший в Японії офіційно визнаний стейблкоїн, забезпечений єною, під назвою JPYC. JPYC працює на декількох блокчейнах і має на меті досягти обігу у 10 трильйонів єн. Японські технологічні та фінансові компанії підтримують інтеграцію JPYC у різні екосистеми.

