Hindi pa tapos ang laban sa crypto trading, nagtipon na naman ang mga AI para maglaro ng poker
Kumpara sa pakikipagsabayan sa merkado, ang kalaban ng AI sa pagkakataong ito ay isa pang AI.
Kumpara sa pakikipaglaro sa merkado, ang kalaban ng AI sa pagkakataong ito ay isa pang AI.
May-akda: Eric, Foresight News
May natitirang 4 na araw bago matapos ang NOF1 AI trading competition. Sa ngayon, nangunguna pa rin sina DeepSeek at Tongyi Qianwen, habang ang natitirang 4 na AI ay hindi pa rin nalalampasan ang simpleng paghawak lang ng Bitcoin. Kung walang magiging aberya, malamang na makuha na ni DeepSeek ang kampeonato. Ngayon, ang tanong na lang ay kung kailan malalampasan ng iba ang kita ng simpleng paghawak ng Bitcoin at kung sino ang magiging huling puwesto.
Bagama't ang AI trading ay nakaharap sa isang pabago-bagong merkado, ito pa rin ay maituturing na isang PvE na laro. Ang tunay na labanan kung "alin ang mas matalinong AI" at hindi lang "alin ang mas mahusay mag-trade" na PvP na laro ay isinagawa ng isang Russian na si Max Pavlov, na nag-imbita ng 9 na AI para maglaro ng Texas Hold'em Poker.
Ayon sa impormasyong makikita sa LinkedIn, matagal nang nagtatrabaho si Max Pavlov bilang product manager. Sa pagpapakilala niya sa AI poker website, sinabi rin niyang siya ay mahilig sa deep learning, AI, at poker. Tungkol naman sa dahilan ng pagsasagawa ng ganitong eksperimento, sinabi ni Max Pavlov na hanggang ngayon ay walang consensus ang poker community tungkol sa reliability ng reasoning ng large language models, at ang kumpetisyong ito ay isang pagpapakita ng kakayahan ng mga modelong ito sa aktwal na laro.

Marahil dahil hindi naging kapansin-pansin ang performance ni Grok sa trading, ni-retweet ni Musk kahapon ang screenshot kung saan nangunguna si Grok sa poker, na tila ba nais niyang "bumawi ng reputasyon".
Kumusta ang performance ng mga AI?
Sa poker championship na ito, 9 na kalahok ang inimbitahan. Bukod sa mga kilala nating Gemini, ChatGPT, Claude Sonnet (mula sa Anthropic na minsang tinustusan ng FTX), Grok, DeepSeek, Kimi (AI mula sa Moonshot AI), at Llama, naroon din ang Mistral Magistral na nakatuon sa European market at wika mula sa French company na Mistral AI, at GLM mula sa Beijing Zhipu, isa sa mga unang Chinese na nag-invest sa large language models.

Sa oras ng pagsulat, sina Gemini, ChatGPT, Claude Sonnet, Grok, at DeepSeek ay may positibong kita, habang ang natitirang apat ay pansamantalang nalulugi. Ang Llama mula sa Meta ang pinakatalo, nalugi na ng higit sa kalahati.

Nagsimula ang kumpetisyon noong ika-27 at magtatapos sa ika-31, kaya't mahigit isang araw at kalahati na lang ang natitira. Mula sa curve ng kita, sa unang araw pa lang ay nangunguna na ang Grok ng xAI, at kahit nalampasan siya ni Gemini, matagal siyang nanatili sa ikalawang puwesto. Sa 2,540 na rounds na naitala, nalampasan si Grok ni Claude Sonnet sa bandang 2,270 rounds, at ni ChatGPT sa bandang 2,500 rounds.
Ang DeepSeek, Kimi, at European player na Mistral Magistral ay nanatiling steady malapit sa break-even. Si Llama naman ay nagsimulang malugi nang tuluyan sa bandang 740 rounds matapos ang testing period, at nanatiling huling-huli. Si GLM ay nagsimulang mahuli sa bandang 1,440 rounds.
Maliban sa kita, ipinapakita ng technical statistics ang iba't ibang "ugali" ng bawat AI player.

Sa VPIP (Voluntarily Put $ In Pot), umabot sa 61% ang Llama, ibig sabihin ay higit kalahati ng rounds ay naglagay siya ng taya. Ang tatlong pinaka-steady na AI ay may pinakamababang bilang ng pagpasok, habang ang mga nangungunang AI ay may VPIP na nasa pagitan ng 25% hanggang 30%.
Sa PFR (Pre-Flop Raise), nangunguna na naman si Llama, at kasunod agad ang may pinakamataas na kita na si Gemini. Ipinapakita nito na ang Llama ng Meta ay isang sobrang agresibo at aktibong player, habang si Gemini ay agresibo rin ngunit mas balanse, marahil ay tumataya lang kapag maganda ang baraha at nagkataong nakatapat ang pabigla-biglang si Llama, kaya't nagkahiwalay ang kanilang resulta.
Kung isasama ang 3-Bet at C-Bet data, makikita na si Grok ay maituturing na isang steady ngunit hindi sobrang passive na player, na may malakas na pre-flop pressure. Ang ganitong istilo ang nagpanatili sa kanya sa unahan sa simula, ngunit ang agresibong estratehiya nina Gemini at ChatGPT, kasama ang pabigla-biglang si Llama, ang nagdala sa kanila sa tuktok.
Paano nag-aanalisa ang mga AI?
Nagtakda si Max Pavlov ng ilang pangunahing patakaran para sa kumpetisyon: blind bet na $10/$20, walang ante at hindi pinapayagan ang straddle, 9 na player ang sabay-sabay sa 4 na mesa, at kapag ang chips ay bumaba sa mas mababa sa 100 big blinds, awtomatikong pinupunuan ng system pabalik sa 100 big blinds.
Bukod dito, iisang prompt ang ginagamit ng lahat ng AI, may limitasyon sa maximum token count para hindi humaba ang reasoning, at kung may abnormal na response ay default na fold. Dinisenyo ni Max Pavlov na tanungin ang AI tungkol sa kanilang decision process tuwing maglalaro o pagkatapos ng isang round.
Bilang halimbawa, tingnan natin ang isang round ng laro habang isinusulat ang artikulong ito.

Matapos magbigayan ng small blind at big blind sina Claude at Gemini, inisip ni Llama na ang spade 8 at club Q ay "medyo malakas", kaya't puwedeng subukang makakuha ng straight o flush kaya nag-call ng 20.

Para kay DeepSeek, ang heart Q at 2 ay masyadong mahina para mag-call sa kanyang posisyon. Si GLM naman ay inisip na dahil may flush draw sa mid position, puwedeng mag-raise para palakihin ang pot laban sa loose na si Llama, at ang $80 ay sapat na pressure habang kontrolado pa rin ang pot. Si Kimi, na may parehong numero ng baraha ngunit magkaibang suit kay Llama, ay inisip na masyadong mahina ang kanyang kamay at may banta ng 3-Bet kaya hindi sulit mag-call.
Sa puntong ito, makikita na si Llama ay hindi nag-aanalisa ng data at posisyon, basta na lang tumataya, habang ang sumunod na tatlong AI ay nagdesisyon base sa posisyon at nakaraang data.

Matapos ang matapang na $260 bet ng GPT o3 dahil may hawak na A, parehong nag-fold sina Grok at Magistral. Lalo na si Grok, na nahulaan na baka AK o mas mataas na pares ang hawak ni GPT, at dahil sa pabigla-biglang laro ni Llama, napilitan siyang mag-fold.

Pagkatapos, nag-fold din sina Gemini, Llama, at GLM. Inisip ni GLM na malamang na malakas na pares o may A si GPT, habang si Llama ay hindi nag-analyze ng data, basta inisip lang na malakas ang kanyang kamay pero hindi sapat para mag-call ng $260.
Ang pagiging pabigla-bigla ni Llama, ang pag-iingat nina DeepSeek at Kimi, at ang tapang ni GPT ay kitang-kita sa round na ito. Sa huli, nakuha ni GPT ang pot kahit walang flop. Habang isinusulat ang artikulong ito, patuloy pang lumalaki ang kita ng apat na nangunguna, kaya't malamang na sa kanila manggagaling ang kampeon. Ang mga AI na hindi maganda ang performance sa trading ay muling napatunayan ang kanilang kakayahan sa poker.
Bagama't maraming laboratoryo ang gumagamit ng siyentipikong paraan para subukan ang kakayahan ng AI, para sa mga user, mas mahalaga pa rin kung mapapakinabangan nila ang AI. Ang DeepSeek na hindi magaling sa poker ay mahusay na trader, habang ang Gemini na parang baguhan sa trading ay namamayagpag sa poker table. Kapag lumalabas ang AI sa iba't ibang sitwasyon, makikita natin sa mga kilos at resulta na naiintindihan natin kung saan sila magaling.
Siyempre, ang ilang araw ng trading o ilang araw ng poker ay hindi sapat para husgahan ang kakayahan ng isang AI sa larangang ito o ang posibleng pag-unlad nito sa hinaharap. Ang desisyon ng AI ay hindi naaapektuhan ng emosyon, at ang proseso ng desisyon ay nakabatay sa underlying logic ng algorithm, kaya't minsan pati ang developer ay hindi alam kung saan talaga magaling ang AI na ginawa nila.
Sa pamamagitan ng mga entertainment test na ito na lumalabas sa lab, mas direkta nating nakikita ang lohika ng AI kapag nahaharap sa mga pamilyar nating gawain at laro, at mas napapalawak pa natin ang hangganan ng pag-iisip ng tao at AI.
Disclaimer: Ang nilalaman ng artikulong ito ay sumasalamin lamang sa opinyon ng author at hindi kumakatawan sa platform sa anumang kapasidad. Ang artikulong ito ay hindi nilayon na magsilbi bilang isang sanggunian para sa paggawa ng mga desisyon sa investment.
Baka magustuhan mo rin
Nagbigay ng senyas ang Fed ng 'pagtatapos ng QT': Ano ang ibig sabihin nito para sa presyo ng Bitcoin?
JPMorgan isinagawa ang unang fund-servicing transaction sa Kinexys blockchain nito
Quick Take Gumagamit ang sistema ng smart contracts upang awtomatikong magsagawa ng capital calls at mabawasan ang manu-manong proseso ng pondo. Ang paglulunsad na ito ay nakabatay sa naunang onchain repo tool ng JPMorgan na pinapagana ng Kinexys.

Ang mga 'proof of human' ID na suportado ni Sam Altman ay paparating na sa mga laro ng FIFA, NFL at Pudgy Penguins
Ang proyekto ni Sam Altman na “proof of human” na tinatawag na World ay nakipagsanib-puwersa sa nangungunang web3 gaming studio na Mythical Games, na siyang naglathala ng mga laro tulad ng FIFA, NFL, at Pudgy Penguin-branded games. Sinabi ng Mythical na dadalhin nila ang kanilang mga totoong user sa World network habang gagamitin ang digital ID technology ng kumpanya upang mapaghiwalay ang mga bot sa mga totoong tao.

