アリババがより効率的なQwen3-Next人工知能モデルを発表
Jinse Financeによると、Alibaba傘下のTongyi Qianwenは次世代基盤モデルアーキテクチャ「Qwen3-Next」を発表し、このアーキテクチャに基づく「Qwen3-Next-80B-A3B」シリーズモデルをオープンソース化しました。この構造はQwen3のMoEモデル構造と比較して、以下のコア改良が行われています:ハイブリッドアテンションメカニズム、高スパースMoE構造、一連のトレーニング安定性に優れた最適化、そして推論効率を向上させるマルチトークン予測メカニズムです。Qwen3-Nextのモデル構造に基づき、Alibabaは「Qwen3-Next-80B-A3B-Base」モデルをトレーニングしました。このモデルは800億(80 billions)パラメータを持ちながら、実際にアクティブになるのは30億(3 billions)パラメータのみです。このBaseモデルはQwen3-32Bのデンスモデルと同等かそれ以上の性能を実現しつつ、トレーニングコスト(GPU hours)はQwen3-32Bの10分の1以下、32k以上のコンテキストでの推論スループットはQwen3-32Bの10倍以上となり、極めて高いトレーニングおよび推論コストパフォーマンスを実現しています。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
ある大口投資家がHyperLiquidに600万USDCを入金し、複数のトークンでロングポジションを取った
Kaito AI創業者:リスク管理のために短期的には悲観的な姿勢を保ち、長期的には楽観的なビジョンで未来を築く
Abraxas Capitalは最近再びETHのショートポジションを決済し、11月以降で累計2億ドル以上を決済しました
半木夏:今週のFRB利下げにより流動性が正常に戻り、今週さらには今月、市場は全面的な上昇を迎えるだろう。
