Deepseek v3.2... новый открытый SOTA (1 декабря)
Упрощённый поток информации Только что в метро изучал релиз deepseek...
Ниже краткая структурированная информация,
1/ Релиз Deepseek в этот раз показал действительно впечатляющие результаты.
- Безусловный open-source sota;
- Все основные возможности соответствуют также и закрытым передовым моделям;
2/ В технологическом плане ничего особенно нового,
- По-прежнему используется DSA + post train, доля более 10% — не большая новость;
- Новый момент — используя те же вещи из экспериментальной версии v3.2, результат получился настолько хорошим, что напрямую конкурирует с такими последними SOTA как gemini3.0;
- Научная литература уже не так влияет на рыночный нарратив; на этот раз результаты возможностей будут более наглядными.
3/ Все больше всех волнует "коллапс вычислительных мощностей"? Этого не происходит.
По словам самой deepseek, мы по-прежнему отстаём от самых передовых моделей.
С другой стороны, "знаниевая крепость" на уровне модели эфемерна, вычислительная мощность по-прежнему остаётся фактором дифференциации.
Мнение исследователя Deepseek Zhibin Gou: gemini3 доказывает pretrain... deepseek 3.2 доказывает RL;
Продолжайте масштабироваться на всех уровнях; не позволяйте шуму "стены" мешать.
Более тяжелый RL, более длинный CoT, большее потребление вычислительных ресурсов при выводе; нельзя сделать вывод о дефляции вычислительных мощностей.
4/ С точки зрения применения... определённо позитивно. Цитируя мнение участника сообщества,
-
«Потребность в вычислительных мощностях бесконечна, на самом деле текущая стоимость token для практического применения очень мала, только благодаря аппаратным и модельным инновациям, которые геометрически снижают стоимость, возможен массовый запуск»
-
Для компаний, которые хотят создать крепость приложения за счет “возможностей модели” (например, некая OAI), это, напротив, серьёзное ослабление нарратива.
5/ Deepseek сам признаёт, что эффективность использования tokens “inferior”...В этой Speciale-версии используется большее количество tokens... (там, где красная рамка)...
6/ Бонус: Zhibin Gou говорит, что они потратили год на доведение v3 до предела... Некоторые участники групп в Планета считают, что v3 выжата досуха, возможно, следующая версия наконец будет v4?
7/ Кажется, сегодня 3-я годовщина запуска ChatGPT...
Сегодня вечером на рынке, вероятно, будет довольно волатильно... некоторые беспорядочные макроэкономические факторы из Японии + BTC вмешивается;
Следующее небольшое катализирующее событие, возможно, будет amazon re:invent; утром в группе немного обсудили перспективы.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Прогноз цены XRP: XRP входит в фазу охлаждения после всплеска кредитного плеча в ноябре

Прогноз цены на золото: XAU/USD продолжает снижаться, продавцы нацеливаются на уровень $4,400
DeBox присоединяется к MyTokenCap для повышения уровня рыночной аналитики Web3 по всей Азии
Sei призывает держателей USDC.n перейти на новую версию до обновления SIP-3
