最新研究:嵌入大模型的AI扫地机器人多项任务翻车,成功率仅40%
作者:新浪财经
AI实验室Andon Labs最近进行的一项评估显示,搭载顶级大模型的扫地机器人在简单家务任务中表现糟糕,成功率远低于人类。实验要求机器人执行“把黄油递给人”的多步骤指令,包括跨房间定位、区分包装、寻找移动位置的人类、完成交付并返回充电。结果显示,Gemini 2.5 Pro 的成功率仅 40%,Claude Opus 4.1 为 37%,GPT-5 为 30%,明显落后于人类的表现。
研究指出,大模型在空间推理、环境理解、长期任务规划等方面依然存在明显短板。
研究团队强调,娱乐之外也有严肃隐患:某些机器人可被诱导泄露机密文件,部分机型无法识别楼梯风险而从高处跌落,暴露当前大型语言模型(LLM)与机器结合的安全漏洞。
在资本大举押注机器人时代的当下,这项研究提醒人们:强大的文本生成能力不代表能稳定、安全地在物理世界执行任务,AI机器人距离真正进入家庭仍有大量工程与安全问题需要解决。
0
0
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
PoolX:锁仓获得新代币空投
不要错过热门新币,且APR 高达 10%+
立即参与!
你也可能喜欢
【比推每日新闻精选】特朗普:若在关税案中败诉,美国可能会沦为第三世界国家的地位;CZ:8年前买入的BNB一直持有至今;The ETF Store总裁:预计未来两周内首批现货XRP ETF将推出
Bitpush•2025/11/03 20:18

18个月周期魔咒:加密领域的产品困境与转型陷阱
Bitpush•2025/11/03 20:18

Solana 代币启动实战指南:从经济学设计到执行策略
Bitpush•2025/11/03 20:18

美联储理事库克:当前政策适度具有限制性,通胀面临上行风险
Chaincatcher•2025/11/03 19:01
热门新闻
更多加密货币价格
更多Bitcoin
BTC
$106,418.59
-3.31%
Ethereum
ETH
$3,570.23
-7.47%
Tether USDt
USDT
$0.9998
-0.02%
XRP
XRP
$2.28
-8.68%
BNB
BNB
$982.74
-9.04%
Solana
SOL
$163.67
-11.28%
USDC
USDC
$0.9998
-0.02%
TRON
TRX
$0.2810
-5.10%
Dogecoin
DOGE
$0.1654
-9.70%
Cardano
ADA
$0.5448
-9.08%
交易热门币种
新用户可获得价值 6200 USDT 的迎新大礼包
立即交易
立即成为交易者?新用户可获得价值 6200 USDT 的迎新大礼包
立即注册