BBS » 时事新闻专区 » 斯坦福火遍全网的做菜机器人，原来还得靠遥控 » 发表回复

发表回复

用户名

游客 [会员登录]

标题

(可选)

内容

Html 代码可用
表情可用
Discuz!代码可用
[img] 代码可用

禁用 URL 识别
禁用表情
禁用 Discuz!代码
启用 Html 代码
使用个人签名
接收新回复邮件通知

字体

大小

简单功能

上传附件	描述

文件尺寸: 小于 25000 kb

[完成后可按 Ctrl+Enter 发布] 恢复数据

主题回顾

匿名发表于 2024-1-11 10:15

[attach]232548[/attach]

见过机器人在工厂拧螺丝，那大伙儿见过在家里炒菜的机器人吗？

相信有不少差友，在几天前就已经刷到了一个机器人下厨的视频了吧。

[attach]232549[/attach]

撕开生菜包装，切菜，打鸡蛋，一套操作行云流水，它甚至还会在往锅里倒青菜的时候，拿锅盖来挡一下。

[attach]232550[/attach]

不瞒大伙儿说，世超看到视频的第一反应是：啊？？？

我对机器人做饭的印象，还停留在食堂里的那个刀削面机器人。

[attach]232551[/attach]

像视频里这种跟人类无异的操作，如果不是亲眼所见，或许没人敢相信这是一个机器人干的。

这个机器人，就是斯坦福大学的 Mobile ALOHA 机器人项目。

根据项目负责人发布的视频，除了会做饭以外， ALOHA 机器人还精通各种家务。

[attach]232552[/attach]

浇花逗猫煮咖啡，擦地洗碗叠被洗衣服，这些家务活儿完全不在话下。

特别是套枕套最后抖那俩下，我仿佛看到了我本人。。。

[attach]232553[/attach]

反正视频发出来之后，在国内外引起了不小的热度。

网友热评， “只要这玩意儿不会趁我睡着的时候杀了我，我真的很需要它”“ 下次如果家里人再催结婚生孩子，就把视频发到家族群里。 ”

但，也有人质疑视频经过了加速和剪辑处理，就像上次谷歌发布的 Gemini 演示视频那样，是真是假还有待证明。

很快，网上就流传出了 ALOHA 机器人翻车的视频。

一言不合就打碎酒杯和餐盘、识别不清障碍物撞上柜子、把锅烧糊…

[attach]232554[/attach]

智能程度跟前几天视频里灵活的机器人相比，简直判若两 “机” 。

有意思的是，这个视频的爆料人，就是项目团队的内部人员。

上周末的时候， Mobile ALOHA 的项目共同负责人 Tony Z.Zhao ，在 X 平台上发布了机器人的失败花絮，并澄清了外界对于机器人 “完全自动” 的误会。

[attach]232555[/attach]

事实上， ALOHA 机器人并不是全自动的，而是自动 + 遥控的混合模式。

世超认真翻了翻 GitHub 上的 Mobile ALOHA 项目，在自主模式下，人类需要先操控机械臂打个样，才能让 ALOHA 机器人学习类似的动作。

[attach]232556[/attach]

前面视频里的各种复杂家务活儿，都是有人在后面遥控的。

就像这样。

[attach]232557[/attach]

而且，并不是只要人类演示了，机器人就能百分百学会。

在论文中也有提到， ALOHA 机器人自动擦红酒渍的成功率有 95% ，推椅子是 80% ，而炒虾只有 40% 。

世超盲猜，可能是一开始的视频效果过于惊艳，一传十十传百，这才让 ALOHA 机器人背上了 “保姆机器人已经落地” 的名头。

但就像 Tony Z.Zhao 推文里说的那样， “机器人还没准备好接管世界！” ，现在的机器人离我们想象中的全能保姆，还差得远。

所以，与其大肆去吹这次的 ALOHA 机器人有多牛，倒不如说它给之后的机器人研发都打了个样。

根据英伟达科学家 Jim Fan 的说法，数据一直是机器人技术的致命弱点。

[attach]232558[/attach]

而项目团队对 ALOHA 机器人的定义，恰恰就是 “ 一种用于数据收集的低成本全身远程操作系统” 。

怎么个意思呢？

在算法上，他们基于 Transformer 开发了一种动作学习算法 ACT 。

这种算法，能够让 ALOHA 机器人在 15 分钟的动作演示后，模仿人类做出相似的动作。

[attach]232559[/attach]

你可以理解成，人类操控机械臂的过程，也是数据收集的过程。接着，再利用收集好的数据来进行一波 “模仿秀”。

就比如，你把擦玻璃这个动作给机器人提前演示了 50 次，很大概率最后真就训练成功了。

而除了算法上的巧妙设计以外， ALOHA 机器人还有个优点就是低成本。

在硬件配置上，项目团队给机器人装上了两组机械臂，还有一个仓库里用来运货的 AGV 移动底盘，相当于机器人的手脚。

[attach]232560[/attach]

从团队公开的成本清单来看，费用主要也是集中在移动底盘和机械臂上，其他零部件的成本并不算高。

[attach]232561[/attach]

而且，将近 3.2 万美元（折合人民币 22.7 万人民币）的造价成本，跟波士顿动力 Atlas 将近 200 万美元的成本比起来，也是小巫见大巫了。

等以后技术成熟了，花二十多万买个机器人养老，好像也不是不行。

更重要的是，这次的 Mobile ALOHA 直接来了波开源，包括硬件代码、数据集还有教程都对外公开了。

开发者们你贡献一点我贡献一点，说不定哪天全能保姆机器人就真落地了。

包括前几天， ALOHA 机器人势头正旺的时候， DeepMind 也趁热打铁发布了一系列关于机器人的最新进展。

[attach]232562[/attach]

国外有个叫 Figure 的机器人公司，他们家的人形机器人现在甚至具备了自主学习能力，看个视频就能学会煮咖啡。

反正，世超对于今年机器人的发展还挺期待的。

在人工智能界，一直有个莫拉维克悖论。

通俗来解释就是，明明 AI 在算数学题这种需要逻辑推理能力的事情上，都能够做得很好，但感知能力和运动能力却连三岁小孩都不如。

但这次 ALOHA 机器人的出现，的确有了那么一点真正意义上 “智能” 机器人的苗头。

咱们也可以展望展望，今年大模型 + 机器人的组合究竟能碰撞出什么样的火花。

来源：差评

预览帖子

发表回复

主题回顾