离开OpenAI和导师一起创业，他们要让机器人不编程也能像人一样干活

作者：金红

2017/11/19 10:10

两个月前，陈曦离开工作了一年半的OpenAI，和同事段岩、张天浩一起创立了Embodied Intelligence。

上周， Embodied Intelligence 宣布获700万美元种子投资，本轮融资由Amplify Partners领投，峰瑞资本（FreeS)、Lux Capital、SV Angels、11.2 Capital以及A.Capital跟投。

三个年轻的华人，成为硅谷冉冉升起的新星。

离开OpenAI和导师一起创业，他们要让机器人不编程也能像人一样干活

从左到右分别为陈曦（首席执行官）、Pieter Abbeel（总裁及首席科学家）、段岩（首席技术官）、张天浩（研究科学家）

拉上导师一起创业

Embodied Intelligence 之所以成为投资人争相的宠儿，离不开三个创始人的背景。

创业前，三人是OpenAI Pieter Abbeel 教授实验室的同事，从事前沿领域如模仿学习、强化学习、无监督学习以及元学习的研究工作。

OpenAI 是由特斯拉CEO Elon Musk 于2015年12月联合诸多硅谷大亨建立的人工智能非营利组织，希望能够预防人工智能的灾难性影响，推动人工智能发挥积极作用。

2016年6月21日，OpenAI 宣布了其主要目标，包括制造“通用”机器人和使用自然语言的聊天机器人。OpenAI研发主管Ilya Sutskever、OpenAI CTO Greg Brockman 硅谷知名创业加速器Y Combinator总裁 Sam Altman 以及连续创业家 Elon Musk 等人联合发表博文称：“我们正致力于利用物理机器人（现有而非OpenAI开发）完成基本家务。

OpenAI 聚集了世界级的工程师和科学家，其中就包括Pieter Abbeel。Pieter Abbeel 在人工智能领域非常有名，其在伯克利的实验室引领了诸多近期机器人学习领域的突破性进展，包括让机器人学会整理衣物，行走（仿真环境），以及通过反复试错或者VR示范数据来学习视觉驱动的操纵物体的技能。

离开OpenAI和导师一起创业，他们要让机器人不编程也能像人一样干活

Pieter Abbeel

CEO陈曦向雷锋网表示，最近五年学术圈有非常多突破，主要归结到深度学习的成功，和深度学习跟像强化学习领域的结合。于是，在完成自己的博士项目后，便拉上同事段岩、张天浩一起创立了Embodied Intelligence，而导师Pieter Abbeel 也加盟了这个新团队任总裁和首席科学家。

无需编程，机器人可自然学习新技能

基于创始人们在模仿学习、强化学习、无监督学习以及元学习等领域的研究成果，Embodied Intelligence 开发了一款软件，可让任何人通过在虚拟现实（VR）设备里示范教学来让机器人获得新的技能。这些示范数据会被用来训练深度神经网络，而训练完毕的智能控制器使用强化学习进一步改进。通过这套流程，机器人可以轻松地学会广泛的技能。

传统的机器人编程非常耗费时间，只有专业人员才能进行。Embodied Intelligence 提供的智能模块可以接入任何市面上的机器人，让它们可以自然地学习新的技能，无需编写晦涩难懂的代码。

CEO陈曦向雷锋网进一步解释这项技术：

第一步是通过人类的演示进行学习，但这个要比简单的复制要复杂，因为人类演示是很难把所有的变化都覆盖到，所以学习的结果是需要泛化的能力，就算是人类示教没有演示到的情况下也能完成任务。

第二步是机器人可以进行自我学习，具体的学习方法叫做深度强化学习(Deep Reinforcement Learning), 这个是通过机器人自己试错来进行，可以找到比示教更优的方案。不过不是所有场景都需要这一步，对于不少场景来讲，做到跟人的示教一样快，一样好就可以了。

在他们发布在youtube的视频中，他们使用这种方法训练一个两臂机器人从桌上拾起球或者打绳结。Embodied Intelligence 团队们戴着 VR 头显，拿着动作追踪器，不断地在数字世界中向机器人展示如何完成任务。然后，机器人可以从这些数据中学习。

技术太前沿短时间无法落地？

一般来说，学术圈和工业圈的技术差距在5年左右。对于深度强化学习落地到工业圈，雷锋网咨询了几位机器人领域创业者，他们均表示目前确实有很大进展，尤其是Pieter Abbeel 在这个领域更是领军人物做出了突出贡献，不过要落地到工业圈，需要8到10年。

对此，陈曦向雷锋网回应了一句哈哈。对于是否有落地困难的问题，陈曦表现地很乐观，表示如果从硬件上面来讲，其实这个公司早两年还真做不了，运算能力(GPU)最近两年翻了好几倍，然后消费级的VR设备也是最近才开始普及。而工业机器人方面，则是已经成熟很久了；而从难度来讲，之所以选这个就是因为团队有能力可以做出来。

离开OpenAI和导师一起创业，他们要让机器人不编程也能像人一样干活

从左到右分别为Pieter Abbeel（总裁及首席科学家）、陈曦（首席执行官）、段岩（首席技术官）、张天浩（研究科学家）

“第一，我们做的东西真的跟产业中所有看到过的解决方案，不过是市面上的还是在研发的都完全不一样。我们应该是极少数使用端到端学习(end-to-end learning)的公司，这个应该解释了为什么会有人说我们做的很学术。

第二是看这个技术本身，最主要的落地门槛在于实际应用中的可靠性。在学术界中端到端学习出来的算法一般是70-90%的成功率左右，这个离工业应用肯定是有一定距离的。但我们团队最近的研究成果显示只用30分钟的示教数据，就可以在很多场景里面达到90%的成功率。那么我们认为，运用更多示教数据和进一步的算法优化，我们是可以达到工业的要求的。”

作为唯一的国内投资方，峰瑞资本创始人李丰对于这个项目给予了高度评价，

“人工智能发展到今天，真正用到决策智能的人工智能项目是很少见的。Embodied Intelligence做的机械臂的控制包括通过有监督学习做无序抓取，是一项有挑战的事业。不过，Embodied Intelligence的创业团队，包括 Peter Abbeel，是行业中做人工智能最顶级的研究者和创业者。且这件事是适合中美制造业国情的，应用潜力巨大。”

陈曦向雷锋网表示目前已有跟数个工厂和系统集成商合作，已经确认了一些具体场景，接触下来是发现能够应用的地方很多，接下来希望挑一些有代表性的，能体现他们方案不一样的地方。

“pick and place（抓取）是比较大的一块，但是比较简单的环境下面的pick and place就不是我们关注的了，因为其他解决方案也能做到。我们主要关注一些传统方法难以解决的问题，例如抓取的原料是deformable （可变形的），像电线，数据线之类的wire bundle （导线束）。

除去抓取之外，我们也会看需要很多contact （物体间接触）的场景，例如说assembly（装配）。这也是传统来讲很难解决的问题。例如kitting（物料配送），从物料仓库捡取原件到一个kit（套件）里面，然后会被运到总装线上。这个kitting的步骤，如果是刚体的抓取是比较简单的。有很多现成的方案只需要一个CAD模型，然后会match（匹配）到3D摄像机里面的point cloud（点云数据），然后计算抓取点。但是像电线这样会变形的东西，这样的现有方法就不足够了，因为电线有太多种变形的可能，match 3d point cloud to fixed model（匹配3d点云到固定模型）的方法就很难完成了。

定性来讲的话，是任何通过手动编程难以完成的场景都会是很好的candidates（候选者），比较有代表性的有刚刚说的deformable objects picking（可变形的物体抓取）。或者assembly 类型的场景。但是我们没有讲太具体的场景，因为是under NDA（保密）。抽象来讲的话，只要是人可以遥控机械臂完成的工作，我们都可以从示教中学习。也就是说如果是需要硬件上的创新（就算由人来控制一个机械臂，也是不能完成的）的场景，就不是我们的关注范畴。

对于我们方案来讲，不管是刚体的抓取还是柔性物体的抓取，学习方法是完全一样的。唯一的不一样可能是因为物体是柔性的，有更多的variations（变化），而需要更多的训练数据。”

陈曦向雷锋网表示，目前项目都在朝着预期进展，“如果说有什么意外的话，那应该是应用场景比想象中要多，这些是很多在学术界比较难接触到的。”

接下来，陈曦希望在国内也找一些早期应用场景。