雷锋网新智造按:最具权威性的人工智能与机器人创新公司榜单「新智造成长榜 2017 」评选正在进行中。本文来自星河互联人工智能事业部总经理、合伙人刘玮玮,他也是本次雷锋网新智造成长榜的评委。在文中,他分享了对人工智能创业项目进行技术验证的方法。在某种程度上,这也是他评选具有成长潜力公司的标准,对有融资需求的AI创业公司以及有项目需求的投资公司也有借鉴意义。点击“链接”可了解关于雷锋网新智造成长榜的详细消息。欢迎广大企业报名参与。
大家好,我是刘玮玮。
前不久,我做了一次线下分享,内容主要是讲我们眼中人工智能领域的一些新变化,并且给创业者提了几个建议。我认为创业者无论是把人工智能当做噱头也好,加分项也罢,项目都应该回到创业的本质——解决问题。作为创业者首先要根据自己所在行业的场景,去根据问题寻找人工智能的解决方案,而不是反过来拿着火热的概念到处去找还能再拿人工智能“+”什么?
在2017下半年,那些单纯依靠算法、SDK讲故事的项目,需要加快商业模式验证的速度。并且,软硬件的整体解决方案将会对客户有更直接的价值。在技术能力之外,创业者的行业纵深与渠道拓展能力,将会越来越重要。
我先给大家一个技术验证的总观点——使用科学的态度进行技术验证。那么究竟什么是科学的态度?我认为翻译过来其实就是八个字:大胆假设,小心求证。
你可以对过程中的任何感觉不合理的地方进行存疑,并且小心求证,绝不能武断的下结论,错杀好项目。无论人工智能领域还是其他前沿科技领域,我们在鉴别项目时,都会关注其团队、产业、商业模式、运营、竞争、技术等方面。
具体讲技术验证,我有以下分享的点:
第一,团队要有学术积累和行业纵深能力
这里面我们要特别强调一下,我们说的团队具备的能力,不是指能力都集中在某一个人(比如创始人、CEO等)身上,而是说希望能通过合伙的形式,使核心团队整体具备技术、工程、行业经验、运营等核心能力。
1. 有无优秀学术背景
团队需要有技术带头人,比如第四范式的杨强教授是AAAI的fellow;商汤科技、旷视科技、格林深瞳、地平线等等,都有其技术带头人。
除了团队带头人履历外,团队的技术背景还可以通过顶会(ICCV、CVPR、ECCV等)和顶级的Paper发表情况来进行识别。
此外,专利情况也是需要了解的内容。可以通过专利,看一下团队之前的技术分布领域。之前有一些所谓的科学家创业,翻看其多年的专利积累和学术论文,发现其研究方向和本项目并不是强相关,这种情况需存疑并进行进一步验证。
2. 工程实践能力
我们回顾一下2016年人工智能的创业项目,会发现大量的天使期项目都是以团队具备算法能力作为切入点,进行天使轮、PreA轮融资,比如人脸识别SDK、手势交互SDK、基于开源框架做的分类器等等。
很多SDK以及软件平台当时只是实验室产品,没有考虑成本、计算资源、特定领域的识别效果、客户场景的可集成度等因素,距离真正的商用还有差距。因此,需要团队中有必要的工程实践能力与经验,能快速处理工程中问题。
除了技术方面之外,快速跟进客户需求,快速迭代、上线发布的能力,也是项目的工程实践能力的另一方面。
3. 行业纵深能力
行业纵深能力是指,团队中有没有该领域的渠道资源、客户资源、上下游合作的资源。这个能力对于产品能否快速商业落地极其重要。不同的产业有其相应的壁垒和特点,被技术改造和合作的难度是不一样的。比如,以无人驾驶/辅助驾驶对应的汽车产业链举例,大量的从视觉算法切入的初创项目,在和主机厂、一级供应商寻求前装落地过程中,都是不占优势的,未来还会面临各种传感器的数据融合,算法的打通,挑战巨大。
行业纵深能力举例:面对汽车复杂的产业链,仅仅依靠算法优势期望切入汽车前装市场,是很艰难的。
第二,技术及产品验证,黑盒验证尽量充分
对TS之前的PreDD阶段的技术验证,一般不会接触到实际代码,算法层面的调研都比较少。一般以黑盒测试和专家验证、第三方机构验证为主。投资人也要熟悉细分领域基本的技术原理和判别指标。
1. 关于数据源
人工智能的三要素:算法、计算力、大数据。目前的人工智能算法大都基于深度学习实现,深度学习训练神经网络模型是基于海量的训练集,同时需要训练集中的数据具有多样性和完备性。
随着各种深度学习算法的框架的开源,相信未来的基础框架层的竞争壁垒会越来越低。同时,专有的GPU、FPGA芯片、专用ASIC等也会慢慢攻克本地化、扩展性等问题。
现在的深度神经网络训练大多是监督学习模式,所以需要对每个学习样本依照完成的任务建立相应的监督标签,这是耗时耗人力的工作,海量数据训练集变成了各个厂家比拼的核心资源。
像安防、医疗、金融等领域均拥有海量结构化的带标记的数据,成为了人工智能技术上最先落地的领域。因此,基于行业的独有的海量训练数据集便成为稀缺资源,投资人看项目时,需要仔细甄别、查看数据源的质量、真实性等维度。
2. 黑盒测试,应明确测试条件
上文我们谈到,在PreDD阶段,很难接触项目的代码层和过于详细的算法层。那么,一个充分的黑盒测试就显得极其重要。
以往在看项目时,往往会听项目介绍如下:
“我们的算法在XX比赛中场景识别准确率达到XX%”
“我们的摄像头在多种测试场景下,物体识别准确率达到XX%”
“我们的语音识别准确率达到XX%”
如果大家之前做过软件或者硬件测试就会知道一个常识,即一切不谈测试条件的测试结论都是无意义的。不能说项目故意误导,但作为投资人必须要对测试条件进行详细的鉴别。
明确了测试条件后,如果有条件,可以现场进行简单测试。比如,测试远场麦克风阵列,就可以根据麦克风阵列标定的远场距离进行唤醒测试、交互测试等等。
3. 投资人应提供独立的测试集,并尽量现场测试
我们在看模式识别的一些项目时,会发现项目核心其实就是分类器。比如,一个医疗人工智能看片项目,我一般会要求项目使用我提供的样片,并且现场上传到项目的SaaS中。可以的话,让机器当场操作,出结论,并与实际结果进行比对,验证分类器的准确率。
如果投资人不提供独立测试样本,一般项目会提供它之前训练好的测试样本进行展示。就好比一个人用准备好的10道题目来证明自己的知识水平,很难讲是真实的水平还是提前背好的。
举例:黑盒测试一个客服机器人
以基于深度学习的XX客服机器人项目举例:通用测试—1000个问题的测试集。
第三,上下游访谈,要尽量做到充分、客观
上文提到,要对算法模型进行充分的技术验证。那么,如果无法黑盒测试,怎么办?举个例子,如果我们要测试激光雷达,或者ADAS系统。理想中相对充分的测试应该是在一台前装车上进行全工况测试,但现实中行业的发展以及车厂资源很难协调独立第三方测试。那么,这时,一些投资人会更多的通过专家判断、上下游客户访谈等方式进行验证。
1. 行业内专家判断要避免单一化,要覆盖全
比如,对无人驾驶项目的判断,既要访谈看好这个方向的专家,也要访谈看空这个方向的专家,多与各领域专家保持沟通合作,充分沟通交换信息,得出结论。
2. 上下游合作伙伴要按利害关系,进行访谈
还是以无人驾驶/辅助驾驶为例,既要访谈主机厂,也要访谈一级供应商;如果已经和项目有合作,则可多询问一些项目细节,具体合作内容等等。
技术验证只是评价项目的一个方面。特别的,对于一些前沿领域,在项目未上线之前,产品上没有太多可测试验证的内容。这时,往往对于行业的判断,对于商业模式可行性的判别比单纯的技术验证更为重要。
星河互联旗下华空科技正在与PNP联合发起加速营,可以帮助AI早期项目进行技术验证、赋能、帮忙投资人进行早期项目的Pre-DD,给出专业技术验证结论。欢迎有需求的项目与投资人与我们联系。