雷锋网按:这里是,油管Artificial Intelligence Education专栏,原作者Siraj Raval授权雷锋字幕组编译。
原标题 How to Start an AI Startup
翻译 | 李振 J叔 余杭 字幕 | 凡江 整理 | 廖颖
我们正处在一个AI大革命的开端,每周都有新的创新出现。例如Tetra利用语音识别技术,从你的手机中生成详细的笔记;Hyper Science通过利用OCR从表单中轻松提取数据;Jet Lore利用消费者行为作为一个模型的输入,输出结构化数据。在本期视频中,我将结合自己的创业经验,告诉你们如何启动一个AI的创业项目。
一、推荐的学习材料
现在是2018年,如果你希望今年加入创业大军的话,首先就要学习AI。如果你自己不了解这个神奇的技术是怎么工作的话,你不可能创造出AI解决方案。如果你刚刚开始看教程,记得按照这个顺序——先学习面向数据科学的python,然后是Tensorflow的介绍,接着是Deep Learning的介绍,最后是关于人工智能的数学知识。
另外,Andrew Ng的最新Deep Learning课程是必选项,Jeremy Howard的Fast.Ai 课程也非常棒。我最喜欢的关于深度学习的书是lan Goodfellow著的Deep Learning。这本书的电子版是免费的,它对你理解关于Deep Learning的数学知识非常有帮助.Deep Learning被证实在广泛的范围内,可以帮助每一个其他的机器学习模型。
所以,关于AI的炒作是有道理的。然而你需要确切地知道,其他机器学习模型是怎么工作的。在无法获取大量数据的情况下,你只能建立一个简单的预测模型。这种情况下,支持向量机,甚至一个简单的决策树,都比深度神经网络更有用。
知道什么时候用什么模型的唯一方法是,建立关于AI的直觉——这种直觉在学习和掌握大量AI 知识资源后才能得到。当掌握了构建AI算法的全貌时,你需要找到一个激发你浓厚兴趣的问题去研究——世界上大多数成功的公司都是从解决问题开始的。
二、记录遇到的问题
记录你和你朋友面临的问题,以及在生活中亟待解决的问题吧,这会是非常好的选择。这些问题困扰着你关心的人,于是你就会有解决它的热情。
如果没有好的想法,你可以使用社交网络主动寻找想要寻找解决方案的人。利用关键字或关键词,找到人们发布的遭遇很大挫败感的话题,例如我该怎么做,寻找问题解决方案,或者关于这个工作做的不好等。你可以在Reddit或Twitter等社交媒体上找到这些信息。
三、读万卷书,行万里路
我认为最好发现问题的方法是旅行,和不同人接触。我在前几年曾历时三个月环游欧洲,在伦敦偶然碰到了Alex macaw,他给了我启发,让我在大学前几年的主修方向,从商学转为计算机科学。这是我这一生最重要的改变,才能让我成立了机器人创业公司Lucid Robotics。
我在剑桥读三年级的时候,在南亚和东南亚旅行了四个月。这次旅行帮助我以不同的角度看待同一个事物。离开硅谷以后,我会亲自去发现人们面对的问题,他们日常的生活问题,关系到基础设施、商业活动,当然还有教育,对我的影响非常大。当地人进行许多简单的交流,最终形成了我自己的想法,形成了一个大的计划——即关于AI的教育。
四、前期调研
像马斯克说过:“创业就像披荆斩棘,筚路蓝缕”。如果你对解决一个问题没有热情,你就无法坚持。当遇到不论多少负面的评论。我总持保留意见,因为这不是针对我的,而是针对解决AI问题的。一旦你有了待解决的目标问题,就该做一些市场调查,包括你的客户,他们在哪里购买,他们的承受能力,这是产品还是服务,配置的花销,市场的历史怎么样等等。
这方面的内容可以参考dot.com(互联网)和大数据分析公司。根据公布的关于一般AI创业公司的报告,AI型创业公司大致分为两类:第一类是水平方向的AI创业公司,主要针对服务于不同行业的基础问题,比如自然语言处理;第二类是垂直方向的创业公司,针对非常具体的客户群体,为他们解决问题,属于一类具体的行业。
每个主流的技术公司都非常注重AI,他们雇佣AI方面的大牛,从Hinton到LeCun都是天才。他们多年来从用户那收集了大量数据,而这些只对他们自己的研发团队开放,因此这些科学巨人拥有巨大的优势。他们建立水平方向的产品,可以被用在很多行业,例如图像识别,语言翻译或者其他的基础设施。
而你所拥有的优势,是可以根据一个独立的问题,针对垂直方向的领域展开快速的行动。他们没有时间去处理简单的小问题,但是你有。
总的来说, 他们关注客户多过于关注企业,你可以帮助企业,建立个人主页,描述你的产品,注册获得发布版本,在社交网络上发布它。一个提升你产品认知度的方法,是提升你自己的形象,把自己包装成一个AI思想领袖,建立博客或者其他形式回答AI的基础问题。当你注册时,让观众看到,如果你做的非常好,你产品的价格也会跟着增长——它和你可以提供的成正比,这至关重要。
五、寻找数据
如果你将AI从公司剥离,但如果在正确的轨道上的话,它仍是一个有价值的产品。如果AI是你唯一的东西,没有消费者或者投资者会满意的。当你开始市场调研,就是建立你产品的最佳时机。建立模型的时候,你需要尽可能地组织和标注你的数据——高质量的数据经常是机器学习流水线中最重要的部分,重要程度甚至超过模型结构——在垃圾中分析垃圾什么也得不到。
最简单的方法是寻找公布的数据,Github上有非常棒的数据库,California Irvine有巨大的ML数据资源库,Kaggle也有很多很棒的数据。如果这些都不管用,用你已有的数据建立自己的数据库,例如当你尝试着对手写字体进行分类,你可以通过增加噪声的方法,从已经存在的数据中生成新的数据。如果你有未标注数据,通过Amazon的Mechanical Turk进行众包是一个好的选择。你可以找人来标注他们。另外还有像data circle这样的数据市场,你可以直接从其他人手中购买或者交换数据。
最后,如果你够有创意,可以利用scrapy库或者web service来编写python脚本实现自动抓取数据,就像在diggernaut.com 上一样。当你开始建立模型,Tensorflow仍然是最能经受考验的机器学习框架。Tensorflow的生态圈有一大堆的工具,比如产品化的Tensorflow Serving。建议一个模型,用你的数据通过 AWS google cloud 或者 FloydHub 来训练这个模型。利用你的模型进行预测——这就是你的产品。数据越多意味着算法越智能,同时也意味着产品更优秀,用户更多以及数据越多,这个环状结果往复循环。
六、融资
融资是一个加速拓展业务的方法,或许ICO圈子现在非常热门,但如果你长时间处身其中,可能产生法律问题,这里就不谈了。我的一个朋友——Aetherium的第一个设计者,他不希望给他的公司做ICO,于是采用众筹的方法筹钱。
我们可以发现他的做法很具有启发性,我有一篇文章,详细地描述了这件事。风险投资(VC)是另一选项,通过重复使用一些流行语来使VC投资人相信你的产品很棒。其中,最好的VC投资人可以很好地理解你的产品,所以你需要准备好向他们解释其中的技术。
如果你可以在一些高档的地方和VC投资人交流,说明你已经获得了一些现金流;如果没有,就不用。这就是我在纽约被那么多VC投资人拒绝的原因——我还没证明我的机器人能够有很好的销售市场,因此我并没有得到很多的投资,我所做的是建立一个受众群体。我可以接受被挑剔,但是我现在不关注融资。
七、招聘
接下来是招聘。极少数的天才分布在全球各地,所以从kaggle的全球排行榜招人是有道理的,即最招最有用的人——我很难找到适合帮助我编辑视频的人。如果你真心喜欢一件事情, 是很难放弃的。如果你找到合适的人,事情变得简单了。
Steve Jobs说过,最高兴的事情是你拥有一个核心团队——可能是10个优秀的人。它是可以自控的,某种程度上,你可以选择退出。不论之后是被Aqua或其他的大型技术公司雇佣,还是被IPO雇佣,如果都没有,可以走咨询公司这条路,只是没有开发产品那么具有诱惑力,但是找几个朋友开一家咨询公司总能填饱肚子,得到一些初始用户,慢慢做好品牌,证明自己。
视频原址 https://www.youtube.com/watch?v=9bbS-trc8ys
雷锋网相关推荐
没有博士学位和顶会论文,我如何拿到DeepMind研究员Offer?
更多文章,关注雷锋网
添加雷锋字幕组微信号(leiphonefansub)为好友
备注「我要加入」,To be an AI Volunteer !