Adam Berenzweig(左二)在斯坦福人的一场人工智能专家论坛上。图片来源:Forbes。
Adam Berenzweig获得哥伦比亚大学博士学位后,在谷歌工作了超过十年的时间,建造了最早的谷歌音乐推荐系统,并参与了谷歌新闻、Goggles(Google的图像搜索应用)和实时搜索等项目工作。在Goggles,他开发移动应用,让用户可以将摄像头对准世界上的任意物体,人工智能会识别物体并提供相关信息。要知道在当时,深度学习和复杂物体识别技术八字都还没有一撇。
“我们可以做局部特征提取和指纹识别,这对标识、艺术作品和海报还不错。所以人工智能可以识别街对面的电影海报,但是搞不懂猫和狗有什么区别,或者椅子和桌子有什么区别。”Adam说。大概2012年左右,神经网络可以识别图片中的物体了。
“我职业生涯的大部分都在使用机器学习打造产品。我喜欢利用最新的研究突破,研究如何将其应用在实用性强、影响广泛的项目中。”
在谷歌工作十年之后,Adam受到Matt Zeiler的邀请创建机器学习公司Clarifai,目标“将大规模深度学习带入日常生活。”作为公司CTO,Adam打造了大部分的机器架构,还涉及了产品。“Matt Zeiler在2013年赢得了ImageNet国际计算机视觉挑战赛(编者注:ImageNet有“计算机视觉的奥林匹克”之称,是斯坦福计算机专家模拟人类识别系统建立的计算机视觉系统识别项目。2015年大赛中微软获胜、百度因作弊未入榜。)当时,这些模型逐渐显示出它们的实力。”Adam说。
“他在这个领域内工作了一段时间,他看到了这些系统正在稳步、缓慢、逐步积累地成长。他给我展示了他的早期演示,这在系统性能方面是一个明显提升,很明显,这种性能提升为很多新应用打开了空间。”在Clarifai工作了两年后,Adam于几周前刚刚离开,回归自己最初对于个人化推荐的热情。
“现在,每个人拥有和不断创造的数据跨越了很多不同的服务。如果我们可以将数据集中在一个地方,让用户可以更好地直接接触到这种科技巨头们在做的个人模型,我们将大有可为。”Adam说。这是他职业生涯的下一个目标。“如何建造机器驱动的产品,实现以数字为中心,并将机器学习的结果以不让人混乱的方式呈现出来。”
Adam Berenzweig。图片来源Linkedin。
Adam在Hacker Unit的线上课程中,分享了他从事机器学习13年的心得:
你用来打造试验的系统万分重要:你能够多快地通过不同参数和配置带来新的试验?在没有很大工程量的前提下,你能多快地设计新试验并建造模型?接下来的问题就是将结果视觉化,可以快速看到什么结果行、什么结果不行,从而决定接下来专注做什么、不做什么。在我的经验中,我经常从零开始,但是貌似现在有很多人都在研究这些东西,所以开源工具越来越好了。
从实验室获得训练数据时,思考一下你将如何在页面上呈现它。要细化到这种程度:用多大的字体、一页上有多少个物件。这看起来有点傻,不像开发智能硬件的“硬派风格”,但是实际上这些都对训练数据的数量和质量有很大影响。
现在,有许多产品在某种程度上都包含了机器学习技术。所以,在打造产品的时候脑子里要记住这一点:这个产品里出来的数据,会是好的训练数据吗?这是我认为必须一直关注的点。正确的做法可以是,当错误发生的时候给用户改正错误的机会,确保这在产品的使用流程之内。给用户呈现的感觉应该是,这是对我有价值的东西,因为这会帮助改正产品中的错误,这对用户自己也有好处。
关于亚马逊土耳其机器人(译者注:一个Web服务应用程序接口(API),开发商可以远程调用人的智能来完成一些对计算机来说很难的“简单”任务,例如撰写产品描述或选择某一主题的最佳照片等),我的个人经验是很难找到好的标识员,因为这上面人们的流动性很快。实际上,很多标识任务得让人花时间适应,基本上要接受一定训练。我们最终使用了其他的系统,获得了一些可以保持长期关系的人。那非常重要。
我们建立Clarifai的时候,我们没有很多的收入。我们有产品,我们在API上有用户,剩下的,就只有一个“这是一个好机会”的信念。关于Clarifai的另一点是,图像很容易用来作为演示,所以我们从早期开始在网站上就一直有一个演示,让人们直接地看到产品的可能性,抓住了他们的想象力。在其他领域,要不是数据非常具体——例如某个公司的企业数据——要不就是不太容易进行视觉呈现。我想这是一个很大的挑战。
单单用一个GPU就能实现很多东西。也许在未来的一两年会改变,但是多GPU系统——如何在多个GPU上将训练最优化——这个问题我觉得还没有解决。因此,大部分人还不用考虑这个问题。我认为你用同一个GPU就能得到很多,可扩展性只是能不能在训练中将数据轻松转移的问题,而且这会有一个长期的服务。
开源系统有非常强的社区,并且在快速提升。你可以去了解一下,看看是不是值得转移去开源社区。我认为得看领域。其他很重要的因素是团队的技能如何、人们习惯使用的语言是什么、他们是否真的熟悉这些框架。我认为他们挺好的。
我们一直会使用我们自己喜欢的方法。如果那本来就是我们自己也想深入的方向,或者,如果我们出于其他理由觉得,这对别人来说也会非常有用,我们就会愿意为客户定制化。当我们心里想到“这是个很好的领域,我们该做。”那么,我们就会去做。有时候,我们会为定制化收费,因为我们投入了额外的工程时间,有其合理性。有时候我们不会收费,这通常是洽谈过程的一部分。主要这得看客户的体量。
可行的东西有很多,你只需要几个就够。也许是一支有成功案例的队伍,也许是一种别人都没有的技术,也许是产品演示中很好的产品感觉,或者很好的执行能力、公司愿景与想象力,或者是发现一种还没有人实践的新机会。Clarifai最初有很多可行的点,但是我们听到了一种评论,就是我们同时想做到的事情太多了。我们在建造API,我们还有图片应用。我们成功了,但是有一些投资人因为这一点转身离去。这其中的关键就是,找到对你来说可行的点,然后去找到相应的投资人。
Via BeMyApp