编辑丨岑峰
“这131天,对我来说,就像过了好几年一样。”回忆起自ChatGPT诞生至今的日子,王小川如是说道。
大模型创业,自卷起大潮后,已经过去了数月之久,王慧文将“光年之外”落在搜狐大厦,李志飞回到出门问问双线作战,王长虎则给新公司定名“爱诗”招兵买马,贾扬清则在离开阿里后还百废待兴……
而王小川也没有闲着,在王慧文新办公室的楼下,小川召开了一个媒体沟通会,官宣了他的新厂牌——“百川智能”。会上,王小川身着一件橙红色的帽衫,不用PPT,只是在众人拥簇下侃侃而谈,有接近小川的人对AI科技评论表示:“这几年他变化很大,松弛了不少,也幽默了不少。”
早在雷峰网之前的文章——《ChatGPT群雄逐鹿:陆奇屠龙,号令天下;小川不出,谁与争锋》——中就有提过,从学术号召力、工程能力、政商能力、意愿冲劲四个维度中,王小川都不落人后,综合实力一流。
到四月底,百川的团队将达到50人的规模。“今年年底,对标ChatGPT3.5的模型就可以训练完成。”王小川如是说道。
近期,雷峰网(公众号:雷峰网)和王小川有过一次对谈,对于生成式AI,乃至未来的AGI的可能形态、完成终局、创业者如何找准位置入局等问题,进行了深入的交流。
交流中,王小川提到,这两个月,关于未来AI大模型的打法和决策,在进行反复的思考和迭代,“基本算是把路径想清楚了”。
将公司定名为“百川”,王小川不仅意指大模型技术的发展路径——汇集海量数据和行业知识,以训练出足够智慧的AI;其中更是代表了他对招贤纳士的渴望,希望能人义士能够合归一处,助他在大模型的创业上更进一步。
在搜狗的后期,王小川越发能感受到人员招募的艰难;而在ChatGPT之后,随着人们对于AI热情的高涨,王小川说,聚拢人才相比几年前更容易了,到这个月末,团队的规模就能扩充至50人,甚至还有人“带资进组”。
有消息称,百川的团队招揽了大量他在搜狗的旧部,一方面,他们更懂搜索和NLP,与大模型算是近水楼台;一方面更认同小川的价值观,更有目标感;一方面也更懂得如何和他合作,知道对方想要什么。
而对于团队,王小川的目标还不止于此,他对AI科技评论表示,在厘清了现有团队的结构之后,马上还要奔赴美国“薅人”,颇有“周公吐哺,天下归心”之意。
在原先的文章中我们就有提到:王小川出身清华,并与清华大学联合创办了天工人工智能研究院,有很高的学术号召力。得道多助的小川背后,还有清华这间国内顶级高校的支持。
评价王小川的大模型创业,中国工程院院士、清华大学计算机系教授、王小川在清华的硕士导师郑纬民表示:“王小川敢于创新,敢于思考,具有丰富的系统工程经验……研究并行计算和相关的体系结构,是我所在的清华大学高性能计算研究所的重要工作,也有着丰富的经验,一定会全力配合与支持王小川。”
而中国科学院院士,清华大学人工智能研究院院长,王小川的博士导师,张钹也表示:“新创建的百川公司的团队很强,我相信他(王小川)能完成这个使命,并在未来的发展中给予全力支持。”
除郑纬民、张钹两位院士外,清华大学计算机系的尹霞、马少平、刘奕群等教授,也不乏对百川智能的溢美之词,纷纷表示将鼎力相助。
资金方面,王小川也表示,现有的资金状况可以放心,手中5000万美金的启动资金,已经可以支撑他当下的团队和算力成本。而大模型的从零到一,王小川估算,成本的规模大概在3-20亿美金。
从产品的角度上,王小川锐意进取,直言:就是要做中国最好的AI大模型。
如何做到最好?不少人盲目地迷信模型参数——参数越大,模型就越强。
但王小川并不同意这一点,他表示,盲目追求大参数,未免有些浮夸。当下,百川已经开始了参数量级在500亿左右的模型训练,而在年末对标GPT3.5的模型。
王小川对于AGI终局的
早在王小川还是研究生的时候,他研究的是基因测序的技术。而在研究中,王小川还是看到了这项技术的弱点:“而基因测序是十分混沌的——中间不确定的变量太多,有不少蝴蝶效应。在过去牛顿写了《自然科学中的数学原理》,将物理简化成数学,但生命科学还做不到。”
20年后,王小川离开搜狗,豪言:“往后二十年,若能为生命科学和医学的发展尽一份力。”时间又过去两年,王小川将生命科学的盘子转托给杨洪涛,全情投入大模型创业。对于这一点,他心中难免有波澜。
要将生命科学的秘密摸清,20年太久,也太理想主义,王小川心里清楚,理想主义和现实需要平衡。早在数年前,谷歌开发的AlphaFold就实现了以蛋白质的基因序列,预测蛋白质的 3D 结构的功能。尽管功能还远称不上完善,但这让王小川看到了从AI到生命科学的“曲线救国”。
要做AI,王小川却没有选择从生命科学入手,相反,他选择了他更轻车熟路的语言。
为什么要从语言切入,王小川的思考,是从人的认识论开始的:通过语言,才能认识这个世界。
早有不少人问他,AGI这一波来势如此汹涌,机会也不止于大模型,为什么不做文生图、CV、智能驾驶这种技术路径更成熟的领域?
而王小川的立场却相当坚定,语言是知识、思考、沟通、乃至文化的载体,如果目标的是AGI这颗“皇冠上的明珠”,那么必须从语言入手——语言距离AGI,比图像和视觉都要更近。
而同时,语言也一直是王小川的优势所在。对AI科技评论,王小川直言:“输入法是猜你想说啥,搜索引擎是猜你想要啥——而ChatGPT,则是将这两种需求进行了一站式的解决。”
“原来经常有人问我,是做模型还是做应用——这一问,就把自己绕进去了。”王小川如是说。
借鉴过去微信、淘宝的“老路”,想要突围,除了有技术以外,关键还是得做出中国自己的杀手级应用。
这一点,王小川深有体会:搜狗的成就,并非体现在搜索引擎的技术本身;正是有了搜索引擎、输入法这两个爆款应用之后,搜狗的价值才真正被人看到。
而这也是王小川入局创业,便迅速积累了一批搜狗旧部的原因;想必这一次的创业,王小川的“三级火箭战略”指导思想和打造杀手级应用的经验也将再一次发挥价值。
“智能的终极,我们肯定永远都会追求。但我们和ChatGPT不一样的地方是,我们也关注,AI大模型落地的场景,是否是真实的;产品化的AI,是否真的用得着。”王小川这么表示道。
从输入法走向搜索,未来还要走向Chat,王小川认为,明天的王道,是“Chat+搜索”的“Chat Pro”形式。
“我认为,今天的OpenAI有点‘目空一切’,AI能力很强,但并没有进攻搜索领域;New Bing则是以搜索为核心,加上了ChatGPT的能力,但仍然不够纯粹。”
王小川认为,Chat只是一种体验的升级,也只是增强产品核心的一个能力。而真正落进实际的场景,应该面向专业的领域——比如健康、法律,并且要将这些专业领域整合到一起,做一个“大Chat”。
而要完成诸多领域的整合,做成AI时代的“超级APP”,背后一定是拥有强大能力的AI大模型的支持。
王小川对雷峰网表示,上个时代的范式,可以被称作“连接X信息”。以谷歌为例,无论是门户网站、搜索、再到推荐,都是将知识用网络连接了起来。
在王小川看来,上个范式的连接分为三种——点到点的“Portal(传送门)式连接”,从关键词到海量相关信息的“搜索式连接”,从用户使用习惯到推荐内容的“推荐式连接”。
抖音就是把“推荐式连接”做到了极致,于是才成了移动互联网时代的王者之一。
而在今天AI大发展时代,王小川认为,新的范式应该被称作“陪伴X知识”,让表达和获取知识更加简单。
在这个范式下,Chat能力的“陪伴”作用能被发挥到最大——比如,在当下的医院,医生没法将全部精力给到每一个病人身上;在Chat能力的作用下,AI可以完成私人医生的作用,实现对病人一对一的陪护。
类似的场景,无论是老师,还是律师、医生,都可以用陪伴的方式,来完成知识的传递。
旧时王谢堂前燕,飞入寻常百姓家。有“陪伴X知识”体系的赋能,社会也将变得更加扁平,私人法律、医疗等等服务也将更加普惠。
AI的To B生意,在今天早已是一片红海,甚至称得上是“死海”。
诚然,To B生意更能赚到稳定的营收,而如上所言,商业的决策绝不能是只为眼前一时的取舍。王小川认为,看AI的大方向,就要看到生成式AI的“终局”
纵观计算机发展的历史,从大型机到WorkStation,再到PC、手机,最终技术的简化路径,总是会落向个人。
对于百川智能的愿景,王小川对AI科技评论表示,目前有几个:
首先,一定是要做中国最好的大模型,当下,百川智能的大模型正在按部就班地训练,争取可以在年底之前发布;
在产品化落地的角度,增强大模型在教育、医疗等垂直领域的知识积累,让大模型能够及早在专业领域发光发热;
而这一切的终局,则是让大众能够轻松普惠地,获取知识和专业服务,以AI技术的演进推动社会生产力的提升与变革。
AI大模型的创业战,格局尚且未定。谁能成为赛道的领先者?
技术和算力上,不少公司仍处在同一起跑线上;而在“外功”胜负难分的情况下,“内功”的深浅,反而决定了一家企业的成败。
或者说,从一个企业家的格局,就能看到一个企业最终的未来。
在今天,没有人能预言通用人工智能的未来;也没有人能确知,谁的技术、市场路径能走得更好、更远。
AGI创业者们比格局的背后,实际打响的,是人才的争夺战:谁的认知更深刻、判断更准确,谁就能更有机会招募到更多的核心人才。
当下,王小川在AGI创业上的布局已经初具规模,背后也有前搜狗COO茹立云的支援,两人都是清华计算机系出身,并分别担任清华大学“天工智能计算研究院”的联席院长和副院长,在清华学生中间影响力很高;加之王小川、茹立云两人在工程和商业领域的能力,在这波创业潮中,占据了一个不错的身位。
从ChatGPT惊为天人,再到2023的AGI创业大潮,AI行业仍在令人振奋地不断前进着。而科技究竟要去往何方,仍然是一个充满着无限可能性的未来。
不同于许多人,在谈到AGI时,王小川想到的是技术的终局——以始为终,才能在探索中少走冤枉路,才能打出提前量,在竞逐中实现弯道超车。
此前,在知乎上有个提问:“哪一句话一直支撑着你活下去”。
王小川的回答是:与时间做朋友。
在比赛开始,就看到了终点的王小川,正向着他所确信的未来,坚定地迈着前进的步伐。
未来,AI科技评论还将持续关注王小川、王慧文等明星创业者的大模型创业动态,欢迎添加本文作者董子博(vx:william_dong)交换认知,互通有无。
文末,附王小川的公开信:
今天我正式宣布,创建“百川智能”,一家研发并提供通用人工智能服务的中国公司。
生活在二十一世纪初是如此幸运,波澜壮阔的互联网革命还没有谢幕,通用人工智能时代又呼啸而来。多年前我曾断言,机器掌握语言,通用人工智能时代就来了;我也有畅想,搜索的未来是问答。ChatGPT的腾空出世,地动山摇,这一切都开始成为现实。ChatGPT发布到今天,仅仅131天,每天都有扑面而来的新进展、新突破。131天恍如隔世!
大半个世纪以来,科学家们前赴后继,努力创造通用智能机器。这一天终于到来,我们找到了一条巧妙的路径,用AI成功将语言转化成了数学模型。语言是知识、思考、沟通和文化的载体。维特根斯坦说,语言的边界就是世界的边界。当AI掌握了语言后,就开始认知世界,成为有知识、能思考、善表达、会学习的智能体。我把这样的智能体称为“语言AI”。
人类个体总有消亡的一天,但能够将毕生的知识通过语言记录下来供新生命学习、继承,文明因此延续。人类协作也需要个体之间通过语言沟通。掌握了沟通和世界知识的语言AI不再只是人类的“工具”,而将成为我们的伙伴和超级助理,成为人类文明的一部分。
智能时代会改写互联网时代的范式。‘连接’会被‘陪伴’取代,‘信息服务’会被‘知识服务’取代,‘免费与广告’会被‘付费与高品质’取代。
智能时代也会改写自工业时代以来的范式。曾经是专业化社会分工带来规模效应与效率提升,而未来会是逆专业化分工:之前需要很多公司协作完成的工作,会因为AI的赋能‘端到端’的完成。
智能时代将再一次开启“文艺复兴”。每个人都会因为AI的助力而变得更加强大。用好AI,一个人就可能做一个公司,解决之前难以解决的难题,也更容易成为自己想成为的人。社会也会更加扁平,以前少数人才能享有的智力服务,也能更普惠。
告别搜狗后,我已开启新的远征:立志往后二十年,为生命科学和医学的发展尽一份力,为大众健康做出一点贡献,核心路径是构建生命健康数学模型,并已经付诸行动。ChatGPT的出现,也将成为新远征的重要助力。
不仅如此,ChatGPT是我过往经历的延续和升华。2019年我将搜狗的使命升级为“让表达和获取知识更简单”,愿景定义为“帮助每个人轻松地对话和书写。便捷地获得知识和服务,提升工作效率和生活品质”。
搜狗输入法和搜狗搜索的数据制备和产品形态,也与ChatGPT接近。它们都是把互联网上的全部语言数据收集、清洗,压缩成数据库并构建超级产品。随着深度学习的发展,这些产品都多次迭代升级,全面用上了Transformer/Bert等技术。输入法猜你想说什么,搜索猜你想要什么。而ChatGPT把这些能力推到了一个全新的高度,是输入法、搜索之外,第三个把全网数据转化成语言服务的超级产品。搜狗未尽的使命在机器掌握了语言后终于可以实现。
很多朋友认可我的技术理想主义和技术驱动的创业经验,鼓励和支持我做中国的OpenAI。也有很多搜狗和非搜狗的技术大拿,得知我有做大模型的想法,主动申请参与组队,甚至“带资入组”。
我最动心的是,能和一群有理想的人,用极致的技术驱动创造出颠覆性的智能产品。这一次,百川智能将借助语言AI的突破,构建中国最好的大模型底座,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠的获取世界知识和专业服务。
筹建百川智能不到两个月,已有多位技术合伙人和领军人物的加入。到这个月底将会有近50人规模的精英团队。大模型的训练也已经启动,进展顺利。按照现在的进度,争取年内发布国内最好的大模型和颠覆性的产品。
我们是中国公司,但我们并不希望只是“中国的OpenAI”,而是能建立世界级的视野和技术品质,让中国享有世界级的产品,产生有世界影响力的技术的突破,进而服务海外。百川本意是众多的河流汇集奔赴海洋,象征着众多数据、行业知识汇聚成为一个强大的智能体系,生生不息。百川也象征着集百家智慧,更多人与我一道共赴山海。我们呼唤中国的领军人物、行业产品经理和远在美国的同仁的加入。
同志们,请通过如下邮箱联系我们:
80@baichuan-inc.com
通用人工智能时代刚刚开启,我们作为第一批跨入新时代的人类,带着焦虑和好奇去拥抱它,思考和探索“我是谁?”我们还可以把自己的智慧注入它,做新时代的开创者,让后代们有一个更美好的未来,繁荣和延续人类文明。
百川智能CEO 王小川
2023年4月10日
更多内容,点击下方关注:
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
雷峰网