出门问问李志飞携序列猴子亮相，称Copilot将无处不在

李志飞出门问问序列猴子

2023/04/23 10:32

四月可谓是AI月，准确的说应该是“大模型”月。

这个月，最忙的非大模型厂商莫属了，先是新公司官宣的消息频出：诸如王慧文新公司光年之外正式开张，王小川五季智能申请AI大模型“百川智能”商标...后是紧锣密鼓的发布大模型：阿里巴巴发布通义千问大模型，腾讯推出混元，商汤发布日日新...

出门问问李志飞携序列猴子亮相，称Copilot将无处不在

雷峰网获悉，4月20日，出门问问内测探索了“序列猴子”大模型。同时，还推出了面向C端的升级版语音助手魔法小问，面向B端的企业专属大模型。其中，面向创作者还发布了包含AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频与直播平台“奇妙元”在内的四款AIGC产品。

较“通义千问”、“日日新”、“混元”等，序列猴子这个名字显得特殊的多。

对此，出门问问创始人兼CEO李志飞解释道，“序列猴子”名字的的灵感，来源于数学家埃米尔·波雷尔在20世纪初提出的“无限猴子”定理。即如果一群猴子随机地敲打一台打字机，最终一定会产生完整的莎士比亚作品。这个定理基于概率论和组合数学，阐释了概率的统一性。出门问问自研大模型的构建原理与“无限猴子”类似，海量文本序列通过出门问问自主算法的不断训练，经由大规模算力消化理解，便练成了“序列猴子”。

如今，大模型的热度早已不言而喻，ChatGPT火了之后，国内各企业都在追大模型的风口，但想要做成并非一件易事。

据李志飞介绍，他早在2020年6月就开始了大模型的研究，并于2021年推出了UCLAI大模型，参数在60万左右，效果并不理想。但幸运的是，随后的1年多时间里，出门问问在此基础上推出了很多AIGC应用，为大模型开拓落地场景打下了良好基础。2022年10份出门问问重启大模型研究。

时隔半年时间，出门问问大模型“序列猴子”亮相。雷峰网了解到，和之前的大模型相比，序列猴子是一款具备多模态生成能力的大语言模型，模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度，能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。

李志飞表示，大模型不只是参数量大，当今的大模型是互联网文本的深度建模，而互联网文本是世界知识的映射，因此大模型是一个认知模型，是对语言的建模。而语言是思维的边界，所以大模型拥有无限想象空间。“序列猴子”在训练过程中已经展现出了“涌现”能力，目前正处于“顿悟”阶段，未来提升的速度会越来越快。

发布会现场，李志飞也进行了多轮demo演示，比如“湖北哪个省的人口最多，广州和新疆的人口总和是多少？张鹏的前公司是哪家？现公司是哪家？”等等，对于这些需要上下文语义理解甚至需要逻辑推理的问题，大模型序列猴子都能给出相对准确的答案。

但和其他大模型一样，序列猴子也不可避免的会出现“一本正经胡说八道”的现象，比如在“奇妙文”demo演示环节中，输入“智慧、AI、科技”等关键词，并没有生成相关的概念图片。

李志飞坦言，不同时间段问相同的问题，会得到不同的答案，这是很普遍的，至于不准确的答案或者生不成的问题，主要在于“序列猴子”大模型的语料来自互联网，仍需要不断调优训练。”

同时，李志飞也给序列猴子模型评了分——“50分”。虽然还没有达到及格线，但他显得极为乐观，他表示，序列猴子虽然只有50分，大家应该意识到现在的大模型不再像上一代的AI能力有限，它已具备基本的逻辑推理能力，每次都能给人惊喜。他强调，大模型的训练要循序渐进，不要一上来就搞“应试教育”，大模型的能力很快会到80分，但是要从80分做到90分以上，会是非常难的事情。

雷峰网(公众号：雷峰网)了解到，目前出门问问已经与包括汽车、教育、律所、金融、医疗、旅游等在内的多个行业的内测探索伙伴达成了合作。

“我的初心不是做中国版OpenAI，而是去造一个大模型，理解这个大模型，然后把他用起来”李志飞坦言。

此次发布会上，基于序列猴子，出门问问还推出了多款面向创作者的AIGC产品及应用。

其中“奇妙文”主打AI写作助理，其AI写作能力已经覆盖了职场办公、市场营销、新媒体和创意写作四大内容创作场景，能够在用户撰写年终总结、客服话术、剧本、广告文案等内容时，为其源源不断地提供灵感和创意方向。此外，在写作中还能自动生成图片，为用户带来图文并茂的写作体验。

言之画主打AI绘画助理的角色，其支持二次元、蒸汽朋克、插画等8种创作风格。用户只需输入文字，“言之画”就能一次性生成8张光影逼真、细节丰富的2K高分辨率图像。除了以文生图，它还拥有以图生图、动图生成、个性头像生成等AI绘图能力，极大丰富了用户的创作手段。对于企业用户，“言之画”还支持专属模型定制，让企业用户能够根据自身需要自定义模型风格，并且支持多人协作生产，更好地满足企业的绘图需要。

魔音工坊主打AI配音助理，其是一款全球领先的全流程一站式AI配音平台，已向用户开放了超1000种音色、超2000种声音风格、40国语言和11种方言。在大模型技术的加持下，“魔音工坊”是全球首款搭载了大模型AI写作功能的配音平台，覆盖了AI写作、AI配音和剪辑等多个场景。用户可以在它的辅助下轻松完成影视解说、有声书、在线教育、新闻播报等集文案与配音于一体的内容创作。

奇妙元主打AI数字分身，其现有超100款数字人、超1000款3D数字资产、超1000种声音。凭借多模态生成技术，“奇妙元”平台目前共支持图片建模（2D数字人）、视频建模（2.5D数字人)、3D建模（3D数字人）三种不同形式的数字人生成。其形象克隆功能，仅需一段5分钟的真人视频素材，就可以1：1复刻用户的形象神态，为用户打造声音一致、动作自然的数字人分身。

对于，大模型在C端还是B端更容易接受或者普遍使用，李志飞表示，首先是创作者，然后是B端，最后是C端。