四月可谓是AI月,准确的说应该是“大模型”月。
这个月,最忙的非大模型厂商莫属了,先是新公司官宣的消息频出:诸如王慧文新公司光年之外正式开张,王小川五季智能申请AI大模型“百川智能”商标...后是紧锣密鼓的发布大模型:阿里巴巴发布通义千问大模型,腾讯推出混元,商汤发布日日新...
雷峰网获悉,4月20日,出门问问内测探索了“序列猴子”大模型。同时,还推出了面向C端的升级版语音助手魔法小问,面向B端的企业专属大模型。其中,面向创作者还发布了包含AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频与直播平台“奇妙元”在内的四款AIGC产品。
较“通义千问”、“日日新”、“混元”等,序列猴子这个名字显得特殊的多。
对此,出门问问创始人兼CEO李志飞解释道,“序列猴子”名字的的灵感,来源于数学家埃米尔·波雷尔在20世纪初提出的“无限猴子”定理。即如果一群猴子随机地敲打一台打字机,最终一定会产生完整的莎士比亚作品。这个定理基于概率论和组合数学,阐释了概率的统一性。出门问问自研大模型的构建原理与“无限猴子”类似,海量文本序列通过出门问问自主算法的不断训练,经由大规模算力消化理解,便练成了“序列猴子”。
如今,大模型的热度早已不言而喻,ChatGPT火了之后,国内各企业都在追大模型的风口,但想要做成并非一件易事。
据李志飞介绍,他早在2020年6月就开始了大模型的研究,并于2021年推出了UCLAI大模型,参数在60万左右,效果并不理想。但幸运的是,随后的1年多时间里,出门问问在此基础上推出了很多AIGC应用,为大模型开拓落地场景打下了良好基础。2022年10份出门问问重启大模型研究。
时隔半年时间,出门问问大模型“序列猴子”亮相。雷峰网(公众号:雷峰网)了解到,和之前的大模型相比,序列猴子是一款具备多模态生成能力的大语言模型,模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。
李志飞表示,大模型不只是参数量大,当今的大模型是互联网文本的深度建模,而互联网文本是世界知识的映射,因此大模型是一个认知模型,是对语言的建模。而语言是思维的边界,所以大模型拥有无限想象空间。“序列猴子”在训练过程中已经展现出了“涌现”能力,目前正处于“顿悟”阶段,未来提升的速度会越来越快。
发布会现场,李志飞也进行了多轮demo演示,比如“湖北哪个省的人口最多,广州和新疆的人口总和是多少?张鹏的前公司是哪家?现公司是哪家?”等等,对于这些需要上下文语义理解甚至需要逻辑推理的问题,大模型序列猴子都能给出相对准确的答案。
但和其他大模型一样,序列猴子也不可避免的会出现“一本正经胡说八道”的现象,比如在“奇妙文”demo演示环节中,输入“智慧、AI、科技”等关键词,并没有生成相关的概念图片。
李志飞坦言,不同时间段问相同的问题,会得到不同的答案,这是很普遍的,至于不准确的答案或者生不成的问题,主要在于“序列猴子”大模型的语料来自互联网,仍需要不断调优训练。”
同时,李志飞也给序列猴子模型评了分——“50分”。虽然还没有达到及格线,但他显得极为乐观,他表示,序列猴子虽然只有50分,大家应该意识到现在的大模型不再像上一代的AI能力有限,它已具备基本的逻辑推理能力,每次都能给人惊喜。他强调,大模型的训练要循序渐进,不要一上来就搞“应试教育”,大模型的能力很快会到80分,但是要从80分做到90分以上,会是非常难的事情。
雷峰网了解到,目前出门问问已经与包括汽车、教育、律所、金融、医疗、旅游等在内的多个行业的内测探索伙伴达成了合作。
“我的初心不是做中国版OpenAI,而是去造一个大模型,理解这个大模型,然后把他用起来”李志飞坦言。
此次发布会上,基于序列猴子,出门问问还推出了多款面向创作者的AIGC产品及应用。
其中“奇妙文”主打AI写作助理,其AI写作能力已经覆盖了职场办公、市场营销、新媒体和创意写作四大内容创作场景,能够在用户撰写年终总结、客服话术、剧本、广告文案等内容时,为其源源不断地提供灵感和创意方向。此外,在写作中还能自动生成图片,为用户带来图文并茂的写作体验。
言之画主打AI绘画助理的角色,其支持二次元、蒸汽朋克、插画等8种创作风格。用户只需输入文字,“言之画”就能一次性生成8张光影逼真、细节丰富的2K高分辨率图像。除了以文生图,它还拥有以图生图、动图生成、个性头像生成等AI绘图能力,极大丰富了用户的创作手段。对于企业用户,“言之画”还支持专属模型定制,让企业用户能够根据自身需要自定义模型风格,并且支持多人协作生产,更好地满足企业的绘图需要。
魔音工坊主打AI配音助理,其是一款全球领先的全流程一站式AI配音平台,已向用户开放了超1000种音色、超2000种声音风格、40国语言和11种方言。在大模型技术的加持下,“魔音工坊”是全球首款搭载了大模型AI写作功能的配音平台,覆盖了AI写作、AI配音和剪辑等多个场景。用户可以在它的辅助下轻松完成影视解说、有声书、在线教育、新闻播报等集文案与配音于一体的内容创作。
奇妙元主打AI数字分身,其现有超100款数字人、超1000款3D数字资产、超1000种声音。凭借多模态生成技术,“奇妙元”平台目前共支持图片建模(2D数字人)、视频建模(2.5D数字人)、3D建模 (3D数字人)三种不同形式的数字人生成。其形象克隆功能,仅需一段5分钟的真人视频素材,就可以1:1复刻用户的形象神态,为用户打造声音一致、动作自然的数字人分身。
对于,大模型在C端还是B端更容易接受或者普遍使用,李志飞表示,首先是创作者,然后是B端,最后是C端。