恺望数据创始人兼CEO于旭
9月7日,AI数据服务公司恺望数据宣布完成由亚盛投资领投的Pre-A轮数千万级别融资,清智资本参与投资。
据了解,这是恺望数据在一年内完成的第三次融资,此前天使轮及天使+轮投资方包括辰韬资本、璞跃中国、三一集团和溪山天使汇等。
恺望数据成立于2022年2月,致力于打造AI数据自动化平台,面向车企、自动驾驶公司以及人工智能等跨产业企业提供一站式AI数据解决方案。
目前,恺望数据的产品已迭代至最新版的“Smart Chain恺望自动化AI数据产线”。新的数据产线包括“3D辅助标注”工具平台、“4D-BEV数据拼接与标注”工具链、“5KW大点云”工具平台,以及“6大数据生态闭环解决方案”。
今年以来,落地城市NOA是自动驾驶领域的必争之地,而BEV感知是通往城市NOA的必经之路,国内不少布局自动驾驶的车企及技术公司均在加速推动BEV感知算法落地,而决定着算法及模型速度的重要要素,则是数据的质量和效率。
对此,恺望数据推出了国内首个可支持4D-BEV感知算法的数据拼接及数据标注工具链,该工具可支持大数据流并行作业,支持200万人同时标注,目前已在车企应用。
恺望数据创始人兼CEO于旭表示,自动驾驶行业对于优质、高效及稳定的大规模数据需求不断增长,“以往可能只看价格,现在既看价格,还要求稳定、高质量与高效率。”
为此,恺望数据通过研发新的技术工具,降低人员的学习难度、标注难度,降低单帧数据处理的精神消耗,从而提高数据处理速度和质量。
于旭介绍,恺望数据推出的“3D辅助标注”工具是国内唯一一个在2D中标记后反投影到3D中精准找到标注物的工具,“5KW大点云”工具平台则是国内首个实现可在8G内存电脑上运行的5千万点云数据标注能力的工具。
当前业内点云数据处理的领先水平大约是200万至300万点云,具备上千万级别点云数据标注能力的工具和平台较为稀缺。
恺望数据技术及产品负责人表示,通过自研Web多线程调度系统,完成点云异步加载和渲染,“5KW大点云”工具平台对硬件的要求不高,可在8G内存电脑上运行,上限可支持1亿点云加载。
“Web多线程技术执行复杂的计算、处理大量数据、进行后台网络请求都在后台线程中运行,不会影响用户界面的响应性,将数据加载、点云处理、渲染分开异步完成处理的同时不会影响业务正常使用。”
恺望数据的突出特点是将自动化技术与规模化人力运营管理相结合,推动数据生产线从手工作坊转向兼具标准化、规模化和自动化的“现代工厂”。
这与创始人于旭及其团队的背景分不开。
于旭毕业于法国昂热大学,是字节跳动、Momenta、Uber等企业数据生产及运营体系的第一搭建者,拥有多段从零到一的大数据平台搭建经验。在Uber中国时期,于旭积累了丰富的大规模人力运营的经验。
恺望其他团队成员来自字节跳动、阿里巴巴、Uber、Momenta、梅赛德斯-奔驰等公司。
于旭认为,目前要解决自动驾驶数据的长尾问题,仍无法全自动化。“随着自动驾驶对高质量、高产效数据的需求逐步提升,数据标注已经从低成本人力标注,逐渐变为了高阶标注人才的需求。”
比自动驾驶更需要“高端标注人员”的,是AI大模型行业。随着AI大模型成为新的热门行业,恺望数据客户也从车企、自动驾驶公司拓展至人工智能公司。
于旭表示,AI大模型的数据来自各类垂直专业领域,需要大量本科及以上学历各专业的毕业生参与标注,但这类“垂类高阶标注人才”在行业内极为稀缺。
针对这些需求,恺望数据自去年以来打造的“恺望数据学院”有一定优势。恺望数据通过于高校合作共建产融实训基地,储备并培训了大批高校学生标注员。
于旭透露,目前恺望数据学院已培训50所学校,培养超过1500名学生为恺望提供数据标注服务,计划至今年年底将超过2000人规模。
目前,恺望数据已在自动驾驶领域与长安、广汽、奇瑞、上汽等车企,以及毫末、旷视、元戎等自动驾驶公司建立合作关系,在AI大模型领域的合作客户包括商汤、字节跳动与文心一言等。于旭表示,公司单月订单已超1500万元。
雷峰网(公众号:雷峰网) 雷峰网