AI文档搜索公司Hebbia完成1.3亿美元融资，a16z领投；奥特曼成立AI健康公司；大模型最强架构TTT问世丨AI情报局

融资奥特曼大模型

2024/07/10 11:48

融资快报

Hebbia 完成 1.3 亿美元融资：位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资，由 a16z 领投，Index Ventures、Google Ventures 以及 Peter Thiel 参投。据悉，Hebbia 目前估值约为 7 亿美元，公司成立于 2020 年，其软件可分析数字化文档和数据源，包括监管文件、PDF 以及音频和视频剪辑，以帮助客户处理比面向消费者的聊天机器人更复杂的查询，类似 Glean。

旷视科技MEGVII上交所提交注册：旷视科技MEGVII以自研视觉感知算法引擎为核心，致力于持续打造在各商业领域的 AIoT 操作系统，以及深度构建具备连接百亿物联网设备能力的生态系统，为 200 多个国家和地区的数十万开发者提供智能物联服务及解决方案。近日旷视科技MEGVII上交所提交注册。

Solidroad获得 120 万美元投资：Solidroad 是一个用于招聘、入职和培训的人工智能平台。本轮融资由 Dan Kiely（Voxpro 联合创始人）、Jack Pierce（Wayflyer 联合创始人）、Ciaran Lee（Intercom 联合创始人）、CPL 的 Anne Heraty 和前 PayPal 高管 Louise Phelan 领投。

Roboat筹集55万欧元融资：阿姆斯特丹自主船舶技术公司Roboat从LUMO Labs和SHIFT Invest筹集了55万欧元的资金。该公司开发了人工智能软件，可以在交通繁忙的荷兰内陆水道中航行，集成到新车中，也可以改装到负责载人、货物运送和废物收集的商船上。

AI视频初创公司Captions融资6000万美元：最近 RunwayML正在筹集大量资金。现在，由前微软工程师Gaurav Misra创立的人工智能视频初创公司Captions已获得6000万美元的C轮融资。由Index Ventures领投的这笔投资对该公司的估值为5亿美元。

（欢迎添加微信AIyanxishe2，了解更多AIGC、融资情况，与志同道合的朋友一同畅聊时新AI产品）

国内情报：

中国电信发布星辰软件工厂，产品文档生成代码：

中电信人工智能科技有限公司和中国电信人工智能研究院发布星辰大模型・软件工厂的产品，并称这是国内首款破局性 AI 开发工具。星辰软件工厂利用最新的多模态大模型技术，自动生成前后端代码，并进行自主测试和纠错，形成软件开发的全自动流水线。用户仅需简单写下产品文档，大模型可根据文档内容生成代码，在软件工厂内一键部署并上线。

腾讯智影小程序上线 AI 视频功能，限时免费一键生成风格化视频：

此功能限时免费（未公布收费价格）。视频风格化就是在原视频的基础上进行风格化处理，只需导入视频并一键“变身”，就能快速生成风格化视频（支持 10s 视频），智影 AI 提供了多种模板。

国内首个 HPC 源码仓库“源码之家”上线国家超算互联网平台：

“源码之家”提供的源码商品分为人工智能、工业仿真、气象环境、化学材料等 11 个类别，覆盖 193 款 HPC 软件，支持用户一键下载所需源码，并提供便捷辅助编译工具，目前已涵盖超四千种源码商品。

2023 下半年中国智算服务市场规模达 114.1 亿元：

国际数据公司 IDC 发布报告显示2023 下半年中国智算服务市场整体规模达到 114.1 亿元人民币，同比增长 85.8%。智算集成服务市场呈现出一超多强的特征，华为依托其领先的芯片能力及全栈服务能力，市场份额领先，前五名还有新华三、百度、寒武纪和中国电子云。

GenAI IaaS 市场份额则较为平均，前五名分别为字节火山引擎、阿里巴巴、商汤科技、百度以及腾讯。

中科院院士领衔推出大模型的第 3 种记忆：

中科院院士鄂维南领导的上海算法创新研究院团队提出了一种新型大模型记忆格式Memory，更加高效和成本更低。该模型受人脑记忆机制启发，区分了显式记忆、隐式记忆和外部信息三种记忆形式，并将其应用于大模型中。实验结果表明，Memory 模型在推理速度、减少 “幻觉” 问题以及在专业领域任务上的表现均优于传统 RAG 方法。此外，Memory 模型在 HuggingFace 排行榜上的评测结果显示，显式记忆的引入提高了平均分数 2.51%，有效地提升了模型的性能。

论文：https://arxiv.org/abs/2407.01178

中国AI融资总额达37762亿元：

《2024世界人工智能法治蓝皮书》报告显示，2023年，中国 AI 核心产业规模达到5784亿元，同比增速为13.9%。行业投资方面，去年中国 AI 行业已发生投融资事件815起，融资总额达2631亿元，投资事件有所下降但融资总额有所提升。

目前，中国 AI 行业的投资主体主要以产业投资类为主，包括启明创投、红杉资本、顺为资本、阿里、腾讯、百度等。截至2023年12月14日，中国 AI 行业总计有10110起投资事件发生，总计融资金额达37762亿元人民币。

清华团队开发CharacterGen，单图高效生成3D角色：

清华大学研究团队开发的CharacterGen框架在3D角色生成领域取得重大突破。该技术能从单张图像创建具有一致姿势和高质量外观的3D角色模型，并支持后续骨架绑定和动画制作。CharacterGen采用基于图像的多视角扩散模型校准姿势，结合变换器的稀疏视图重建模型创建详细3D模型。研究团队还开发了特殊的纹理生成策略和专用训练数据集。实验结果表明，CharacterGen在生成高质量3D角色方面表现出色，为游戏和动画制作等领域带来新的可能性。该项目将于SIGGRAPH 2024发布，相关代码和数据集也将开源。

?https://charactergen.github.io/

MOSS大模型项目负责人邱锡鹏称大模型的下个阶段是“世界模型”：

复旦大学教授、MOSS大模型项目负责人邱锡鹏认为，当前，大语言模型还存在很多不足。比如在落地阶段，大语言模型的会遇到难以解决的“幻觉问题”，即生成不真实、不可靠、不存在的信息。邱锡鹏将大模型的未来趋势和发展方向，总结为观察世界、产生动作，并走向“世界模型”。

中国工程院院士郑纬民称国产AI芯片核心问题是生态不够好，如果生态好60%的性能也有人用：

中国工程院院士、清华大学计算机科学与技术系教授郑纬民表示，相比英伟达，国产 AI 芯片系统生态不够好。什么是生态系统好呢？郑纬民给出的定义是，如果原来用英伟达写了一个AI CUDA软件，现在很容易移植到国产系统上，写起来的方法跟原来差不多，就叫生态好。如果移植起来，没有一年两年移不过来，那就是不好。

国际情报：

OpenAI CEO 奥特曼与赫芬顿成立新的AI健康公司：

OpenAI CEO Sam Altman 与AI医疗健康巨头Thrive Global的CEO Arianna Huffington 在《时代》宣布Thrive AI Health公司的成立。Thrive AI Health的目标是打造一个个性化“AI健康教练”，以手机App形式呈现。目前公司CEO是谷歌前健康和可穿戴设备负责人DeCarlos Love，OpenAI创业基金和Thrive Global是主要投资方。

大模型最强架构TTT问世，Transformer一夜推翻：

斯坦福、UCSD、UC 伯克利和 Meta 研究人员提出的新型大模型架构 Test-Time-Training layers。TTT 方法通过对输入 token 进行梯度下降来压缩上下文，代替了注意力机制，并具有线性复杂度。这一项目研究了一年多，最终的研究成果显示 TTT-Linear 和 TTT-MLP 在性能上超越了 Transformer 和 Mamba。TTT 层的核心思想是使用自监督学习将历史上下文压缩成一个隐藏状态，这种隐藏状态可以是线性模型、小型神经网络等形式。

论文地址：https://arxiv.org/abs/2407.04620

Groq推出闪电般快速的LLM引擎，仅四个月吸引28万开发者：

该引擎让开发者们可以直接进行大型语言模型的快速查询和任务执行。引擎使用Meta的开源LLama3-8b-8192LLM，默认支持其他模型，每秒可处理1256.54个标记，远超Nvidia等公司的GPU芯片。 Groq 还为开发者提供了将应用程序从 OpenAI 切换到 Groq 的简单方式，目前已有超过 28 万名开发者使用了其服务。CEO Ross 预测，到明年，全球一半以上的推理计算将在 Groq 的芯片上运行。

Meta AI为移动设备开发紧凑型语言模型MobileLLM：

MobileLLM是为智能手机和其他资源受限的设备设计高效语言模型的新方法。该研究挑战了有关有效AI模型规模的假设，取得了2.7%到4.3%的性能提升。MobileLLM的开发符合人们对更高效AI模型的需求，尚未向公众开放，但已开源预训练代码。

OpenAI中国禁令不影响微软Azure中国版：

只要注册微软的Azure云服务，OpenAI的对话式人工智能模型可供中国企业使用，该服务是通过一家本地合资企业在中国运营的。微软在其公开声明中明确表示，Azure中国是与本地公司21Vianet共同运营的合资企业，在中国提供Azure的OpenAI服务。

Poe社交平台推出Previews功能，AI编程可视化：

该功能允许用户在聊天中直接生成Web应用程序并与之实时互动。比如，通过聊天生成的小游戏、互动动画、拖拽界面或者数据图表等。类似Claude的Artifacts功能，Poe平台还推出了其他多种功能，比如多个机器人一起聊天、文件上传和视频输入等。适用于擅长编码的大型语言模型，如Claude3.5Sonnet、GPT-4和Gemini1.5Pro等。

无人车团队推出电影级视觉AI特效Odyssey，镜头堪比好莱坞大片：

Odyssey能生成好莱坞级别的山脉、平原、植被、海洋、河流等故事镜头。它最大的亮点在于，完全掌控视觉叙事核心层的每个生成元素和方面。突破了现有视频AI的可控性障碍。

Odyssey两位核心创始人都来自自动驾驶领域。CEO Oliver Cameron是60多家DeepTech初创公司的天使投资人，早期一直从事自动驾驶汽车领域。CTO Jeff Hawke负责Odyssey可定向视觉AI，研究领域涉及机器学习、计算机视觉、机器人等。

苹果首款支持 Apple Intelligence 的智能家居设备将是一款桌面机器人：

古尔曼透露，苹果首款搭载 Apple Intelligence 功能的智能家居设备将是一款全新的桌面机器人。古尔曼表示，期待在现有苹果智能家居设备上使用 Apple Intelligence 功能的用户可能要失望了，他们需要等待苹果推出 AI 驱动的桌面机器人产品。

Gartner报告称64%受访者不希望客服系统部署 AI：

市场调查机构 Gartner 调查报告表示 64% 的受访客户不希望客服使用 AI。 53% 的客户如果发现某家公司客服使用 AI，会考虑转向竞争对手。客户认为客服系统引入 AI 之后，联系到人工客服变得更加困难，另一方面的担忧是 AI 提供错误答案。

谷歌前董事长称中国AI发展只落后美国2年：

谷歌前董事长埃里克·施密特表示，中国AI并没有复制美国的发展速度，中国AI只落后美国两年，两年并不算长。“芯片禁运”是征向中国的“成本税”，但这些并不能起决定性作用。

更多国际情报：

电信公司部署 AI 遏制诈骗电话：AI 聊天机器人 Ibrahim，能够与诈骗者的 AI 进行对话，延长通话时长。达利・卡法尔教授团队还推出了 Apate AI 工具，能了解骗子的诈骗技巧，帮助警告人们并为执法部门提供情报

华顿证券国际推出AI-IRO，利用AI提升投资者关系管理的软件：该产品旨在通过利用资本市场大数据，提高上市公司的投资者关系工作效率，并提升企业品牌形象。使用 Claude 系列大语言模型和先进的技术支持，结合矢量知识库、文本转语音和语音转文本技术。

Xinsir开源Controlnet++模型，支持Openpose、Canny等十多种条件控制：该模型基于ControlNet架构，新增模块支持超过十种不同的控制类型，提供了多种控制条件下的图像生成示例。

Product Hunt 热榜，旅行规划Wanderboat AI

Wanderboat AI 是一个提供个性化旅游建议的旅行规划网站，用户可通过与 AI 聊天或上传旅游指南来获取定制旅行行程，简化了旅行规划过程。Wanderboat AI 涵盖了从著名景点到当地特色活动的广泛内容，旨在为各类旅行者提供全面的旅游信息。但实际效果和用户接受度仍有待观察。

?https://wanderboat.ai/?ref=producthunt

GitHub Trending 热榜，MindsDB

MindsDB 是一个简化企业级 AI 应用开发和部署过程的开源平台，它集成了多种数据源和 AI/ML 框架，允许开发者使用SQL语法和各种API来创建、优化和部署机器学习模型。MindsDB提供了丰富的功能，包括模型微调、知识库构建、语义搜索、实时预测和AI代理创建等，能帮助企业从数据中提取价值。但它的实际效果和适用性可能因企业的具体需求和技术能力而异，企业在选择使用时，仍需考虑其与现有系统的兼容性、学习曲线以及长期维护等因素。

?https://mindsdb.com/

开发者推荐

1.ai-ng/swift：新一代AI语音助手项目亮相

ai-ng/swift项目是一款基于Groq和Cartesia技术的高速AI语音助手。该项目利用Groq进行快速推理，结合OpenAI Whisper进行语音转录和Meta Llama 3生成文本响应。同时，它采用Cartesia的Sonic语音模型实现快速语音合成，并将合成的语音流式传输到前端。

项目还整合了语音活动检测技术，能够精确捕捉用户的说话时机。整个应用程序使用TypeScript编写，基于Next.js框架开发，并已成功部署到Vercel平台。

?https://github.com/ai-ng/swift

?https://swift-ai.vercel.app/

2.UltraPixel：超大分辨率图像生成神器

UltraPixel是一款能够生成超高分辨率图像的黑科技。通过Stable cascade训练和微调，支持直接生成1K到6K分辨率的图片。其技术手段包括隐式神经表示和尺度感知归一化层，保持高度细节和真实感。同时，在最小空间内高效处理，参数利用率高达97%，提高训练和推理效率。

?https://jingjingrenabc.github.io/ultrapixel/

3.QualityPrompts：58种提示技术助力AI交互优化

QualityPrompts的Python库，实现了58种源自OpenAI和Microsoft调查的提示技术。该库支持通过pip安装，允许用户定义指令和输出格式，并能自动搜索相关示例。QualityPrompts提供了多种高级提示技术，如System2Attention和Tabular Chain of Thought Prompting，旨在提高与语言模型的交互效果。虽然项目采用MIT许可证并鼓励社区参与，但目前尚未发布正式版本，其实际应用效果还有待进一步验证。

?https://github.com/sarthakrastogi/quality-prompts

热议话题

AI新动向：企业数据或成发展新引擎

近期研究显示，以消费者互联网为来源的公共数据采集正逐渐接近极限，而企业专有数据可能成为AI创新的新动力。数据显示，Zoom每年产生超2万亿分钟的会议记录，远超YouTube每年1.5亿小时的内容；Ironclad每年处理超10亿份文档；Slack每周传递超10亿条消息。这些海量的专有商业数据不仅数量庞大，而且具有独特价值，可能为AI技术带来新的发展机遇。

与此同时，B2B企业应用展现出强大的变现能力。数据对比显示，Salesforce Sales Cloud的每用户月收入高达$80，远超消费者平台如Meta的$3.73和TikTok的$0.85。这一差异凸显了企业数据的商业价值，可能会吸引更多AI创新聚焦于企业应用领域。

然而，如何在保护隐私和商业机密的同时有效利用这些数据，将是未来AI发展面临的重要挑战。随着技术的进步和政策的完善，企业数据有望成为推动AI技术突破的新引擎。

敬请期待明日的最新动态！

AI情报局征集情报合伙人，汇集独家价值线索！如果您可以提供有关AI最新成果&行业内幕&独特产品，请添加运营微信号：AIyanxishe2备注行业岗位。

雷峰网(公众号：雷峰网)