今日融资快报
机械臂公司 Standard Bots 获 6300 万美元融资,亚马逊、三星等参投
Standard Bots Inc. 是一家为制造业和物流业开发机械臂的初创公司,该公司已获得 6300 万美元的 B 轮新资金。本轮融资由 General Catalyst 领投,亚马逊工业创新基金、Samsung Next 和几家老投资者也参与了该公司的投资。
AI临床洞察平台Regard获得6100万美元B轮融资
Regard总部位于洛杉矶,是一个AI临床洞察平台,致力于为患者数据提供AI co-polit临床洞察服务。去年该公司宣布将与 OpenAI 合作发布基于 GPT-4 构建的名为 Max 的聊天机器人,为临床医生搜索患者数据以节省时间,通过根据患者数据自动起草部分临床记录来模拟住院医师的角色,并根据临床指南检查文件以进行准确审计。
Regard联合创始人兼首席执行官Eli Ben-Joseph拥有麻省理工学院生物工程和生物学学士学位,斯坦福大学管理与计算机科学硕士学位。曾在斯坦福大学担任计算机系统助教,并在MIT媒体实验室从事特别项目。毕业后5个月创立Regard。近日,Regard获得6100万美元B轮融资,Techstars科技之星、Calibrate Ventures、TenOneTen Ventures、Cedars-Sinai Health Ventures、Oak HC/FT投资。
边缘计算平台提供商Armada获得4000万美元战略投资,微软领投
Armada 是一家移动边缘计算平台提供商,可在全球任何地方提供互联网连接和计算服务。该公司最初专注于部署旨在为远程连接设备提供支持的人工智能计算工具。Armada 表示,其技术已被 43 个国家的客户部署,包括全球石油和天然气集团、娱乐公司和国家政府机构。
Armada获得4000万美元战略投资,微软Microsoft领投。这笔资金将用于开发针对 SpaceX Starlink 宽带网络量身定制的移动数据中心。此前,SpaceX 的早期投资者 Founders Fund 领投了 Armada 的 5500 万美元融资。
网络调查平台Command Zero获2100万美元融资
Command Zero是位于德克萨斯州奥斯汀的自主和用户主导的网络调查平台提供商,筹集了2100万美元的种子资金,本轮融资由 Andreessen Horowitz 领投,Insight Partners 和 60 多位网络行业思想领袖和高管参投。
Command Zero 由 Dov Yoran、Dean De Beer 和 Alfred Huger 共同创立,提供自主且以用户为主导的网络调查平台,旨在为复杂企业环境中的安全运营提供支持。该解决方案将专家调查问题、自主和用户主导的方法结合在联合数据模型上,使用户能够在现代企业的所有通用数据源中以技术独立的方式提出问题。使用该平台,分析师可以利用自动化和大语言模型来提高调查的速度、准确性和一致性。
?https://www.cmdzero.io/
情境 AI 助手Medal融资1300万美元,用于打造桌面上下文AI助手
Medal是一家以其视频游戏剪辑产品而闻名的初创公司,还推出了一款新的跨平台桌面应用 Highlight,可充当用户的情境 AI 助手。该应用可捕捉屏幕上的内容,并让你根据该情境向大型语言模型 提问。
Medal宣布已从 Horizons Ventures、OMERS Ventures、peak6 和 Arcadia Investment Partners 等多家投资者处融资 1300 万美元,估值为 3.33 亿美元。
AI建筑平台Buildots获 1500 万美元融资,英特尔领投
Buildots 利用人工智能和计算机视觉对自动化现场进度跟踪,该平台为施工团队提供准确的数据和以前无法获得的预测性能指标,使他们能够做出数据驱动的决策。Buildots 的平台提高了项目的可见性和效率,从而减少了延误、增强了错误检测并成功交付了项目。Buildots 正在帮助提高北美、英国和欧洲、中东和非洲地区大型建筑项目的效率。
本轮融资由英特尔资本领投,OG Tech Partners和之前的投资者参投。在融资的同时,英特尔投资总监Lisa Cohen将作为董事会观察员加入。
Product Hunt 热榜产品Wanderboat AI获得数百万美元种子轮投资
Wanderboat AI成立于2023年,是一家由GPTT4驱动的智能旅行规划平台。用户通过与聊天机器人对话,输入旅行偏好、目的地或任何需求,获得定制化的行程推荐。平台会把出游建议、所有景点和餐厅照片、视频、地图、点评等各类信息整合在一起,形成结构化的一站式解决方案。
两位创始人都是华人,CEO兼联合创始人You Wu (Ng) 曾在微软的 Bing和Copilot团队担任首席应用科学家,拥有伊利诺伊大学香槟分校计算机工程硕士学位和同济大学电气与电子工程学士学位。另一位联合创始人Xiaochuan Ni于08年起就职于微软,曾任Turing部门首席应用科学家经理。主要负责Copilot、Bing Chat、LLM on search、Question-Answering等项目。期间也曾任LinkedIn软件工程师和Bing数据科学家,专注于搜索质量及相关性、核心排名等。公司获得美国红杉资本的种子轮投资。 Lepton AI 创始人贾扬清也表示了对 Wanderboat AI 的肯定。
?https://wanderboat.ai/?ref=producthunt
全链AI聚合器Aidatify获得830万美元种子轮融资
Aidatify是一家全链AI聚合器提供商,可以识别模式、预测趋势,并提供在DeFi领域做出明智决策所需的重要见解。
Aidatify以1.5亿美元估值完成总额830万美元首轮融资,STIX、oilinvest、AlterGlobal、Spencer等参与投资。Aidatif由全链和DeFi基础设施VGESS团队构建,募集资金将用于扩大对Aidatify生态系统和产品的投资。
AI游戏开发Iconic AI获 400 万美元融资,用AI彻底改变游戏开发
Iconic AI 是一家位于伦敦的 AAA 级游戏工作室,旨在通过集成 AI 来简化制作流程,从而降低传统上所需的规模和成本,从而彻底改变游戏开发。创始人兼CEO John Lusty 毕业于剑桥大学计算机科学专业,拥有 20 年的高级软件工程专业经验,领导着多达 140 人的团队,涵盖自动驾驶汽车、虚拟现实、社交网络和 AAA 游戏。 他曾在FiveAI任VP Engineering,Snap 任工程总监,Meta任高级软件工程师,Oculus London创始人…
Iconic AI获得了 400 万美元融资,本轮融资由 HodlCo 领投,FOV Ventures、Interface Capital、Deepwater Asset Management 以及红杉资本和 Atomico 的球探基金参投。它还吸引了 DeepMind、OpenAI、迪士尼、腾讯和 Microsoft 的著名现任和前任高管的投资。新资金将用于战略性地扩大核心团队,增强研发能力,并加速Iconic AI第一款游戏的发布。
?https://iconicgames.ai/
AI法律平台PointOne获350 万美元种子轮融资
PointOne 利用人工智能自动化律师事务所的计时和计费工作,帮助律师从使用的各种应用程序中捕获数据,生成完整的时间记录,减轻工作繁琐。联合创始人兼CEO Adrian Parlow拥有宾夕法尼亚大学法学博士,曾参加Y Combinator的W24项目,在Wefunder担任总经理,离职后创立PointOne。
本轮融资Bessemer Venture Partners、8VC、General Catalyst 和 Y Combinator 参与其中。其他投资者包括 Cooley 附属投资基金、Soma Capital、Rebel Fund、Ritual Capital、Script Capital、Twenty Two Ventures、Harvest Ventures、Chris Golda 等,包括该公司的几位客户。
?https://pointone.ai/
AI编程Recurse ML获250万美元种子轮融资
Recurse ML 的愿景是创建一种新的编程范例,其中代码库维护由 ML 代理完全从开发人员手中抽象出来。该平台专为企业环境而构建,通过无缝集成到工作流程、自动化繁琐的任务并允许软件工程师使用单个命令维护代码库,简化了开发流程。
创始人 Jack Jackson 和 Armins Stepanjans 于 2023 年 9 月在伦敦举办的 Entrepreneur First 会议上相识。他们都拥有深厚的工程背景,并且热衷于帮助软件工程师突破瓶颈,不受瓶颈阻碍。Jack在牛津大学攻读了网络安全博士学位,后来放弃学位,创办了Recurse ML,Armins 以优异的成绩获得了剑桥大学的哲学硕士学位。本轮融资由seedcap与 Playfair 共同领导,并得到 Ventures Together 和天使投资者的额外支持。
?https://recurse.ml
(欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品)
今日大厂风闻
智谱AI开源推出视频理解模型 CogVLM2-Video
智谱AI提出基于视觉模型的自动时间定位数据构建方法,生成了3万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练了一种新的视频理解模型—CogVLM2-Video。
发短信就能用的 AI 大模型,中国电信推出“星辰慧答”
该服务由中电信人工智能公司和中国电信人工智能研究院联合研发,涵盖语义、语音、视觉、多模态等领域。用户只需向特定号码发送短信,即可体验 AI 的智能交互,包括语言理解、文本生成、知识问答和逻辑推理等功能。星辰慧答的回复不收取费用,但用户主动发送的上行短信按照套餐标准收费。此外,该服务不依赖于网络信号的稳定性,通过短信信令通道传输数据。星辰慧答还能够创作诗词、润色文本、写文章,甚至生成代码。
腾讯AI实验室项目vta-ldm:输入视频生成对齐音频
腾讯 AI 实验室发布名为 “隐含对齐视频到音频生成” 的新模型 VTA-LDM,该模型能够生成与视频内容在语义和时间上相匹配的音频。研究团队在模型设计上进行了深入探索,结合了多种技术手段,以确保生成音频的准确性与一致性。实验结果显示,VTA-LDM 模型在生成质量和视频与音频同步对齐方面表现出色,用户可以通过将视频片段放入指定的数据目录并运行推理脚本来生成对应的音频内容。模型提供了多个不同的模型版本,以满足不同的研究需求。
项目? :https://github.com/ariesssxu/vta-ldm?
OpenAI 严厉「封口协议」再遭举报
一位举报人指控 OpenAI 非法禁止其员工警告监管机构其技术风险,并向美国证券交易委员会提交长达 7 页的信函,要求调查。信中称 OpenAI 员工协议过于严格的雇佣、遣散费和保密协议,可能导致员工被处罚。
消息称 4050 亿参数版 Meta Llama 3 将于 7 月 23 日发布
内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3 405B,在现有 80 亿和 700 亿参数两个版本之外,推出 4050 亿参数版本,号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时,扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型,但当时没有透露太多的信息。
H100利用率飙至75%!FlashAttention三代性能翻倍
FlashAttention v1和v2的第一作者是Mamba的共同一作,普林斯顿大学助理教授Tri Dao,他的名字也在FlashAttention-3的作者列表中。Tri Dao师从于Christopher Ré和Stefano Ermon,去年6月在斯坦福大学获得计算机博士学位,毕业后担任Together AI的首席科学家,并从今年6月开始入职普林斯顿大学。
FlashAttention-3 是针对 Hopper GPU 系列的第三代优化算法,它在之前版本的基础上,通过利用 Tensor Cores 和 TMA 的异步性、交替进行块状矩阵乘法和 softmax 操作以及使用 FP8 低精度非相干处理等技术,将 H100 GPU 的 FLOP 利用率从 35% 提升到 75%,实现了在 FP16 模式下的 1.5~2 倍速度提升,达到了 740 TFLOPS 的性能。在 FP8 模式下,性能可接近 1.2 PFLOPS,且误差小于基线 FP8 注意力的一半。这些改进不仅提高了 GPU 利用率,提升了低精度性能,还增强了大型语言模型处理更长上下文的能力。论文和项目代码已发布,但目前仅支持 H100 和 H800 GPU。
项目? :https://github.com/Dao-AILab/flash-attention
6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码
该研究由微软、MIT 等机构的学者共同完成。受到了图灵奖得主Judea Pearl启发,他们提出了一种创新的训练范式 —— 公理化训练,旨在解决大模型在推理方面的缺陷。通过构建因果模型和使用简单的因果链作为训练数据,研究人员训练了一个只有 6700 万参数的微型 Transformer 模型。结果表明,这个模型在推断复杂图表中的因果关系时,其性能不仅超越了十亿级参数的大型语言模型,甚至可以与 GPT-4 相媲美。
论文? :https://arxiv.org/abs/2407.07612v1
亚马逊推出 AI 购物助手 Rufus,可回答客户各种问题
亚马逊宣布其生成式 AI 购物助手 Rufus 经过五个月的小范围测试之后现已面向所有美国客户开放。亚马逊表示,Rufus 旨在帮助用户节省时间并做出更明智的购物决策。它可以回答各种各样的购物需求和商品问题,“就像随身带了一个购物助手一样”。
谷歌将Gemini 1.5 Pro安装到机器人上,实现记忆导航能力
在近 9000 平方英尺的空间内,机器人能够执行 57 种不同的任务,成功率高达 90%。这些任务包括找到画画的地方,机器人能够理解指令并带领用户到目的地。Gemini 1.5 Pro 系统的核心优势在于其处理多模态长上下文窗口的能力,使得机器人能够记住关键位置,理解人类指令、视频导览,并且能够运用常识进行推理。DeepMind 的团队还采用了分层视觉 - 语言 - 动作技术,让机器人能够理解书面、绘图命令和手势指令。这种系统让机器人在复杂的空间中不再需要人类的时时刻刻指导,能够记住环境,理解指令,并以自己的方式完成任务。
谷歌推通用视频模型VideoPrism 精准分类、定位、检索一网打尽
谷歌的 VideoPrism 模型是一款视频编码器,它能够在多种视频理解任务上使用一个模型达到最先进的水平,包括视频分类、定位、生成字幕和回答关于视频的问题等。该模型的训练过程包括使用大量高质量的视频 - 字幕对和带有噪声的平行文本视频片段,以及基于视频 - 文本对比训练和掩蔽视频建模的算法。在 33 个基准测试中,VideoPrism 在 30 个测试中都达到了最先进的水平,显示出其在视频理解领域的强大能力。
论文? :https://arxiv.org/pdf/2402.13217
Andrej Karpathy 24 小时仅用 672 美元“重现”GPT-2
Andrej Karpathy 利用 llm.c 项目和单个 8XH100 节点,将 GPT-2 的训练成本降低到每小时 28 美元,相比原先的每小时 256 美元,成本减少了近 90%。Karpathy 指出,llm.c 直接用 C / CUDA 实现 GPT 训练,无需 conda 环境、Python 解释器、pip 安装等,因此启动云 GPU 节点后几分钟即可开始训练。在 24 小时内,Karpathy 成功生成了关于 “安第斯山脉中会说英语的独角兽” 的样本。
AI原生互动侦探游戏,刚上线就爆火
AI 侦探游戏 AI Alibis 开源,该游戏由两位外国游戏爱好者开发,并在 Anthropic 的开发者竞赛中作为参赛作品。游戏中,玩家需要通过与六个性格迥异的 AI NPC 进行互动,解开一个谋杀案件。该游戏因其免费、免下载、免注册、中文友好、浏览器运行等特点而受到网友关注,并在 Hackers news 上登顶。
试玩? :https://ai-murder-mystery.onrender.com/
开源代码? :https://github.com/ironman5366/ai-murder-mystery-hackathon
Heygen推对口型工具 上传照片+音频即可说话、唱歌
只需要上传一张照片和一段音频,照片中的人物就能根据音频内容开始说话、唱歌,甚至是朗读。支持长达20秒的音频。这个工具还能识别出主要的声音,并且确保视频中的唇形和表情与音频完美同步。不过目前中国区用户既不能登录,也不能重新注册账号。
?:https://labs.heygen.com/guest/expressive-photo-avatar
OpenAI 翁丽莲提出大模型「外在幻觉」
翁丽莲提出了大模型 “外在幻觉” 的概念,将 LLM的幻觉问题具体化为模型输出内容的虚构性,即模型生成的内容既不基于提供的上下文也不基于世界知识。幻觉分为上下文内幻觉和外在幻觉,其中上下文内幻觉指的是模型输出与上下文中的源内容不一致,而外在幻觉则是模型输出的内容虽然与上下文相符,但并非基于预训练数据集,即不能通过外部世界知识进行验证。翁荔还提出了 Agent 公式,即 Agent = 大模型 + 记忆 + 主动规划 + 工具使用。
吴恩达抵制美国SB 1047法案,称对开源大模型是毁灭性打击
全球著名AI科学家吴恩达在社交平台发表深度长文,再次抵制并吐槽美国加州拟定的SB-1047法案。他表示,仍然对美国加州拟定的SB 1047法案,对开源大模型带来的巨大伤害感到震惊。这个法案犯了一个严重根本性错误,应该监管的是通过大模型开发的生成式AI产品,而不是开源大模型本身。
欧盟《人工智能法案》8 月 1 日生效,学校 / 工作场所不得使用实时情绪识别系统
AI 法案生效后 6 个月内,将禁止使用人脸识别信息进行数据库集合,以及在学校和工作场所使用实时情绪识别系统。9 个月后,将对 AI 开发者实施 “行为准则”,并与一些 “一般用途” 的模型公司合作,这些公司被认为具有 “系统性风险”。一年后,公司如 OpenAI 必须遵守新的 “透明度” 要求,并确保其系统对用户安全且易解释。此外,AI 法案还包括用于生成式 AI 的规则,要求生成的图像、影音内容必须被明确标记。对于训练 AI 大模型的公司,还必须遵守《版权法》,除非其模型的用途纯粹只是研究、开发。
今日产品动态
Product Hunt 热榜,AI 助手电子表格 SUPERGPT
Superjoin 最新推出的 SUPERGPT 功能将 ChatGPT 引入 Google Sheets,为用户提供智能内容生成、信息提取和自动填充等多项功能。并提供代码 MEOW3 供用户免费试用 3 个月。除了核心功能外,该工具还支持实时翻译、数据总结,以及自动数据拉取和警报设置等增强功能,无需信用卡即可安装试用。
? https://www.superjoin.ai/producthunt?ref=producthunt
GitHub Trending 热榜,开源自主 AI 编程助手Tabby
Tabby 是一款开源的自主托管 AI 编程助手,为团队提供了替代 GitHub Copilot 的本地化选择。这款工具允许每个团队轻松搭建自己的基于 LLM 的代码补全服务器,无需数据库管理系统或云服务即可独立运行。
Tabby 的特点包括提供 OpenAPI 接口,便于与现有基础设施(如云端 IDE)集成,并支持消费级 GPU。这使得 Tabby 成为追求自主可控、注重数据隐私的开发团队的理想选择,为 AI 辅助编程领域带来了更多可能性。
?https://tabby.tabbyml.com/
开发者推荐
1.AI 会议助手 Fathom 荣获 2024 年 G2 最高满意度奖
Fathom 作为一款领先的 AI 会议助手,凭借其出色的性能和用户体验获得了 2024 年 G2 最高满意度产品奖。这款工具能够自动记录、转录和总结会议内容,支持 28 种语言,并可与多种 CRM 系统和常用工具无缝集成。用户反馈显示,Fathom 极大地提高了会议效率,每次会议可节省约 20 分钟,年度累计可节省 1.5 周时间。
?https://fathom.video/
2.Riffo 助力高效文件命名
Riffo 是一款创新的 AI 驱动文件管理工具,旨在解决用户在文件命名和组织方面的常见困扰。这款工具集成于菜单栏,支持多种文件格式的批量重命名,利用 AI 技术为用户提供智能化的命名建议,大大简化了文件管理流程。Riffo 的设计注重用户体验和效率,它能快速处理大量文件,支持自定义命名规则,并提供高速的并行处理能力
?https://riffo.ai/
3.AI 驱动的函数调用革新:APIGen 助力开发者提效
APIGen 作为一款创新的自动化数据生成工具,正在为函数调用应用程序开发带来重大变革。这个智能系统能够通过自然语言指令自动生成并执行多样化的 API 调用,大幅简化了开发流程,使得复杂的功能实现变得轻而易举。
APIGen 不仅生成高质量、可验证的数据集,还通过严格的三层验证确保数据的可靠性。其训练出的模型在性能上甚至超越了一些知名的大型语言模型。
?https://github.com/ApiGen/ApiGen
4.AI 赋能文字编辑:AiEditor 开源富文本编辑器问世
AiEditor 的开源 AI 驱动富文本编辑器,为文本编辑领域带来新的变化。这款工具融合了人工智能技术,为用户提供智能化的编辑体验,包括实时推荐和修改建议,大幅提升了文字处理的效率和精准度。作为开源项目,AiEditor 不仅为用户带来了先进的编辑功能,还为开发者社区提供了持续优化和定制的机会。这种开放的特性使得 AiEditor 有望在未来得到更广泛的应用和发展,为各类文字工作者带来更多便利。
?https://www.producthunt.com/posts/aieditor?utm_source=uwl.me
5.AI 助手 Cradle 突破通用计算机控制领域
昆仑万维联合多家研究机构推出了一款突破性的 AI 框架 Cradle。这个开源框架能够像人类一样通过键盘和鼠标直接操控计算机,无需依赖内部 API 即可与各种软件交互。Cradle 采用六大核心模块,包括信息收集、自我反思等,实现了高度的通用性和自主决策能力。在实际测试中,Cradle 展现出令人印象深刻的多样化能力。它不仅能在复杂的游戏环境中完成任务,如在《荒野大镖客 2》中骑马作战,还能熟练操作日常办公软件,执行发送邮件、修图剪辑等工作。
论文? :https://arxiv.org/abs/2403.03186
项目? :https://baai-agents.github.io/Cradle
代码? :https://github.com/BAAI-Agents/Cradle
敬请期待明日的最新动态!
AI情报局征集情报合伙人,汇集独家价值线索!如果您可以提供有关AI最新融资&行业内幕&独特产品,请添加运营微信号:AIyanxishe2备注行业岗位。
雷峰网(公众号:雷峰网)