情报前线
微软全球合伙人、微软亚洲研究院首席研究员童欣离职:据悉,童欣于 1993 年和 1996 年获得浙江大学本科和硕士学位,1999 年从清华大学博士毕业后加入微软亚洲研究院。同时担任中国科学技术大学兼职教授,博士生导师。童欣的主要研究方向是计算机图形学和计算机视觉。作为微软亚洲研究院网络图形组首席研究员,他在微软从事图形学研究25 年。
融资快报
Character AI融资困难,计划出售给谷歌和Meta:由谷歌前员工创立的AI独角兽公司Character AI,曾因角色扮演聊天产品而备受瞩目。尽管A16Z曾以10亿美元估值投资1.5亿美元,但随着市场新鲜感消退和竞争加剧,公司面临融资困难,正考虑出售给谷歌或Meta,Character AI与这些科技巨头探讨了潜在合作,包括计算资源和知识产权共享。同时,公司也在寻求新的收入来源,如广告和API访问,以维持增长。
Zeroeyes获5300万美元B轮融资:Zeroeyes是美国国土安全部指定的唯一人工智能驱动的枪支检测视频分析平台的开发者。索伦森资本牵头的这一轮投资还包括英特尔资本、博德莱特资本和现有投资者。
Northern Data考虑将人工智能部门在美国 IPO:总部位于德国的 Northern Data AG 正在考虑在美国进行首次公开募股,以高达 160 亿美元的估值出售其人工智能云计算和数据中心部门。该公司提供高性能计算基础设施,并计划最早于明年上半年,将由其云计算部门 Taiga 和数据中心组成的实体(名为 Ardent)在纳斯达克证券交易所上市。
AI初创公司Abnormal Security估值将达50亿美元:Abnormal Security利用人工智能检测异常行为,防范商务电邮入侵等网络安全威胁。此前,Abnormal Security已完成C轮融资2.1亿美元,由Insight Partners领投,Greylock Partners 和Menlo Ventures跟投,当时估值40亿美元。
壹号智能完成天使轮融资:壹号智能是一家智能仓储机器人研发生产商,聚焦密集存储细分赛道。本轮融资由合肥市新站区天使投资基金投资。
桥水启动由机器学习决策的20亿美元规模基金:对冲基金巨头桥水公司最新推出了一只由机器学习运行并进行决策的基金。据了解,该基金从不到10位客户那里获得了大约20亿美元的资金。新投资工具由联席首席投资官Greg Jensen牵头,已开始交易。目前新基金依靠桥水公司研发了十多年的专有技术,据知情人士透露,新基金还将扩大范围,纳入OpenAI、Anthropic和Perplexity等公司开发的模型。
ETW获得200万美元战略投资:ETW是一家区块链项目研发商,主要从事人工智能游戏技术研发、AI算法研发业务,以提升游戏的智能化、个性化互动以及游戏情节的深度和复杂度,从而为全球玩家带来更为深刻和沉浸式的游戏体验。ETW宣布获哈佛大学的200万美元战略投资。
(欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品)
国内情报:
中国首款全尺寸人形机器人“青龙”将于 2024 世界人工智能大会亮相并开源:
大会现场将发布国内首款全尺寸通用人形机器人开源公版机“青龙”和首个全尺寸人形机器人开源社区 OpenLoong。“青龙”身高 182 厘米,体重 82 公斤,全身多达 43 个主动自由度,最大关节峰值扭矩 400 牛米,算力支持 400Tops。此外,特斯拉 Optimus 二代也将在 WAIC 2024 迎来首发。
月之暗面 Kimi 开放平台“上下文缓存”开启公测:
该功能通过预先存储频繁请求的数据,可以在不增加 API 价格的情况下,降低最高 90% 的长文本大模型使用成本,并提升模型响应速度,首 Token 延迟降低 83%。
适用场景包括 QA Bot、文档集合查询、静态代码库或知识库分析、爆款 AI 应用以及 Agent 类应用等。计费方式主要分为 Cache 创建费用、Cache 存储费用和 Cache 调用费用。公测期间,该功能首先开放给 Tier5 等级用户,其他用户的开放时间待定。
优必选与一汽-大众达成合作,打造“人形机器人”超级无人汽车工厂:
一汽-大众将向优必选开放其位于青岛的“国家级智能制造示范工厂”生产线应用场景,引入工业版人形机器人 Walker S 开展汽车制造过程中的螺栓拧紧、零件安装、零件转运等工作。此前,优必选工业版人形机器人 Walker S 已进入蔚来第二先进制造基地总装车间、东风柳汽总装车间等多家车厂。
阿里妈妈获国际计算机大会比赛主办权:
阿里妈妈基于入选国际计算机大会NeurIPS 2024的“大规模拍卖中的自动出价”赛题,正式启动全球范围的参赛选手征集。此赛题出自北大-阿里妈妈人工智能创新联合实验室。同时,阿里妈妈获得NeurIPS比赛主办权。据了解,北大-阿里妈妈人工智能创新联合实验室是北京大学联合阿里妈妈共建的校企联合研发平台,重点研究方向包括决策智能、大规模图预训练模型、智能音乐生成等。
2B大模型战胜20B,国产新框架高效处理视觉任务:
Prism 框架是上海 AI Lab、南京大学、香港中文大学等共同开发的一种专门针对视觉语言任务的两阶段框架。它将 VLM 的感知和推理能力显式解耦,在感知阶段,VLM 负责提取图像视觉信息并以文本形式输出;在推理阶段,ChatGPT 等大型语言模型根据 VLM 提供的文本信息和输入文本生成回复。这种分离的方法提高了处理视觉语言任务的效率,使得 2B VLM 与 ChatGPT 的组合能够达到相当于 10 倍参数量 VLM 的性能。
姚班大神陈立杰获UC伯克利教职,2025年秋季入职:
陈立杰将于 2025 年秋季任加州大学伯克利分校 EECS 助理教授。他 1995 年出生,是清华大学姚班知名校友,2016 年清华特等奖学金得主,也是首位在 FOCS 上发表论文的中国本科生。
更多国内情报:
腾讯搜狗输入法上线AI 帮写、AI 对话、快捷问答、AI 宠物和 AI 自拍表情等功能:此次 AI 升级使输入法从简单输入向智能辅助转变,改变输入法的互动方式,提供内容创作、信息查询和娱乐互动等多方面服务。
腾讯云推出星脉网络2.0 大模型训练再提速20%:通过升级硬件和软件,提高大模型训练的效率,具体包括支持更大规模的集群网络、提升通信协议性能、优化集合通信库,以及引入灵境仿真平台。
网易有道推出有道词典笔X7:该产品内置AI摄像头,并搭载国内首个教育大模型“子曰”的两款应用功能,AI全科家庭教师小P老师、虚拟人口语私教Hi Echo。
联合国大会通过中国提出的加强人工智能能力建设国际合作决议:140 多国联署决议,强调人工智能发展应坚持以人为本、造福人类等原则,鼓励国际合作,帮助发展中国家加强人工智能能力建设。
四部门印发《国家人工智能产业综合标准化体系建设指南(2024版)》:到 2026 年,计划通过提高标准与产业科技创新的联动水平,新制定 50 多项国家标准和行业标准,推动人工智能产业高质量发展,这是中国在人工智能领域标准化方面的重大布局。
国际情报:
苹果发布 AI 大模型 4M:
苹果与瑞士联邦理工学院洛桑分校合作,在 Hugging Face Spaces 平台推出4M AI 模型的公开演示版。距离该模型首次开源已有七个月,4M 演示版能够处理和生成包括图像、文本和 3D 场景在内的多种模态内容,用户可以通过文本描述生成图像,进行物体识别,甚至使用自然语言操控 3D 场景。
TikTok开发新AI聊天Genie,已申请商标,服务海外用户:
Genie 商标已在美国申请,预计该聊天机器人将允许用户在直播中提出问题并获得即时答复等功能,集成了 TikTok 的多种 AI 元素,包括生成式人工智能搜索功能,该功能已在抖音中文版推出,并且正在开发 AI 音乐生成、文本转视频创建等工具。此外,TikTok 还在开发 StreamVoice 系统,该系统能够模拟人的声音,以及虚拟人直播功能。
ECCV 2024录用率或创新低,2395篇论文中选:
ECC2024 录用 2395 篇论文,提交量约 12600 篇,录用率 18%创新低。作为对比,CVPR 2024 录用率 23.6%,ECCV 2022 录用率 28%。
RunwayGen-3向所有人开放,媲美Sora:
Gen-3 目前每次只能生成 11 秒 720P 视频且无背景音乐,没有免费试用,每月至少 12 美元。Runway 的 Gen-2 及其他产品免费,另外Gen-3会提供运动画笔、相机控制、导演模式等高级功能,帮助用户制作更精良的视频。
英伟达发布直播神器NVIDIA Broadcast,加点AI提升直播质量:
NVIDIA Broadcast 是专为 RTX GPU 用户设计的应用程序,具有噪音和回声去除、虚拟背景、自动对焦、视频噪点去除和眼神接触等功能,支持多种应用程序,如 Discord、Google Meet、Microsoft Teams 等,能提供专业和创意的直播体验。
Anthropic推出新计划,资助新一代AI基准测试的开发:
该计划鼓励开发者参与基准测试评估工作,旨在提升 AI 安全领域水平,为研究人员提供工具。Anthropic 认为目前 AI 基准测试无法反映实际情况,呼吁对模型进行网络攻击、增强大规模杀伤性武器能力以及操纵或欺骗人们的能力测试。
全球首个神经连接机械腿,截肢者恢复自然行走:
麻省理工学院研究团队开发出一种新型机械腿,通过神经接口和兴奋剂 - 拮抗剂肌神经接口的手术方法,使膝盖以下截肢患者能够通过自身神经信号控制机械腿的运动,恢复自然的步态和肢体在空间中的位置感。
OpenAI CEO 奥特曼称GPT-5 将带来“巨大飞跃”:
奥特曼表示开发GPT-5还需要一些时间,并表示它将是“巨大飞跃(significant leap forward)”。此前,奥特曼曾公开表示 GPT-4 “有些糟糕”,并委婉地称之为“充其量只是有点尴尬”。
奥特曼解释说:“我希望它能取得重大飞跃。GPT-4 经常犯很多错误,比如在推理方面表现不佳,有时还会完全跑偏,犯下低级错误,就像连一个六岁孩子都不会犯的一样。”奥特曼关于 GPT-5 的言论暗示,这个模型可能仍处于早期开发阶段。这可能归因于复杂算法、数据问题以及 GPT-5 本身庞大的体量。
价值近300亿,马斯克称训练Grok-3用了10万块英伟达H100:
马斯克表示,训练 AI 聊天机器人需要数据集,而且从现有数据中清除大型语言模型的工作量很大。他还谈到了 OpenAI 模型输出训练的几个问题。他透露 xAI 的 Grok-3 用了 10 万块英伟达 H100 芯片进行训练,预计将于年底发布,相信它会“非常特别”。
比尔·盖茨称Scaling Law快要走到尽头,超人AI还需新的突破:
比尔·盖茨讨论了人工智能的发展,强调其在医疗、教育和生产力中的重要性。他认为 AI 将影响合成生物学和机器人技术,并预测个人智能体会通过耳机、眼镜等设备与人类交互。盖茨指出,AI 的真正进步在于实现更接近人类的元认知能力,而非仅扩大模型规模。他预期 AI 将提升生产率并改善生活质量,但也提醒需警惕技术发展对社会的影响。
更多国际情报:
Adobe发布全新改进的Content Hub,具备生成式AI功能:该平台集成了 Adobe Experience Manager Assets,旨在帮助企业高效管理数字资产,优化内容供应链,并提升营销活动和数字体验的创建。
全球首例,法国反垄断机构准备对英伟达出手:违反反垄断法的公司可能面临高达其全球年营业额10%的罚款,以英伟达2024财年609亿美元的营收来计算,罚款金额最高可达60.9亿美元。
遭摄影师投诉后,Instagram将“Made with AI”标签换成“AI info”:此前用户仅使用Adobe的裁剪工具和拼合图像就会触发该标签。
YouTube 允许用户请求删除模拟的面部或声音的 AI 生成内容:受影响的个人可以基于隐私侵犯理由,通过YouTube的隐私请求流程要求删除AI生成的内容。
AWS承诺投入5000万美元支持公共部门生成式AI创新:旨在通过提供云信用和先进的 AI 基础设施,加速公共部门在生成式 AI 领域的创新。这个计划预计将持续两年,并提供对 AWS 服务的访问权限。
到2027年,Deepfakes带来的损失将达到400亿美元:复合年增长率将达到惊人的32%。预计到2024年,此类事件将增加50%至60%,全球将有140000-150000起此类事件。德勤预计,银行和金融服务将成为主要目标。
Product Hunt 热榜,智能摘要工具Briefy.AI
Briefy是一款创新的人工智能摘要工具,能够将各种长篇内容快速转换成结构化摘要。这款工具支持文章、视频、邮件和播客等多种内容类型,并提供概览、表格、思维导图等多种视图展示方式。用户可以在个人知识库中方便地管理和回顾这些摘要,还能使用自然语言搜索快速找到所需信息。
Briefy的多语言支持和全设备兼容性使其成为学生、专业人士和内容创作者的理想选择。用户反馈显示,Briefy极大地提高了阅读效率,并在理解复杂主题时提供了显著帮助。
?https://briefy.ai/?ref=producthunt
GitHub Trending 热榜,增强人类能力的开源框架 AI助手Fabric
Fabric是一个创新的开源框架,旨在通过AI技术放大人类创造力。一个为了解决特定问题而提供的模块化框架,通过一个由人群源提供的 AI 提示集来实现,这些提示可以在任何地方使用,包括可选的服务器(Mill)、AI使用案例(Patterns)和客户端应用(Looms),让用户能轻松应用AI解决特定问题。
这个命令行原生的工具支持自定义模式和辅助应用,使用简单yet功能强大。未来,Fabric计划转向Go语言,以提供更流畅的用户体验。无论是分析YouTube视频还是处理复杂数据,Fabric都为AI辅助人类工作开辟了新途径。
?https://danielmiessler.com/p/fabric-origin-story
开发者推荐,AI 赋能邮件管理新工具 Superhuman 2.0
Superhuman公司最近发布了其电子邮件管理工具的2.0版本,旨在通过人工智能和一系列高级功能提升用户处理邮件的效率。该工具针对使用Gmail或Outlook的团队设计,声称能帮助用户以两倍于以往的速度处理邮件,每年为团队节省超过1000万小时。
Superhuman 2.0整合了多项功能,包括AI辅助写作、智能收件箱分类、自动跟进提醒等。用户反馈表明,这些功能有助于加快决策速度,提供更高质量的回复,并让团队成员更专注于重要工作。然而,具体效果可能因个人使用习惯和团队需求而异。
?https://superhuman.com/?ref=producthunt
前沿技术
1.北大港科大联手推进医疗AI:模型性能达GPT-4水平
北京大学和香港科技大学的研究团队最近在医疗人工智能领域取得重大进展。他们提出了一种新的医疗专家模型训练方法,成功将8B规模的模型性能提升至接近GPT-4的水平。研究中引入的"稳定性差距"概念有效解决了大语言模型持续预训练中的问题。
该团队通过优化训练策略,在医疗领域实现了显著效果,同时大幅减少了计算资源消耗。这项研究成果已在HuggingFace平台上开源,为医疗AI的发展提供了新的可能性。这一突破展示了大语言模型在特定领域应用的潜力,可能对未来医疗实践产生深远影响。
?https://arxiv.org/abs/2406.14833
2.MotionClone:无需训练的动作克隆技术引领视频生成新时代
中国科学技术大学、上海交通大学等多所高校的研究团队近日提出了一种名为MotionClone的创新视频生成框架。这项技术突破性地实现了无需训练的动作克隆,能够从参考视频中提取动作,并通过时序注意力指导和位置感知语义指导两大核心组件,对文本到视频的生成过程进行全面控制。
MotionClone的出现解决了传统方法在跨领域应用时可能出现的动作生成问题,同时提升了生成模型对空间关系的合成能力和对提示的遵循程度。这一突破性成果不仅展示了AI在视频生成领域的巨大潜力,也为未来的创意产业和内容创作开辟了新的可能性。
?https://bujiazi.github.io/motionclone.github.io/
3.MimicMotion:腾讯联手上交大打造新一代人体动作视频生成器
腾讯与上海交通大学的研究团队近日推出了名为MimicMotion的创新人体运动视频生成框架。这一突破性技术旨在生成任意长度的高质量视频,通过融合图像到视频扩散模型和引入置信度感知的姿态指导,显著提升了生成视频的时间一致性和细节丰富度。
MimicMotion在多个方面超越了现有技术,尤其在手部细节生成和长视频平滑过渡方面表现卓越。研究团队通过大量实验和用户研究,证实了该框架在视频质量、时间一致性和对参考姿态的准确遵循等方面的优势。这一成果不仅推动了AI视频生成技术的进步,也为未来虚拟内容创作和数字娱乐产业开辟了新的可能性。
?https://tencent.github.io/MimicMotion/
4.Mobile-Agent-v2: 通过多代理协作有效导航的移动设备操作助手
Mobile-Agent-v2 是由北京交通大学和阿里巴巴集团联合开发的一个移动设备操作助手,它旨在通过多代理协作解决长上下文图文交错输入中的导航问题。该系统采用了增强的视觉感知模块以及 GPT-4o 技术,以提高操作的准确率和效率。目前,Mobile-Agent-v2 支持的系统有安卓和鸿蒙(版本号小于等于 4),而 iOS 系统暂时不支持。使用前需要安装依赖、通过 ADB 连接移动设备、安装 ADB 键盘,并配置 run.py 文件中的设置,包括 ADB 路径、指令、GPT-4 API URL 和 Token。用户可以根据自己的设备性能选择本地部署图标描述模型还是通过 API 调用方式,并可以根据需要添加操作知识以提高准确性。此外,通过调整 “反思智能体” 和 “内存单元” 的开关,可以进一步提升移动设备的效率。
?https://github.com/X-PLUG/MobileAgent
5.腾讯推出革命性多智能体翻译工具TransAgents,免费试用中!
腾讯最新推出的TransAgents翻译工具,这款基于GPT-4的多智能体协作系统不仅能高质量翻译网络文学,更开放免费在线试用。只需上传txt或pdf文件,TransAgents就能为你呈现专业级翻译。
TransAgents采用创新的多Agent协作模式,涵盖翻译、文化适应、校对等全方位服务。已成功翻译20本网文,获得读者青睐。无论你是文学爱好者还是专业译者,都不容错过这次AI翻译!
? http://transagents.ai
大牛洞见
AI革命:从数字物种到信息处理巨人
Mustafa Suleyman,微软 AI 首席执行官,也是当前许多人使用的 AI 模型之一的主要建造者,在 TED2024 大会上发表演讲,探讨了人工智能的本质问题。他指出,即使是 AI 领域的专家也在努力描述这一技术的未来方向。Suleyman 提供了一个新的数字物种隐喻,旨在将注意力集中在人工智能领域的这一关键时刻。他的演讲后续还包括了与 TED 首席执行官 Chris Anderson 的问答环节。演讲内容涵盖了技术、计算机、创新、未来、人工智能和机器学习等领域。此外,还引发Reddit用户的热烈讨论,
展示AI惊人的数据处理能力:月训练量达8万亿字
专家和网友都在努力理解AI的本质和未来方向
AI学习效率vs人类:缺乏感知能力,但数据处理量巨大
警惕AI"幻觉"问题,强调人为核实的重要性
AI数据收集引发伦理思考
? https://www.ted.com/talks/mustafa_suleyman_what_is_an_ai_anyway?language=en&subtitle=en
敬请期待明日的最新动态!
AI情报局征集情报合伙人,汇集独家价值线索!如果您可以提供有关AI最新成果&行业内幕&独特产品,请添加运营微信号:AIyanxishe2备注行业岗位。
雷峰网(公众号:雷峰网)