融资快报
Groq 正进行新一轮融资,估值或将达25亿美元:据多位消息人士透露,由前谷歌高管和TPU的发明者之一的Jonathan Ross于创立的AI芯片公司 Groq,在由全球最大资产管理公司之一的贝莱德集团领投的新一轮融资中,估值或将高达25亿美元。
Bright Machines获1.26亿美元C轮融资:Bright Machines是美国机器人驱动软件研发商。投资者包括英伟达和微软。参与C轮融资的其他投资者包括风险投资公司Eclipse Ventures、机器人制造商Jabil和贝莱德。
Etched获1.2亿美元A轮融资:AI芯片初创公司Etched宣布筹集了1.2亿美元的A轮融资,本轮融资由Primary Venture Partners和Positive Sum Ventures领投,并获得了 Hummingbird、Fundomo、Fontinalis、Lightscape、Earthshot、Two Sigma Ventures和 Skybox Data Centers等机构投资者的支持。筹集资金用于设计和开发Sohu新型AI芯片,专注于处理AI推理中的Transformer架构。
EvolutionaryScale完成超1.42亿美元种子轮融资:EvolutionaryScale是一家AI生命科学和蛋白质生成初创公司。本轮融资由Nat Friedman & Daniel Gross以及Lux Capital领投,参与方包括亚马逊、NVentures和多位天使投资者。
Function Health获得5300万美元A轮投资:Function Health是一家身体健康数据整合公司,基于人工智能与临床医生的意见、为用户提供健康建议。融资由a16z领投,Wisdom Ventures等跟投。
TechWolf获4275万美元B轮融资:TechWolf提供一种基于人工智能的人力资源技术解决方案。本轮融资由Felix Capital领投,参与融资方包括20VC、Acadian Ventures、Fortino Capital Partners、Notion Capital、PMV、SAP、SemperVirens、ServiceNow Ventures和Stride。VC、Workday Ventures以及Deepmind和Meta的知名人工智能领导者。
Norm Ai获2700万美元A轮融资:Norm Ai是一家AI驱动的监管合规平台。本轮融资由Coatue领投,Bain Capital Ventures、Blackstone Innovations Investments、New York Life Ventures、Citi Ventures、TIAA Ventures以及Jefferson River Capital等参投。
VidAU获天使轮融资:VidAU是一个AI视频创作平台。本轮由AI出海产业投资River Jin Technology Limited投资。
(欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品)
国内情报:
钉钉将对所有 AI 大模型厂商开放,首批 7 家接入:
钉钉总裁叶军宣布钉钉将对所有大模型厂商开放,构建“国内最开放 AI 生态”。其中,MiniMax、月之暗面、智谱 AI、猎户星空、零一万物和百川智能,六家千亿级大模型厂商已宣布接入钉钉,成为继通义千问后首批接入钉钉的大模型。未来,用户可在钉钉上直接使用通义等七家大模型产品。
华为发布AI入网“开城计划”,五个城市 10000站:
该计划的第一阶段将在半年内赋能1000名站点工程师,管理超过10000站,覆盖杭州、广州、曼谷、济南、深圳五个城市。华为提出“以智赋网”策略,构建无线智能体,重塑运维、体验和业务,将智能注入5G-A网络,为运营商提质增效。
荣耀发布手机行业首个端侧 AI 反诈检测技术:
荣耀 CEO 赵明介绍,该技术能够自主识别用户视频通话中的画面要素。若检测到视频中存在 AI 换脸,将会向用户发出风险提醒。
陈丹琦团队最新研究,打造AI"版权护盾":
陈丹琦团队构建了一个名为 CopyCat 的评估套件,包含一个涵盖 50 个流行版权角色的数据集,以及用于评估生成内容与受版权保护角色相似度和用户意图一致性的工具。旨在避免 AI 图像/视频生成模型的版权侵权问题。
研究发现仅通过相关关键词或描述也能触发模型生成与版权角色高度相似的内容。为此研究团队提出了几种策略,可以显著降低侵权风险,但完全阻止版权角色的生成仍是一个挑战。
商汤科技将发布“日日新5.5”,混合模态能力大幅提升:
“日日新5.5”混合模态能力,模态跨度也将不仅限于图文,也将加持长文档等多项功能。
华为汪涛预测 AI 手机到 2030 年占 90%:
华为常务董事、ICT 基础设施业务管理委员会主任汪涛表示,5G-A 与 AI 的结合,有机会带来 3 个变化推动流量的加速增长,包括内容生成的变化、交互方式的变化、移动终端的变化。在移动终端方面,他认为今年 AI 手机发货占比为 11%,到 2030 年有望达到 90%。
字节发布豆包MarsCode智能开发工具,面向国内开发者免费:
6月26日,字节跳动在北京发布了基于豆包大模型打造的智能开发工具豆包MarsCode ,它有两个产品形态,即编程助手和 Cloud IDE,MarsCode 具备问答、代码补全、单测生成、Bug Fix等功能,现阶段面向国内开发者免费开放。
字节跳动开发者服务团队、豆包MarsCode 负责人李东江表示, AI 不是替代开发者的“竞争者”,而是开发者的“好帮手”,团队希望打造一款软件提升开发者工作效率,让开发者有更多精力和时间用于思考和创造。
国际情报:
OpenAI推迟发布语音助手功能,Mac版应用向所有用户开放:
OpenAI推迟发布GPT-4o语音助手功能。这一决定是出于对产品安全性和有效性的考虑,以确保它能够处理来自数百万用户的请求。不过OpenAI仍计划在秋季向所有付费用户推出这一语音功能,并正在积极开发视频和屏幕共享功能。
同时,OpenAI适用于Mac的ChatGPT聊天机器人应用正式向所有用户开放下载。该应用不仅原生支持Mac系统,还提供了快捷键启动功能。此外,OpenAI还与美国制药巨头礼来公司达成合作。将利用生成式AI开发新型抗菌药物,以应对耐药性病原体问题。
挑战英伟达!史上最快AI芯片Sohu诞生,推理性能超H100二十倍:
史上最快Transformer芯片诞生,用Sohu跑Llama 70B,每秒可生成高达500000个token的输出。Sohu 芯片是为 Transformer 模型推理加速设计的,推理性能已超B200十倍,超H100二十倍。1张Sohu≈20张H100≈10张B200。这几位00后小哥从哈佛辍学后成立的公司Etached,宣布再融资1.2亿美元。
爆料称苹果 A18 处理器 NPU 性能比 M4 芯片更强:
有爆料称,苹果 iPhone 16 系列将搭载 A18 系列处理器,NPU 性能有望超越 M4 处理器。A17 Pro 处理器 NPU 性能达 35TOPS,M4 处理器基于台积电第二代 3nm 工艺,拥有 280 亿个晶体管,NPU 算力提升到 38TOPS。
苹果上新视觉模型4M-21,搞定21种模态:
苹果与EPFL联合开发的4M-21视觉模型能处理21种模态,包括图像、文本和结构化数据,提升跨模态检索和生成能力;模型通过对不同模态执行特定离散tokenization,实现统一处理,并在多数据集上联合训练,增强性能和适应性。
Reddit 向 AI 公司发出最后通牒:
Reddit 计划更新其机器人排除协议,以阻止未经授权的平台自动抓取。不会影响网络档案馆和研究人员等“诚信行为者”,但似乎是对 Perplexity 等 AI 公司绕过 robots.txt 协议的回应,Reddit 希望所有使用自动代理访问平台的公司都遵守其条款和政策。
ElevenLabs 推出 iOS 版 AI 文本转语音应用:
AI语音初创公司 ElevenLabs 推出一款文本转语音应用 ElevenLabs Reader ,利用AI将各类文本内容,如文章、PDF文件、ePub等,转化为自然流畅、高音质的语音。该应用目前对iOS用户免费下载和使用三个月(Android版待上线),初期支持英语,计划未来扩展至29种以上语言(中文版iOS预计于7月11日推出)。
产值首破千亿美元,AI 将带动 2024 服务器 GPU 出货 482 万片:
DIGITIMES 研究中心报告指出,2024 年全球服务器 GPU 产值将突破 1000 亿美元,其中高端服务器 GPU 产值占比超过 80%,出货量将达到 482 万片,英伟达占有率 92.5%,AMD 公司占有率为 7.3%。生成式 AI 目前仍处于发展初期,云端服务器供应商和全球大型企业积极布局,进一步拉高了英伟达出货量。
Signapse用AI手语重塑聋人沟通世界:
Signapse 的核心优势是提供高逼真度的手语翻译服务,能够传递情感,让聋哑人士感受到被理解和尊重。用户输入文本后,AI系统将其转换为手语视频,经过GAN技术优化后,用户就能收到高质量的手语翻译服务。这一过程不仅确保了翻译的准确性,还保证了手语动作的自然流畅。
日本培育出活体皮肤人脸,笑容一言难尽:
日本研究人员开发了一种新型人造皮肤,能够自我修复并且模拟人类皮肤的愈合过程。这种皮肤通过在机器人骨骼上钻微小孔洞,使用 V 形钩固定在机器人上,保持皮肤的光滑和柔韧。此外,研究人员还重建了人类微笑时皮肤变化的方式,通过在人造皮肤和机器人面部之间连接一层可滑动的硅胶层,实现了 “微笑” 效果。
Akamai报告称机器人流量占互联网总流量 42%:
阿卡迈科技的报告称,机器人流量占互联网总流量的 42%,其中 65% 为恶意流量。电子商务领域受影响最大,虽然部分机器人流量对企业有利,但整体而言对用户体验带来负面影响,主要用于网络爬虫、信息收集、创建仿冒网站等。
Udio回应遭唱片公司起诉,模型不复制受版权保护的作品:
Udio 在 X 上回应称,他们的音乐模型是从大量的录音音乐中学习的,目标是发展对音乐理念的理解,并生成反映新音乐理念的音乐。他们对复制训练集中的内容不感兴趣,并已实施最先进的过滤器来确保模型不会复制受版权保护的作品或艺术家的声音。他们相信生成式 AI 将成为现代社会的主流。
Sora首部商业片亮相戛纳!300万网友围观:
Sora 首部商业片《玩具反斗城的起源》由 Nik Kleverov 导演使用 OpenAI 的 Sora 技术制作,引起了近 300 万网友的关注。影片中融入了 Sora 钟爱的慢镜头效果。有网友对其真实自然度和一致性提出疑问,并对 AI 生成商业视频提出了质疑。
更多国际情报:
Civitai 加入开放模型倡议:作为图像、视频和音频生成 AI 模型开源发展的社区驱动项目,Civitai 与 Invoke、ComfyOrg、LAION 等组织携手,通过合作开发满足标准的开源 AI 模型技术。
谷歌为 Gmail 和其他应用推出 Gemini AI 侧边栏:谷歌正在为 Docs、Sheets、Slides、Drive 和 Gmail推出 Gemini 侧面板,并且还在 Android 和 iOS 上为 Gmail 应用推出了 Gemini 。
Notion发布新功能sites:该功能让用户可以将Notion页面直接发布为网站,免费且支持主题定制、网站图标设置、Google Analytics等功能。降低了建站门槛,但自定义程度相对大模型技术可能有所不足。
ChatGPT写作风格已渗透超10%科学摘要中:AI文本生成导致了某些风格词汇的增加,对科学写作产生了影响。中国和韩国等国家的PubMed子组中约15%的摘要是使用ChatGPT生成。
Product Hunt 热榜,客户反馈分析平台Insights Hub
Survicate 的 Insights Hub 是一个强大的客户反馈分析平台,它通过整合多渠道反馈,自动分类并提取关键见解,帮助企业快速了解客户的满意度、努力度和忠诚度。此外,该工具支持多种调查模板和集成选项,AI 助手功能可挖掘现有反馈中的宝贵信息。 Survicate 高度重视数据安全,确保客户信息得到严格保护。
?https://survicate.com/insights-hub/?ref=producthunt
HuggingFace 热榜,Python词法搜索BM25S:
BM25S 是一个 Python 词法搜索库,它基于 BM25 算法,结合了 scipy 的稀疏矩阵技术,实现了高性能搜索。BM25S 在 Elasticsearch 的复杂性和 Rank-BM25 的易用性之间找到了平衡,为用户提供了快速且易于使用的工具。其一大亮点是与 Hugging Face Hub 的紧密集成。此外,它还支持多种 BM25 变体,增强了适用性。值得注意的是,BM25S并非旨在取代现有的搜索工具,而是作为一个补充选项,为Python生态系统中的词法搜索领域带来了新的可能性。
?https://huggingface.co/blog/xhluca/bm25s
开发者推荐
1.revid.ai 让你的短视频轻松出圈
revid.ai 是一个帮助用户快速创建吸引人的短视频内容的平台,适用于 YouTube、Instagram、TikTok 等主流社交媒体。其核心是通过分析成千上万热门短视频,为用户提供创意灵感和脚本建议,帮助他们制作出高参与度的作品。用户只需提供文本或链接,AI 就能自动生成完整短视频,添加音效、动画等元素。
?https://www.revid.ai/?ref=producthunt
2.AutoStudio:AI驱动的多轮交互式图像创作
该AI框架无需训练,融合了大型语言模型和稳定扩散技术,通过四大智能体(主题管理器、布局生成器、监督者和画师)的协同工作,创作出连贯的多主题图像序列。创新P-UNet结构和主题初始化技术提升了主题感知能力,保留细节,提高了图像的一致性。
?https://howe183.github.io/AutoStudio.io/
3.Claude中文提示库
Anthropic 提示库的中文版,提供了多种针对不同任务和需求优化的 AI 生成提示,包括个人和商业领域的应用,以及用户提交的自定义提示。
?https://docs.anthropic.com/zh-CN/prompt-library/library
4.Video-Infinity:可以让长视频生成加速 100 倍
Video-Infinity 提出了一个分布式推理管道,利用多 GPU 并行处理,解决了长视频生成的瓶颈问题。该管道采用了剪辑并行性和双范围注意力两大核心技术,能够高效分布式生成长视频。在 8 台 Nvidia 6000 Ada GPU(48G)的设置下,2300 帧的长视频生成仅需 5 分钟,速度比之前加速了 100 倍。
?https://video-infinity.tanzhenxiong.com/
5.ComfyUI 中的四个新特性:
分别是 GTS、iPNDM、ComfyUI-ODE 和 CFG++。GITS 是基于 AYS 的新调度器,用于步数小于等于 20 的情况。iPNDM 是基于 Adams-Bashforth 方法的新采样器,有两个版本:ipndm和ipndm_v,后者支持可变步长。虽然研究表明ipndm在实验中表现更好,但作者个人测试倾向于ipndm_v。ComfyUI-ODE 是为 ComfyUI 添加额外 ODE 解析器的自定义节点,适用于 SD3 和 SDXL 生成。CFG++是作为 SamplerEulerCFG++节点集成到 ComfyUI 中的,用于改进 CFG。
?https://www.reddit.com/r/StableDiffusion/comments/1dohy20/quick_overview_of_some_newish_stuff_in_comfyui/
6.MegActor:AI肖像动画
旷视开源 AI 人像视频生成框架 MegActor,用创新的合成数据生成框架解决了身份泄露问题,利用前景背景分割和 CLIP 编码技术来维持背景的稳定性,消除了面部细节对最终效果的影响,使模型能够仅依靠公共数据集进行训练。在 200 小时的 V100 训练后,MegActor 达到了与商业模型相当的效果。
?https://megactor.github.io/
大牛洞见
DeepMind CEO警告:别小视即将来临的 AI 革命!
Google DeepMind 首席执行官戴米斯・哈萨比斯警告加速主义者要谨慎行事,不能盲目发展 AI。这一观点引发了广泛的讨论。用户们探讨了 DeepMind CEO 的未来角色、AI 研究的方向、如何平衡技术进步与风险管理、AI 在解决全球问题中的潜力、人们对 AI 潜在风险和社会影响的担忧、AI 发展速度、国际竞争、如何在不牺牲人类福祉的前提下发展 AI 等话题。用户们还分享了对 AI 安全研究的看法,以及如何确保 AI 技术的发展既能带来积极的变化,又能避免潜在的负面后果。
敬请期待明日的最新动态!
AI情报局征集情报合伙人,汇集独家价值线索!如果您可以提供有关AI最新成果&行业内幕&独特产品,请添加运营微信号:AIyanxishe2备注行业岗位。
雷峰网(公众号:雷峰网)