大厂开始直接抢卡:B300被数千台扫货
国内头部互联网公司采购算力的方式正在发生变化。
过去,大厂往往通过中间渠道隐藏真实身份进行采购,如今越来越多项目开始直接签约,自我保护色彩明显减弱。
与此同时,B300正在被头部客户快速扫货。华东某互联网大厂采购规模超过2000台,华北某科技巨头也采购了一两千台,仅少数几家公司便消化掉市场相当比例的供给资源。更多算力市场内幕,欢迎添加微信EATINGNTAE探讨。
存储巨头估值冲向万亿,可能给已上市公司压力
国内两大存储原厂的上市进程持续受到资本市场关注。有消息称,其中一家存储巨头的上市估值有望从数千亿元上调至万亿元级别,而上市时间有可能较此前预期有所延后。
多位业内人士表示尚未获得明确上调信息,但普遍认为,若估值进一步上调并不令人意外。随着估值水位抬升,老股东持股价值或迎来重估,而如此体量的企业登陆A股后,也可能对现有半导体上市公司的市值形成压力。
上海AI芯片公司上市出现转机,Pro-IPO融资启动
去年底完成上市辅导的上海AI芯片公司,过去半年没有新的进展。据说该公司此前没有拿到绿通,上市遇到了一些挑战。但去年有高层领导参观的背书,目前已经拿到了上市“绿通”,上市进程出现转机。
据悉目前已有投资方与该AI芯片公司接触讨论Pro-IPO轮融资事宜。AI芯片公司上市背后更多的信息交流欢迎添加微信BENSONEIT。
英伟达5090和CDN同时涨价20%,但涨价逻辑不同
存储价格上涨之后,涨价开始向整个AI产业链传导。近期英伟达5090租赁价格上涨约20%,与此同时,CDN价格也出现接近20%的涨幅。
不过,两者背后的逻辑并不相同。5090涨价主要来自需求增长,随着推理、Agent等应用快速发展,高端GPU持续供不应求;而CDN涨价的重要原因,则是低成本PCDN资源受到打压。
业内人士表示,CDN承担着模型、图片、视频等数据分发任务,是连接用户与智算中心的重要网络基础设施。过去几年,PCDN通过边缘节点和P2P模式持续压低带宽成本。随着运营商加强治理,低价供给减少,CDN价格重新进入上涨通道。
Day0适配开始变味:有厂商跑通一个版本就官宣
DeepSeek V4发布后,国产芯片厂商再次掀起Day0适配竞赛。
有业内人士透露,某头部仅跑通一个版本后便对外宣布完成适配,只为赶上Day0名单。
多位从业者认为,如今模型适配本身已不再构成核心门槛,真正拉开差距的是性能优化能力。同样完成适配,不同芯片厂商之间的性能差异依然十分明显。
据悉,某统一生态内部实际上保留着详细评分体系和结果,但由于部分厂商对横向比较十分敏感,目前对外仅保留“通过”与“未通过”两类结果。芯片厂商大模型适配更多内幕,欢迎添加微信Evelynn7778交流。
京东芯片团队分流:有人去了紫京无限,有人拿到上亿融资
京东芯片团队上海伽脉科技调整之后,团队成员有了两个主要的去向。
一部分员工进入京东与国产芯片厂商成立的合资公司紫京无限,另一部分核心成员则选择重新创业。其中,核心员工Jeffrey Xu参与创立的新公司已于今年5月成立,方向为AI推理芯片和软硬件系统。
据业内人士透露,该公司成立不久便已获得上亿元融资。更多新成立芯片公司的信息交流添加微信BENSONEIT。
存储涨价芯片公司态度不同:有人硬扛成本,有人丢智算订单
存储价格持续上涨,正在考验AI芯片公司的经营策略。
有AI芯片公司选择自行消化成本,坚持不调整产品售价,理由是当前公司仍处于亏损拓展市场阶段,订单和客户比利润更加重要。
但也有公司因此付出代价。某AI芯片公司此前已基本谈妥的智算项目,因存储价格持续上涨导致成本波动,项目方希望双方共同承担新增成本,该公司态度强硬拒绝让步,最终失去了订单。
存储行业回款陷入死循环:不给现金,也不给汇票
存储行业正在经历新一轮回款压力。
有供应商透露,部分大型客户逾期付款已经成为常态。更特殊的是,一些集团此前要求不得开具承兑汇票,必须现金支付,但现实情况却演变成“没有现金,所以无法付款”。
供应商主动提出接受汇票,对方则以“不符合规定”为由拒绝。最终既拿不到现金,也拿不到汇票,只能继续等待。“如果一年都等不到现金怎么办?”成为不少供应商共同面对的问题。欢迎添加微信EATINGNTAE互通有无,探讨应对之道。
上海AI芯片公司憋大招:下半年新品瞄准H100训练市场
上海AI芯片公司正推进新一代产品研发,计划于下半年正式推出。
据业内人士透露,新产品主要面向大规模训练集群场景,重点对标英伟达H100平台,单卡售价达到数万元级别。
与行业内频繁举办发布会的企业不同,该公司长期保持低调路线。有关该企业后续商业落地进展,可添加微信Evelynn7778一起探讨。
国产卡测试需求上升,但客户仍迷信大厂配置
据某芯片行业人士透露,算力运营商的客户大多为运营或软件出身,缺乏硬件评价基础,很难仅凭Token来衡量不同芯片的价值。因此,这些客户往往依赖算力运营商来提供硬件选型方案。
过去,算力运营商几乎只使用英伟达产品;如今为了满足客户多样化的性价比需求,运营商开始主动测试国产卡,以形成与英伟达产品的实际比较。
但测试归测试,实际落地仍面临障碍:互联网大厂拥有强大的工程师团队,能够自行完成适配调优;而多数央国企客户的信息中心人员仅懂基础运维,不具备芯片适配能力。即便运营商已验证某款国产卡可用,这些客户仍不敢贸然采用——因为一旦出问题,他们没有技术能力兜底。
于是,央国企客户选择了一条“安全”的路径:盲目照搬国家电网等头部大厂的配置,直接上高端卡。以某供应链集团为例,其业务数据以物流、指令为主,实际部署7B或11B模型就已足够,却跟着上高端卡,性价比极低。
DDR5砍通道、DDR3重新上岗,主板厂商开始“凑颗粒”
内存颗粒供应波动,正在倒逼主板厂商推出各种非常规方案。
中国台湾某板卡厂商推出DDR5单通道主板,直接砍掉一个子通道,以减少颗粒需求;部分工控厂商则重新支持DDR3,只求先解决供货问题;还有厂商推出DDR4和DDR5双模兼容设计,为客户保留切换空间。
在供应链紧张时期,“先解决有无,再讨论性能”正成为越来越普遍的选择。
1万公里仅0.1秒,东数西算延迟焦虑正在消失
算力网建设持续推进,但外界对于东数西算最大的担忧始终是时延。
有从业者测算,100公里传输延迟约1毫秒,1万公里也仅约0.1秒。对于大模型普遍200-300毫秒的首Token响应时间而言,跨区域调度带来的额外时延并没有想象中那么大。
据悉,某西部5090万卡集群目前已实现满租,东西部算力流动正在变得越来越常见。

雷峰网(公众号:雷峰网)