北京时间8月20日,声网母公司 Agora, Inc. ( NASDAQ: API ) 发布了2024年第二季度财报。财报显示,本季度 Agora, Inc. 实现总营收3420万美元,同比增长0.5%。这也是在2021年Q4之后,10个季度以来 Agora, Inc. 首次实现营收同比增长。
其中,业务聚焦在中国市场的声网实现 Q2 营收1.32亿人民币,同比增长0.3%。聚焦非中国市场的 Agora 实现 Q2 营收1560万美元,同比增长2%。
对此,Agora, Inc.创始人兼CEO赵斌表示,"我很高兴看到声网和 Agora 在面对极具挑战的宏观环境下,本季度双双实现收入同比增长。这一成果得益于我们不懈的创新,一方面推动新应用场景落地,另一方面也提升成熟场景方案的质量和价值。我们最近帮助客户在多个应用场景中推出了对话式 AI 应用,如 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服,并看到了不错的用户和用量增长。我相信,实时互动与对话式 AI 的结合将成为我们未来业务发展的关键驱动力。"
在这样的背景下,声网在本季度推出了 Linux Server SDK,支持当下大模型编程最主流的两类语言 Python 与 Go ,能够帮助开发者快速构建 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服等实时 AI 应用场景。
除此之外,声网基于在音视频社交出海领域的10年技术服务积累,联合资深出海媒体白鲸出海,共同发布了《2024 社交泛娱乐出海攻坚地图》,致力于为出海应用探索海外社交泛娱乐赛道提供帮助和启发。
发布 Linux Server SDK 帮助开发者快速构建实时AI应用场景
在多模态大模型的趋势下,RTE 成为了人与 AI 交互中的重要一环,越来越多的企业与开发者都在探索在大语言模型或者 AI 应用场景中快速集成高效的音视频能力。对此,声网推出了 Linux Server SDK,支持当下大模型编程最主流的两类语言 Python 与 Go ,企业可基于声网 Linux SDK ,快速接入大模型,上线具备 RTC 传输能力的 AI 应用场景,如 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服等。
声网 Linux Server SDK 以 API 的形式提供了一系列的功能,例如 Linux Server SDK for Go 可支持连接管理、信令发送、音频订阅与推送、事件回调通知等,其中信令传输能力不仅可应用于创建 DataStream 数据流,并发送信令,也能应用在大模型中发送数据流消息,例如将 TTS、STT 和 LLM 的结果发送给客户端。
此外,Linux Server SDK 还提供了使用时序的教程,从建立连接、订阅远端用户的音频、获取远端用户的音频数据、推送音频数据、发送文字信令、断开连接等不同流程的详细描述,帮助开发者快速上手。
声网 Linux Server SDK 客户集成实践图
发布《2024 社交泛娱乐出海攻坚地图》助力探索海外市场
在成立十周年之际,声网联合同样在出海领域深耕了10年的资深媒体白鲸出海,共同推出了《2024 社交泛娱乐出海攻坚地图》(下称地图),致力于为出海应用探索海外社交泛娱乐赛道提供帮助和启发。
这份地图不仅包含全球各区域市场概况、赛道机会、同时还深入浅出的对当地典型社交泛娱乐应用进行案例分析。无论是正在了解和尝试出海的创业公司,还是已经在海外开疆拓土的企业,都可以通过这份地图更加全面细致的了解到东南亚、中东、拉美、日韩等热门出海区域的广阔市场空间和机会。该地图一经发布,便获得了很多出海从业者的支持、肯定和订购。
据地图中内容显示,印度、部分中东和东南亚国家的 RTC 渗透率都比较高,泛娱乐出海在这些地区已经比较成熟,用户使用音视频娱乐 App 的习惯也较好。但基于声网的数据和各个地区的互联网总时长来看,音视频出海还有很大的增长空间。
例如,语聊房曾是中东最火的泛娱乐场景之一。除了语聊房之外,其他视频类场景的下载和收入体量也在快速增长。2023年 dating 和 1v1音视频场景的应用增速最高,往往采取付费开启聊天的模式,变现比较迅速,成为了社交出海的大热场景。
声网在助力客户出海的过程中也发现面向中东区域出海1v1社交的客户越来越多,声网也成为中东社交 App 音视频服务首选。据数据显示,声网1v1社交客户在全球各区域的1v1 App 市场渗透率>70%,其中就中东地区,在中东1v1社交 App 收入 TOP20中,使用声网 SDK 的 App 就达到了14个,渗透率排名第一。
持续优化产品性能与方案,打造最佳实时互动体验
近日,第33届夏季奥运会在巴黎闭幕。声网赛事直播解决方案在奥运会前新增 ABR (多码率观众端)能力,在保证低延迟的基础上,实现观众端码率多级、无缝、自适应平滑切换,为观众提供 0 卡顿、流畅的观看体验,可为体育赛事直播场景提供更高质量的直播效果与用户体验。
为帮助开发者快速集成高质量的泛娱乐社交实时互动场景,本季度,声网正式推出场景化 API 方案,该方案是面向客户业务场景化的一体化开发工具包,通过简单几个 API 就能快速实现场景构建,并通过预设参数配置帮助客户实现场景的最佳实践。
相较于以往的音视频场景集成搭建,声网推出的场景化 API 具有更易、更快、更优的特点。目前,场景化 API 覆盖了 5 大泛娱乐业务场景,包含1v1呼叫、秀场直播 - 秒开秒切、秀场直播 - 美颜、音频最佳实践、K歌等,适用于企业期待快速完成开发上线的泛娱乐业务场景,并能跨级提升用户体验。
AV1 是一种新型的视频编码格式,设计初衷是为了提供一款免专利费,且具备更高效、更灵活视频压缩的编码器,以适应不断增长的在线视频需求,特别是在流媒体和实时音视频领域。目前声网 SDK 已接入 AV1 ,在实时音视频场景中,可实现同等码率下,视频编码效率大幅提升,视频画质更加清晰。
声网 AV1 的性能优势可以总结为:编码速度快、性能消耗低、同码率下画质更清晰、同画质下视频压缩率更高。此外,相比于H.264、H.265, AV1属于开放式的视频编码标准,不管是国内业务还是出海业务,都能快速接入。
联合多家伙伴,提升开发效率与便捷性
作为华为在 RTC 领域定向选择的核心厂商,6月21日,在华为正式发布鸿蒙 HarmonyOS NEXT Beta 版的同时,声网也同步发布了基于鸿蒙HarmonyOS NEXT Beta 版适配的 RTC SDK,并已在官网上线。适配鸿蒙HarmonyOS NEXT 后的声网 SDK,能支持频道管理、音视频基本功能、设备管理、数据流管理、媒体和流处理、视频增强、安全加密、事件和回调管理等几大块功能。
在场景搭建上,通过适配鸿蒙HarmonyOS NEXT 平台的声网 RTC SDK,可以全面满足开发者构建社交娱乐、在线教育、智能硬件、视频会议、协同办公、在线金融、线上医疗等广泛场景的需求,并能让开发者充分利用鸿蒙系统的特性,实现高效、稳定的通信体验。
7月,声网联合 Unity 中国正式发布了 UOS Hello 产品,该产品提供游戏内多人语音服务,并支持云录制,为开发者提供一站式、便捷、全球化、低延时、低功耗的游戏语音服务,降低中小型游戏工作室开发联机游戏的门槛。
UOS Hello 首个版本支持游戏语音、云录制,让开发者一站式集成,快速跑通基础功能。游戏模式上,UOS Hello 支持小队语音、开黑语音、国战指挥;功能上,会陆续上线空间音频、范围音频、Wwise 插件;同时,UOS Hello 还具有低延时、低功耗等特性,并对机型、平台适配全面。另外 UOS Hello 产品针对开发阶段的游戏项目提供 5000 分钟游戏语音以及 5000 分钟云录制免费时长。
雷峰网(公众号:雷峰网)