能让任意大模型开口说话的AI,引擎有何玄机?

2025-03-20 11:56:03上一篇:崔晋 女朋友(崔晋是哪一期) |下一篇:30岁生日给自己买什么礼物好(送自己三十岁礼物)

在近日召开的杨浦区科技创新大会上,以共筑“杨数浦”新质秀带为主题,杨浦密集发布了一系列企业创新项目。

其中,声网对话式 ai 引擎引人注目,这一引擎可支持任意文本大模型快速升级为“能说会道”的对话式多模态大模型同时,对话式 ai 引擎的价格也更为优惠,1分钟不到1毛钱,只需0.098元/分钟在生成式 ai 的浪潮下,行业普遍认为多模态大模型是实现 agi 的必经之路,知名投资机构 a16z *新关于 voice ai 的报告也显示,随着大模型的不断进步,语音将成为一种关键的切入点。

声网作为全球实时互动云行业的开创者,在音视频领域积累了深厚的技术优势与场景实践,一直致力于将 rte 与生成式 ai 结合,并推出了对话式 ai 引擎,为开发者带来“多快好省”的 ai 语音对话体验

真正把选择权交给开发者支持包含 deepseek、chatgpt 等在内的全球几乎所有大模型厂商同时也支持全球主流语音合成供应商任意切换,支持开发者通过语音合成供应商定制的自定义音色接入更有音视频 sdk 支持 30000+终端机型适配,解决多设备兼容性的后顾之忧。

通过全链路深度优化,并在中、美、欧、东南亚主要城市实测,语音对话延迟中位数低至 650ms,让 ai 秒回你的提问超低打断延时,自研“智能打断”技术,模拟真人对话节奏,随时打断与 ai 的对话,响应低至340ms。

选择性注意力锁定”功能可屏蔽95%环境人声、噪声干扰,精准识别对话人声此外,对话式 ai 引擎具备优秀的抗弱网、抗丢包能力,80% 丢包率下仍能稳定流畅对话,断网3-5s 依旧流畅对话声网对话式 ai 引擎提供了极简的开发部署,只需2行代码,15分钟就能让 ai 开口说话,大幅降低了开发门槛。

只需填入与复制 llm 与 tts 相关的 url 与 key,就能实现快速部署,具体流程可查看声网官网的文档中心

对话式 ai 引擎的成本也更优,ai 语音对话只需0.098元/分钟,单次还赠送1000分钟声网自研的“智能打断”功能作为增值服务也只需0.042元/分钟,以更低的成本助力开发者探索 ai 应用场景声网 ai rte 产品线负责人姚光华表示,“经过一段时间与客户的打磨及实际使用场景调研,我们统计出,用户与 ai 每产生1次对话中,平均会有约3轮问答,计算下来平均对话时长约为21.1s,单次成本仅需3分钱。

如果每月对话次数15次,那么月成本不到5毛钱,年成本也只需5元”通过声网对话式 ai 引擎,开发者可以快速部署智能助手、虚拟陪伴、口语陪练、智能客服、智能硬件等对话式 ai 场景例如智能助手场景可以通过自然语言交互,帮助人们进行日程管理、信息查询和任务执行,全面提升生活便利性,并提高工作效率。

智能硬件场景也是当下非常火热的 ai 场景,通过嵌入对话式 ai 引擎,可实现语音控制、智能看护、智能陪伴和个性化服务,将智能设备升级为智能硬件体适用于 ai 玩具、ai 教育硬件、ai 陪伴设备、家居语音助手、穿戴设备个人助手等多种应用场景。

文字丨成佳佳编辑丨文茜婷*转载请注明来自上海杨浦官方微信

(点击图片查看)

上观号作者:上海杨浦 特别声明:本文经上观新闻客户端的“上观号”入驻单位授权发布,仅代表该入驻单位观点,“上观新闻”仅为信息发布平台,如您认为发布内容侵犯您的相关权益,请联系删除!