切换导航
首页
服务项目
知识付费
COZE扣子实操教学
京东外卖基础运营
美团私人影院基础运营
美团闪购基础运营
美团医美高级运营
口腔电商运营
生美电商运营
医美电商运营
联络我
会员中心
登录
注册
COZE能帮助你实现什么?
COZE扣子token费用
COZE扣子平台架构
手把手教COZE搭建案例
在COZE搭建一个 AI 翻译应用
通过模板搭建智能体
COZE 智能体
搭建COZE扣子 助手智能体
智能体基础设置 - 多 Agent 模式
智能体基础设置 - 对话流模式
智能体基础设置 - 设置模型
智能体基础设置 - 提示词
智能体添加 - 插件
智能体添加 - 工作流
智能体添加 - 触发器
智能体添加 - 卡片样式
智能体添加 - 知识
智能体添加 - 记忆
记忆 - 数据库
记忆 - 长期记忆
记忆 - 文件盒子
智能体 - 提升对话体验
对话体验 - 快捷指令
对话体验 - 声纹识别
对话体验 - 音视频通话
COZE 工作流
工作流 与 对话流
工作流使用限制
工作流常见问题
使用工作流
基础节点 - 开始和结束节点
基础节点 - 大模型节点
基础节点 - 插件节点
基础节点 - 工作流节点
业务逻辑节点 - 代码节点
业务逻辑节点 - 选择器节点
业务逻辑节点 - 意图识别节点
业务逻辑节点 - 循环节点
业务逻辑节点 - 批处理节点
业务逻辑节点 - 变量聚合节点
工作流 - 输入节点
工作流 - 输出节点
工作流数据库节点 - SQL 自定义节点
工作流数据库节点 - 新增数据节点
工作流数据库节点 - 查询数据节点
工作流数据库节点 - 更新数据节点
工作流数据库节点 - 删除数据节点
知识和数据节点 - 变量赋值节点
知识和数据节点 - 知识库写入节点
知识和数据节点 - 知识库检索节点
知识和数据节点 - 长期记忆节点
图像处理节点 - 图像生成节点
图像处理节点 - 画板节点
图像处理插件节点
音视频处理节点 - 视频生成节点
音视频处理节点 - 视频提取音频节点
音视频处理节点 - 视频抽帧节点
组件节点 - HTTP 请求节点
组件节点 - 文本处理节点
组件节点 - 问答节点
组件节点 - JSON 反序列化节点
组件节点 - JSON 序列化节点
触发器节点 - 设置定时触发器
删除定时触发器节点
查询定时触发器节点
会话管理节点 - 创建会话节点
修改会话节点
删除会话节点
查看会话列表节点
会话历史节点 - 查询会话历史节点
清空会话历史节点
消息节点 - 创建消息节点
修改消息节点
删除消息节点
查询消息列表节点
管理工作流版本
封装与解散工作流
插件
搜索结果
没有相关内容~~
对话体验 - 声纹识别
最新修改于
2025-08-03 14:53
声纹识别可以提取说话人的声音特征和说话内容信息,实现自动核验说话人身份的功能。在进行声纹识别时,扣子会在声纹组内进行查找匹配对应的声纹,如果高于命中阈值,则认为是同一个人的声音。声纹识别适用于音视频通话场景,能够识别对话人的身份。 ## 功能简介 开发者在智能体中开启声纹识别并配置声纹识别变量,借助声纹组和声纹数据来管理不同用户的声纹信息。在音视频通话时,扣子根据智能体绑定的声纹组,从声纹组中匹配说话人的身份,并将匹配到的身份信息传递给智能体。智能体依据身份信息,为用户提供个性化、安全且高效的交互体验。其主要应用场景包括: * 智能家居控制:在智能手机、智能家居等终端设备中,声纹识别可用于精准的语音身份授权。系统仅响应已授权人员的声纹特征指令,有效屏蔽外界噪音干扰和非授权声音指令,确保设备操作的安全性和准确性。 * 家庭智能设备:通过声纹识别区分家庭成员,为不同用户身份提供专属服务和个性化内容,提升家庭智能设备的交互体验。 * 智能办公:在会议记录等办公场景中,声纹识别可实现发言人身份的动态区分。例如,智能会议系统通过声纹特征识别不同参会者身份,实时标注发言内容并生成结构化会议记录,提升会后资料整理效率。 ## 使用限制 * 默认最多可创建 1000 个声纹组。如需提高配额,请升级至扣子企业版,并联系对应销售申请扩容。 * 每个声纹组中最多可创建 10 个声纹。 ## 费用说明 开启声纹识别功能后,用户与智能体进行音视频通话时,将产生声纹识别费用,详细费用说明可参考[音视频费用](https://www.coze.cn/open/docs/coze_pro/asr_tts_fee)。 ## 步骤一:创建声纹 ### 1 创建声纹组 声纹组是声纹的集合单元,例如,你可以为每个设备分别创建一个声纹组。 1. 超级管理员或管理员进入**团队管理**或**企业管理**,选择**声纹管理**。  2. 单击右上角的 **+ 声纹组**,填写声纹组的名称和描述,单击**确认**。 ### 2 创建声纹 1. 单击对应的声纹组,进入声纹组详情页,单击右上角的 **+ 声纹**。  2. 在**创建声纹**页面,设置声纹的名称和描述,然后单击**下一步**。 3. 单击**上传声音**或**开始录制**来记录声音特征。 * **上传声音**:上传本地预先录制好的音频文件。音频文件需符合系统规定的格式和时长要求,以确保声纹提取的准确性,具体要求请参见页面中的说明。 * **开始录制**:朗读系统提供的文案,根据现场录制的音频来记录声音特征。  4. 单击试听图标,确认声音符合预期后,单击**记录声纹**。  ## 步骤二:声纹测试 通过声纹测试可以评估声纹识别的准确率。你可以上传测试音频,扣子将根据该测试音频与声纹库中已有的声纹进行对比,计算相似度,从而评估声纹识别系统在不同环境和条件下的匹配效果,确保精准度达到预期。此外,测试结果可用于调整命中阈值等参数,以更好地实现身份验证和个性化服务。 1. 单击对应的声纹组,进入声纹组详情页,单击右上角的**声纹测试**。  2. 在声纹测试页面,设置命中阈值,单击**上传声音**或**开始录制**。  命中阈值是指声音匹配度的最低标准。当声音匹配度达到或超过该阈值时,扣子才会认定声纹匹配成功,确认为同一人的声音。取值范围:0\~100,默认值:40。 ## 步骤三:在智能体中开启声纹识别 创建声纹后,可以将声纹组绑定至智能体。在语音通话过程中,扣子能够从声纹组中匹配说话人的身份,并将匹配到的身份信息传递至智能体。智能体依据声纹信息,可实现差异化响应。例如:识别每次对话中对话人的身份、 根据不同身份进行个性化回复内容、特定人的声纹才可唤醒智能体进行对话等。 1. 为智能体开启声纹识别。 在智能体的编排页面,在**对话体验** > **语音**区域开启声纹识别,并设置命中阈值和空值时是否沿用历史。  | **参数** | **说明** | | ------------------ | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | 命中阈值 | 设置声音匹配度的最低标准。当声音匹配度达到或超过该阈值时,扣子才会认定声纹匹配成功。你可以根据应用的安全性要求进行自定义设置。如果匹配了多轮声纹,扣子会取相似度最高的一个。取值范围:0\~100,默认值:40。 | | 声纹空值时沿用历史 | 当未命中任何一个声纹时,智能体将返回上一次命中的声纹。此选项适用于连续对话场景,当收音不好等情况导致声纹没能正确被识别时,开启该选项可确保对话的连贯性。 | 2. 在智能体对话流中引用声纹变量。 开启声纹识别后,扣子会自动添加声纹识别的系统变量 sys\_voiceprint\_name 和 sys\_voiceprint\_info。变量的说明和配置示例如下: | **变量** | **说明** | | --------------------- | ---------------------------------------------------------------- | | sys\_voiceprint\_name | 声纹名称,用于标识对话人的身份,例如爸爸、妈妈等。 | | sys\_voiceprint\_info | 声纹的其他携带信息,由用户自己定义,例如你可以添加用户偏好设置。 | 1. 在输入参数中添加 sys\_voiceprint\_name 参数,对应的值引用智能体中添加的系统变量 sys\_voiceprint\_name。 2. 在用户提示词中,设置并引用变量 sys\_voiceprint\_name。  3. 在**预览与调试**页面,单击通话图标,选择对应的声纹组,以便在调试过程中验证声纹识别的效果。  4. 将智能体发布到 API 渠道。 ## 步骤四:使用声纹识别 通过 [Real-Time SDK](https://www.coze.cn/open/playground/rtcsdk) 体验智能音视频通话时,指定对应的智能体和声纹组,扣子能够根据你的声纹特征进行识别,并据此提供差异化的响应,以实现个性化交互。 
请输入访问密码
开始访问