• 首页
  • 服务项目
  • 知识付费
    • COZE扣子实操教学
    • 京东外卖基础运营
    • 美团私人影院基础运营
    • 美团闪购基础运营
    • 美团医美高级运营
    • 口腔电商运营
    • 生美电商运营
    • 医美电商运营
  • 联络我
  • 会员中心
    • 登录
    • 注册
  • COZE能帮助你实现什么?
    • COZE扣子token费用
  • COZE扣子平台架构
  • 手把手教COZE搭建案例
    • 在COZE搭建一个 AI 翻译应用
    • 通过模板搭建智能体
  • COZE 智能体
    • 搭建COZE扣子 助手智能体
    • 智能体基础设置 - 多 Agent 模式
    • 智能体基础设置 - 对话流模式
    • 智能体基础设置 - 设置模型
    • 智能体基础设置 - 提示词
    • 智能体添加 - 插件
    • 智能体添加 - 工作流
    • 智能体添加 - 触发器
    • 智能体添加 - 卡片样式
    • 智能体添加 - 知识
    • 智能体添加 - 记忆
      • 记忆 - 数据库
      • 记忆 - 长期记忆
      • 记忆 - 文件盒子
    • 智能体 - 提升对话体验
      • 对话体验 - 快捷指令
      • 对话体验 - 声纹识别
      • 对话体验 - 音视频通话
  • COZE 工作流
    • 工作流 与 对话流
    • 工作流使用限制
    • 工作流常见问题
    • 使用工作流
    • 基础节点 - 开始和结束节点
    • 基础节点 - 大模型节点
    • 基础节点 - 插件节点
    • 基础节点 - 工作流节点
    • 业务逻辑节点 - 代码节点
    • 业务逻辑节点 - 选择器节点
    • 业务逻辑节点 - 意图识别节点
    • 业务逻辑节点 - 循环节点
    • 业务逻辑节点 - 批处理节点
    • 业务逻辑节点 - 变量聚合节点
    • 工作流 - 输入节点
    • 工作流 - 输出节点
    • 工作流数据库节点 - SQL 自定义节点
    • 工作流数据库节点 - 新增数据节点
    • 工作流数据库节点 - 查询数据节点
    • 工作流数据库节点 - 更新数据节点
    • 工作流数据库节点 - 删除数据节点
    • 知识和数据节点 - 变量赋值节点
    • 知识和数据节点 - 知识库写入节点
    • 知识和数据节点 - 知识库检索节点
    • 知识和数据节点 - 长期记忆节点
    • 图像处理节点 - 图像生成节点
    • 图像处理节点 - 画板节点
    • 图像处理插件节点
    • 音视频处理节点 - 视频生成节点
    • 音视频处理节点 - 视频提取音频节点
    • 音视频处理节点 - 视频抽帧节点
    • 组件节点 - HTTP 请求节点
    • 组件节点 - 文本处理节点
    • 组件节点 - 问答节点
    • 组件节点 - JSON 反序列化节点
    • 组件节点 - JSON 序列化节点
    • 触发器节点 - 设置定时触发器
      • 删除定时触发器节点
      • 查询定时触发器节点
    • 会话管理节点 - 创建会话节点
      • 修改会话节点
      • 删除会话节点
      • 查看会话列表节点
    • 会话历史节点 - 查询会话历史节点
      • 清空会话历史节点
    • 消息节点 - 创建消息节点
      • 修改消息节点
      • 删除消息节点
      • 查询消息列表节点
    • 管理工作流版本
    • 封装与解散工作流
  • 插件

搜索结果

没有相关内容~~

对话体验 - 音视频通话

最新修改于 2025-08-03 14:56
开发者可以在智能体编排页面设置是否允许用户在扣子商店通过语音或视频与智能体实时沟通,并可设置音色和默认输入方式。 ## 功能说明 在智能客服、智能穿戴、语音陪伴等音视频场景中,为智能体开启音视频通话功能并合理设置音色,可显著提升其交互的丰富性和生动性,使沟通更加直观、高效。同时,合适的音色能赋予智能体更具亲和力、专业性或个性化的语音表达,从而增强用户对智能体的好感度和信任感,更好地满足用户在不同场景下的多样化需求,进一步优化用户与智能体之间的交互体验。 开启了语音通话和视频通话的智能体,发布至扣子商店等渠道后,将支持用户通过语音、视频、或共享屏幕的方式与其交互,用户可体验到如图所示的音视频通话效果。 在智能体编排页面开启语音通话或视频通话后,支持在如下渠道使用: * 在扣子商店体验音视频通话。 * 在豆包体验语音通话。 * 将智能体发布 API 后,你可以在自己的产品中通过 WebSocket 或 RTC 方式实现音视频通话,具体请参见[智能音视频概述](https://www.coze.cn/open/docs/dev_how_to_guides/realtime_overview)。 * 将智能体发布 Chat SDK 后,你可以在自己的产品中安装 Chat SDK 实现语音通话(暂不支持视频通话),具体请参见[安装并使用 Chat SDK](https://www.coze.cn/open/docs/developer_guides/install_web_sdk)。 ## 为智能体开启音视频通话 1. 在智能体编排页面的**对话体验** > **音视频**区域,选择智能体对应的音色,你可以使用扣子系统预置的音色或资源库中复刻的音色。 扣子的系统预设音色支持多情感音色,即一个音色可以表达多种情感,例如开心、悲伤等。你可以指定其中一种情感并设置其情绪强烈程度,让智能体在通话时用对应的情感语气说话(不会针对每句话进行动态调整情感)。带有**多情感**标签的音色支持此功能。 试听多情感音色时,扣子将按照按文字转语音的字符数收费,费用详细说明请参见[音视频费用](https://www.coze.cn/open/docs/coze_pro/asr_tts_fee)。 ![](https://odoohelp.cn/uploads/20250803/e46458f56782b037fe72e80d59e9feaa.png) | **参数** | **说明** | | -------- | ------------------------------------------------------------------------------------------------------------------------------- | | 情感 | 情感参数用于指定智能体音色的情感类型,例如开心、悲伤等。你可以从下拉列表中选择该音色对应的情感。不同音色支持的情感范围不同。 | | 情感值 | 情感值用于量化情感的强度。数值越高,情感表达越强烈,例如: “开心” 的情绪值 5 比 1 更显兴奋。取值范围:1.0\~5.0,默认值:4.0。 | 2. 开启或关闭语音通话或视频通话右侧的开关。开启后,用户在扣子商店中打开对应的智能体,可以通过语音通话、视频通话或屏幕共享的方式与智能体实时沟通。 开启视频通话时,智能体或工作流需要选择支持**图片理解**的模型,例如**豆包·视觉理解·Pro **模型。 3. 在视频通话过程中,扣子通过视频抽帧技术,将摄像头画面或共享屏幕转化为图像帧,供大模型分析理解。为保障大模型精准识别用户行为和意图,你需要设置视频抽帧的参数,参数说明如下。 | **参数** | **说明** | | ------------------ | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | 每秒抽帧数 | 在视频通话过程中,摄像头或屏幕共享捕捉画面的频率。捕捉到的画面会作为视觉模型的输入,帮助智能体理解用户的动作和行为。抽帧数越高,智能体能够获取的画面信息越丰富,从而更准确地理解用户的意图和行为,但会增加 Token 消耗。默认值为1,取值范围为[1, 24]。 | | 开始说话前抽取秒数 | 在用户开始说话之前,抽取指定秒数的画面,能够帮助智能体提前了解用户在说话前的动作状态,从而更全面地理解用户的意图与行为。单位为秒,默认值为1,取值范围为[1, 10]。 | 4. (可选)设置默认的用户输入方式。 开启语音通话或视频通话后,你可以选择默认的输入方式为语音通话或视频通话。设置后,当用户打开智能体时,默认进入语音通话页面或视频通话页面。 5. 配置完成后,你可以在调试区体验通过语音通话、视频通话或共享屏幕的方式,与智能体进行实时交流。 ![](https://odoohelp.cn/uploads/20250803/0c7a38d63d03448619e2237116438ce4.png) ## 在扣子商店体验音视频通话 开启了语音通话或视频通话的智能体,发布扣子商店后,如果默认输入方式是打字输入或语音输入,你可以在智能体右上角单击通话按钮,选择语音通话、视频通话或屏幕共享。如果默认输入方式为语音通话或视频通话,打开智能体并接听后,即可通过语音或视频方式与智能体交互。 ![](https://odoohelp.cn/uploads/20250803/bd78b74f460712a54e8d7777f9bf4ac2.png)

2024-2025 医美电商运营人网,此内容版块主要围绕美团点评广告样式/流程/费用/效果/计费方式/后台操作等分享,如果相关问题,可以与我联系。 蜀ICP备2025122774号

开始访问