XSwitch用户手册

AI 管理

在 AI 时代,越来越多的设备和组件对智能语音提出了更多的要求。而电话是语音最佳的载体。所以,我们在 XSwitch 中实现了与主流 AI 平台的语音接口互通,旨在给第三方应用程序提供更丰富的接口。

AI

点击右上方【新建】,选择参数模板,即可完成创建 AI 的的参数配置。非必要不修改此配置界面。

事件推送

打开 AI 界面,找到Settings参数,修改 post-event-url 对应的值(填入需要将事件推送到的地址)。填写成功后点击右上角【重启】,重启一下 mod_ai 模块。

或在【高级】⇨【模块配置】⇨【系统模块】中找到 mod_ai,然后点击后面的【重载】即可(如果没有此模块,将此模块添加进去后加载即可)

Bindings中包含的所有事件均将推送到上述地址。

百度

同样点击右上方【新建】,选择参数模板,完成创建 baidu 模块的的参数配置。模块参数分为 tts 和 asr 两类,即语音合成和语音识别

获取百度 TTS

在浏览器中输入“百度 TTS”,进入百度语音合成界面,如下图:

百度TTS语音合成\label{fig:baidutts}

点击上图【语音识别】⇨ 点击【立即使用】,进入注册界面,申请账号,按照提示一步步完成。

完成后,点击【应用管理】,如下图所示 ⇨ 点击【查看 key】,即可获取 key 值。

百度TTSkey值\label{fig:baidutts2}

阿里

使用阿里 ASR/TTS 之前,需要获取阿里云 ASR/TTS 服务以下重要参数:

阿里云账号AccessKey IDAccessKey Secret,参见 https://help.aliyun.com/document_detail/69835.html

阿里云智能语音交互服务App Key,参见https://help.aliyun.com/document_detail/71936.html

点击【高级】⇨【AI】⇨【阿里】,进入详情页面,在Settings中填上阿里的 acckey 和 secret,这是阿里云用户获取登录 Token 的接口。

在 TTS 和 ASR 参数中填上阿里云智能语音交互服务的 appkey。

配置完成后,点击右上角【加载】即可。

华为

与上述模块相同

讯飞

与上述模块相同

NCNN

离线版的语音识别,需要下载 ASR/TTS 模型,并配置模型路径,模型下载地址:

ASR 模型

TTS 模型

ONNX

离线版的语音识别,需要下载 ASR/TTS 模型,并配置模型路径,模型下载地址:https://github.com/k2-fsa/sherpa-onnx

ASR

已经测试过的模型:

  • sherpa-onnx-streaming-zipformer-zh-int8-2025-06-30
  • sherpa-onnx-streaming-zipformer-zh-14M-2023-02-23
  • sherpa-onnx-streaming-zipformer-en-2023-06-26

模型下载:https://github.com/k2-fsa/sherpa-onnx/releases/tag/asr-models

TTS

模型下载:https://github.com/k2-fsa/sherpa-onnx/releases/tag/tts-models

RTF https://k2-fsa.github.io/sherpa/onnx/tts/pretrained_models/rtf.html

AI 使用指南

AI 机器人主要是语音识别(ASR)、语音合成(TTS)、大模型对话、知识库问答。因此,需要准备以下资源:

  • 确认 Cherrygpt 服务已启动,并确认配置文件中的信息正确(该服务默认不启动,如需体验,请联系工作人员获取)
  • ASR 引擎(如百度 ASR 等,目前系统提供了百度、阿里、讯飞、华为、微软、腾讯、思必驰、NCNN、ONNX),获取对应 API Key 、API Secret 等关键信息。
  • TTS 引擎(如百度 TTS 等,目前系统提供了百度、阿里、讯飞、华为、微软、火山引擎、MINIMAX、腾讯、思必驰、NCNN、ONNX),获取对应 API Key 、API Secret 等关键信息。
  • AI 模型(如 ChatGPT 等),获取对应 URL、模型等关键信息。
  • 知识库

XSwitch 页面配置流程

三大配置页:知识库 → 大模型 → AI 机器人,流程清晰,10 分钟完成对接。

  • 创建 大模型(填 url → 填 key → 选模型 → 测通)
  • 创建知识库(系统仅支持 Markdown 文件上传,大模型选 LeiTuo,同步然后生成对应 QA 文件,根据场景需求细化或补充 QA)
  • 创建 AI 机器人(绑定模型、知识库、ASR/TTS、AI 响应词)
  • 创建呼叫路由 → 被叫字冠(如 10000471)→ 目的地类型「AI 机器人」→ 选刚创建的机器人 → 主题(选填,默认不填即可)→ 保存
  • 拨打 10000471 测试,实时日志查看 ASR→LLM→TTS 全链路

大模型

登录后,点击 AI → 大模型 → 新建,进入大模型配置页面。系统已默认配置了 10 个大模型,可根据使用的厂商进行配置,如需新增,点击新建,填写以下信息:

  • 名称:任意,如“GPT-4-cn”
  • 类型:OpenAI、豆包等系统提供的 10 个模型中选择。
  • 模版:根据系统默认或已创建好的大模型进行选择,使用模版可快速复制已配置好的大模型,然后修改即可
  • 功能:默认「推理」,选填「嵌入」、「知识库」,根据需求选择,如果该大模型支持知识库,则可配置知识库,供后面的知识库使用。

详情参数说明

  • 设置:模型 ID、API Key、API Secret、Base URL 等基本配置
    • base_url:按厂商填,支持代理地址
    • token:按厂商填
    • 其他参数可自行添加(model_id:gpt-4-turbo / claude-3)
  • 推理:推理模型
    • 如 gpt-4o-mini
  • 嵌入:嵌入模型
    • 如 embedding-v1
  • 知识库:知识库模型
    • 如 kimi-k2-turbo-preview
  • 工具:工具模型
    • 如 gpt-4-tools

知识库

AI 机器人可以通过绑定知识库,实现知识库问答。该功能可以更准确地回答用户的问题,提高用户体验,但是速度较慢,适合回答结构化的问题。

知识库是 AI 机器人回答问题的知识来源,支持 Markdown 文件上传,支持同步,支持下载、删除。

  • 入口:AI → 知识库 → 新建
  • 选择引擎,比如 LeiTuoAI,数据来源于大模型(且只能选择大模型“功能”里选中知识库的大模型)
  • 支持 xx.md 上传,支持同步,支持下载、删除
  • 问答列表,可通过点击「详情」,查看问答语句。调用大模型,点击「自动生成」,一键生成问答对,提交后自动同步到知识库
  • 保存后,后续机器人绑定使用

创建知识库时,引擎如果未准备,可以不选择引擎,此时知识库信息仅存在系统数据库中,不会同步到知识库引擎,后续选择引擎后,可点击“同步”按钮实现同步。

QA 问答对

QA 问答对是知识库中存储的问答对,用于回答用户的问题。QA 问答对由问题和答案组成,问题和答案都是字符串类型。在 Markdown 中问题作为标题,答案为内容,如:

  • 问题:用户提出的问题,如“你好”
  • 答案:AI 机器人回答的问题,如“你好,我是 AI 机器人”

在 Markdown 中,问题和答案都是字符串类型,例子如下:

# 你好

你好,我是 AI 机器人

# 帮我查一下天气

今天天气晴朗,温度适宜

# 转人工客服

[Number: 123456]

AI 机器人

AI 机器人是 AI 语音助手的核心,通过绑定大模型、知识库、ASR/TTS、AI 响应词,实现语音对话。

模式设置

  • 大模型:下拉选择已创建的大模型

语音引擎设置

  • ASR 引擎:阿里、百度、讯飞、腾讯、华为等
  • ASR 模型:根据厂商提供的模型选择
  • ASR 语言:中文或英文,后续可以再增加其他语音支持
  • TTS 引擎:同厂商选同区域,可开启“缓存”节省调用
  • TTS 音色:可选,默认“标准女声”

知识库选择

  • 知识库:下拉选择已创建的知识库
  • 知识库匹配精度:0-1,0.7 表示匹配到 70% 的相似度,0.9 表示匹配到 90% 的相似度,如果未设置,则默认 0.9
  • 无匹配答案响应词:当知识库匹配不到答案时,返回该响应词,比如“抱歉,我还在学习中,暂时无法回答您的问题”
  • QA 匹配精度:0-1,0.7 表示匹配到 70% 的相似度,0.9 表示匹配到 90% 的相似度,如果未设置,则默认 0.9
  • QA 匹配响应词:当从 QA 里匹配不到答案时,返回该响应词,比如“抱歉,我还在学习中,暂时无法回答您的问题”

特别注意

  • 设置“无匹配答案响应词”及“QA 匹配响应词”后,系统只从知识库中找到最匹配的答案,如果知识库中也没有匹配的答案,则直接返回该响应词。
  • 如果未设置“无匹配答案响应词”及“QA 匹配响应词”,则系统会从知识库中找到最匹配的答案然后返回给大模型进行回答,如果知识库中也没有匹配的答案,则根据大模型返回的答案进行回答。

AI 响应设置

  • 提示词:AI 机器人回答问题的提示词,比如“你是一个 AI 客服助理,你的名字叫小樱桃。你的公司是烟台小樱桃网络科技有限公司,成立于 2016 年。公司的主要产品是 X Switch,一个实时音视频通信平台。X Switch 可以为用户提供一站式语音、视频、会议解决方案,满足企业多样化实时音视频通信需求。支持企业通信、IP-PBX、呼叫中心、视频会议等,支持国产化平台。对客户的问题,尽量简洁、礼貌的回答,如果有不知道的问题,可以说不知道,详细情况可以提示用户到公司网站 https://x-y-t.cn 和产品网站 https://xswitch.cn 上了解。公司的客服电话是 0535-6753997。” 提示词越详细,AI 机器人回答问题的准确率越高。
  • 欢迎语:AI 机器人首次对话的欢迎语,比如“你好,我是 AI 机器人,请问我可以帮您什么忙?”
  • 结束语检测词:AI 机器人结束通话的检测词,比如“再见,拜拜,拜,挂了吧”,当用户说出这些词时,AI 机器人会结束对话。
  • 响应词:当用户不说话时,AI 机器人的响应词,比如“您好,还在吗”
  • 响应等待时间:用户不说话时,AI 机器人等待的时间,比如“5”秒,超过这个时间,AI 机器人会播放响应词,比如“您好,还在吗”
  • 打断:是否允许打断,不允许打断时,用户必须等待 AI 机器人回答完才能说话,允许打断时,用户可以随时打断 AI 机器人回答
  • 自动录音:是否自动录音,自动录音后,用户和 AI 机器人的对话会被记录下来,方便后续查看和分析
  • 异步模式:是否异步模式,不同模式下的效果不同,根据实际需求选择
  • 开启滴提示音:是否开启滴提示音,开启后,机器人回答问题之前,会播放滴提示音
  • 方法调用:是否开启方法调用,一般涉及转接等功能时,需要开启方法调用
  • 是否转接:是否开启转接,开启转接后,当 AI 机器人识别到用户需要转接时,会自动转接到提示词中配置的转接电话上或根据知识库里配置的转接电话进行转接
  • 转接呼叫源:转接呼叫源,当开启转接后,系统会根据转接呼叫源查询路由,然后转接到路由中配置的目的地上,比如 IVR 、队列等

AI 路由

登录后,点击 呼叫 → 路由 → 新建,进入路由配置页面。根据实际情况配置路由,比如:

  • 路由名称:路由名称,比如“小樱桃客服路由”;
  • 被叫字冠:被叫前缀,比如“10000”,当用户呼叫 10000 开头的号码时,会进入该路由;
  • 最大号长:被叫号码长度,比如“8”,允许匹配的号码最大长度为 8 位,结合上面“被叫字冠”,只有当用户呼叫 10000 开头的最大位数为 8 的号码才会进入该路由;
  • 呼叫源:呼叫源,比如“context-1”,根据用户的实际呼叫源进行选择;
  • 目的地类型:高级功能 - AI 机器人,主题不填,默认 cn.xswitch.ctrl。

测试

配置完成后,使用软电话或 IP 话机注册分机号码,然后输入测试号码,点击呼叫,即可进行测试。测试后,可以从 AI 话单中查看测试结果。

[高级]菜单