AIAPI开发文档
VAD 录音接口
一般情况下,语音都在 XSwitch 内部处理,虽然我们实现了很多平台的接口,但对于没有实现的接口就无能为力了。因此,我们实现了基于 VAD 的录音接口,通过该接口,我们把录音根据 VAD「切开」,然后与第三方应用配合实现更多 AI 平台对接。
呼叫到达 XSwitch 后,启动 VAD 和录音。
当检测到语音时,启动录音,同时触发一个事件(Event
),事件可以通过上一节的各种方式发出。
当检测到语音停止时,停止录音,同时触发一个事件,包括录音时长,主被叫号码,文件路径等。
第三方应用程序可以通过上一节描述的各种接口与 XSwitch 通信,获取录音,然后传到对应的服务进行识别或分析。
交互示意图如下:
电话 ---------> XSwitch -------------> 应用程序 ------------ 迅飞开放平台 (讲话) 检测到讲话 ------------> 启动录音 (停止讲话) 检测到讲话停止 停止录音 xx-1.mp3 录音路径 -------------> <------ 取录音 上传 返回录音文件 ------> xx-1.mp3 --------------> 识别 <---------返回识别结果 (讲话) 检测到讲话 ------------> 启动录音 (停止讲话) 检测到讲话停止 停止录音 xx-2.mp3 录音路径 -------------> ...