AIAPI开发文档

VAD 录音接口

一般情况下,语音都在 XSwitch 内部处理,虽然我们实现了很多平台的接口,但对于没有实现的接口就无能为力了。因此,我们实现了基于 VAD 的录音接口,通过该接口,我们把录音根据 VAD「切开」,然后与第三方应用配合实现更多 AI 平台对接。

呼叫到达 XSwitch 后,启动 VAD 和录音。

当检测到语音时,启动录音,同时触发一个事件(Event),事件可以通过上一节的各种方式发出。

当检测到语音停止时,停止录音,同时触发一个事件,包括录音时长,主被叫号码,文件路径等。

第三方应用程序可以通过上一节描述的各种接口与 XSwitch 通信,获取录音,然后传到对应的服务进行识别或分析。

交互示意图如下:

   电话 ---------> XSwitch -------------> 应用程序 ------------  迅飞开放平台
          (讲话)   检测到讲话   ------------>
                  启动录音

       (停止讲话)   检测到讲话停止
                   停止录音        xx-1.mp3
                   录音路径    ------------->

                              <------       取录音          上传
                   返回录音文件 ------>       xx-1.mp3   --------------> 识别
                                                       <---------返回识别结果

          (讲话)   检测到讲话   ------------>
                  启动录音

       (停止讲话)   检测到讲话停止
                   停止录音        xx-2.mp3
                   录音路径    ------------->
                   ...
AIAPI接口