更新时间:2025-05-07 GMT+08:00
分享

Web语音唤醒

产品预置了唤醒能力,详见预制唤醒能力,如果用户需要更新唤醒词,需要参考定制唤醒能力处理。唤醒模型定制完成后,产品会提供给用户,用户需要参考更新唤醒模型,将模型更新至本地模型路径中。

使用要求

  • WebSDK版本为3.0.1及以上。
  • 仅支持数字人平台配置或内置ASR(语音转文本)能力的方案。不支持WebSocket接口驱动数字人方案,即文本驱动方案。
  • 在调用create接口之前,必须要有用户点击集成WebSDK的页面的行为。

    浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。

  • 浏览器使用限制,请参见表1
    表1 浏览器适配详情

    操作系统类型

    浏览器类型

    浏览器版本

    Windows

    Chrome浏览器

    91+

    Edge浏览器

    91+

    Android

    移动版Chrome浏览器

    91+

    iOS

    移动版Safari浏览器

    17.3+

    Mac

    Safari浏览器

    16.5+

预制唤醒能力

自3.0.1版本开始,SDK支持唤醒能力(注意:如果使用了websocket接口驱动数字人的方案,是不支持websdk内置语音唤醒能力的)。预制的唤醒能力支持使用“你好云笙”、“稍等一下”、“谢谢再见”三个唤醒词,进行数字人唤醒、打断和退出。

可以通过调用create接口,设置接口参数param中config里的enableLocalWakeup参数来开启Web语音唤醒能力。

定制唤醒能力

如果客户希望使用体现企业文化的唤醒词,需联系MetaStudio服务支持,技术人员会根据唤醒词定制唤醒模型。唤醒模型的定制周期在5个工作日左右,定制唤醒词的上限为8个。

唤醒词的反馈格式,如下所示:

  • 唤醒:你好云笙、云笙你好
  • 打断:稍等一下
  • 退出:谢谢再见

更新唤醒模型

客户获取到MetaStudio定制的唤醒模型后,需替换原hwICSUiSdk文件modelData.js,之后将wasmData.js与modelData.js放置到项目的静态资源文件夹下面或者其他可以通过http请求访问到的位置,之后再调用初始化唤醒资源路径接口initResourcePath设置正确的资源路径,然后调用create或者setConfig创建交互任务。

图1 替换modelData.js文件

相关文档

    OSZAR »