|
百度云开放了语音识别开发,并且永久免费的,有成熟的REST API教学文档,适合爱好者研究,感兴趣者,大家可以到百度学习一下。
我们是基于了乐鑫ESP8266的RTOS SDK2.0版本的移植。
特点:
百度语音识别开发板子首次加入了PDM数字麦克风,仅需要SCK,DATA2线,有着极高的信噪比,很高的抗干扰能力,可以紧挨ESP8266芯片不受干扰,成功解决了发射时侯的“噗噗音”射频干扰声,最大特别的是省去了外置CODEC芯片,降低了成本。
百度云语音识别开发板,加入了AT+指令,有着比较详细的功能设置,实现了AT指令配置普通话,英语,粤语,四川话,普通话远场的设置,麦克风增益的设置,VAD设置,WIFI登陆密码,录音控制,极速版本切换,方便了用户设定语音功能。
百度云语音识别开发板,采用了边录制便上传的高效率机制,不用等语音录制结束再上传,这样的目的提高了效率,效果超出了ESP32的例子,目前最大上传语音时间是60秒,如果上传操作超出这个时间,开发板自动会强制退出上传。识别的所需时间和上传的语音大小有关。
百度语音语音识别开发板,加入了VAD语音检测库,VAD是一个可以检测语音活动区开始端和语音静音区的结束端的一个工具,可以实现无按键操作,释放了双手。
百度云语音开发板,加入了KWS唤醒词能力,可以在唤醒词后操作特定命令,更可喜的是,唤醒词可以用户通过AT指令设置,并且不用训练,高昂的唤醒词的定制门槛较高,并不适合爱好者学习研究的对象。
百度云语音开发板,支持命令词的修改,可以通过AT指令设定命令词甚至制定输出引脚的设定。
开源地址:geihub搜索 esp8266 baidu
achinnwoo
点个赞吧!
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|