盘点XR872语音识别芯片
XR872语音识别开发板测内置了AEC回声消除,ASR,MP3离线包。
特性:
IEEE 802.11b/g/n, 1x1 SISO 2.4GHz
内置ARM Cortex-M4F的32 位微型 MCU,主频高达384MHZ,支持 RTOS
内置1024 bits的efuse
支持外置 Flash 和eXecute In Place(XIP) 模式
8路共享的通用DMA通道
内置8路12位分辨率和10位有效SAR型A / D转换器,其中7路普通通道,1路VBAT电压检测通道
集成 Wi-Fi MAC/ BB/RF/PA/LNA
支持WEP, WPA/WPA2, WPS2.0
支持UART/GPIO/ADC/PWM/IIC/I2S接口
支持AES/DES/3DES/SHA/MD5/CRC加密引擎
支持 STA/AP 工作模式
支持安卓、IOS的Smart Config(APP)/AirKiss(微信) 一键配网
支持串口本地升级和远程固件升级(FOTA)
通用AT指令可快速上手
支持二次开发,集成了Windows、Linux开发环境
集成音频子系统(Audio Subsystem),包括1个带有左右声道语音输入的数字麦克风控制器,1个24位音频数模 (DAC)通道,支持8KHz至192KHz的采样率,1个用于麦克风输入的24位音频模数(ADC)通道,支持8KHz至48KHz的采样率,1个用于线路输入的24位音频
集成视频子系统(Video Subsystem),支持JPEG、CSI编码模式,在离线编码模式下支持nv12输入格式,支持可配置的图片分辨率,最低图片分辨率:32x32,最大图片分辨率:1920x1088
看前面有点像esp32
价格? 看起来很厉害的样子! 本帖最后由 Bunny_Girl 于 2021-1-31 21:06 编辑
就是没有内置flash,只能靠efuse软件加密 —— esp32也是这样的 本帖最后由 Bunny_Girl 于 2021-1-31 21:03 编辑
淘宝搜到了,是这个吧?
语音识别是在线还是离线? 这家店铺里发现另一个,有fft加速,看着不错
是你们家的么?
看视频,安静条件下识别还可以,但不能说明能实用。要看噪声条件的识别效果,以及对口音的适应,再就是误唤醒。 fengyunyu 发表于 2021-1-31 21:59
看视频,安静条件下识别还可以,但不能说明能实用。要看噪声条件的识别效果,以及对口音的适应,再就是误唤 ...
这个不是自己写算法的么? 本帖最后由 fengyunyu 于 2021-1-31 22:11 编辑
Bunny_Girl 发表于 2021-1-31 22:02
这个不是自己写算法的么?
算法一般用的开源的。另外海量语音训练也还很关键。噪音下的识别率、误唤醒、口音适应性要做好比较难。国内做的比较好的科大讯飞,思必驰,云之声之类。 fengyunyu 发表于 2021-1-31 22:09
算法一般用的开源的。另外海量语音训练也还很关键。噪音下的识别率、误唤醒、口音适应性要做好比较难。国 ...
你们都没有自己写算法的???
要求高的还是得自己做的 Bunny_Girl 发表于 2021-1-31 22:13
你们都没有自己写算法的???
要求高的还是得自己做的
算法一般个人搞不了,要依托原厂的库或算法公司的库 fengyunyu 发表于 2021-1-31 22:18
算法一般个人搞不了,要依托原厂的库或算法公司的库
好吧,我就是小众的自己搞的…… 本帖最后由 fengyunyu 于 2021-1-31 22:33 编辑
Bunny_Girl 发表于 2021-1-31 22:19
好吧,我就是小众的自己搞的……
对你自己搞,比较怀疑,或只是个玩具。科大讯飞、思必驰、云之声等都是几百人的团队。其他互问、启英、华镇等小点的公司也百十号人 fengyunyu 发表于 2021-1-31 22:27
对你自己搞,比较怀疑,或只是个玩具。科大讯飞、思必驰、云之声等都是几百人的团队 ...
这样我就放心了 Bunny_Girl 发表于 2021-1-31 22:32
这样我就放心了
国内做语音识别的公司很多是用的开源的Kaldi,很多高校搞语音识别的也是用的kaldi。 高端技术 白菜价格 好得很 看样子 2-3年之后会普及 不知道效果怎么样,我们用启英,效果一般 Bunny_Girl 发表于 2021-1-31 21:00
淘宝搜到了,是这个吧?
(引用自5楼)
你玩起来了没有?
页:
[1]