搜索
bottom↓
回复: 64

有人了解玩具的语音识别吗?求推荐方案

  [复制链接]

出0入0汤圆

发表于 2017-2-16 10:36:50 | 显示全部楼层 |阅读模式
不需要像siri那样识别语句语义,只需要能识别一定的简单命令(可以是预存的命令)
许多便宜玩具都具有识别命令功能,怎么做到的呢?网上查到的芯片都要卖几十元

出0入0汤圆

发表于 2017-2-16 10:53:47 | 显示全部楼层
不用那么贵,PCBA看功能只要 十几元不等,简单的可以做到10元以下, 中国能做单片机语音识别的就那么几家,一家是科大讯飞的合作公司,但估计对您没兴趣
还有北京捷通,好像现在不怎么做低端产品了
还剩下就是我们了

其他做语音识别的大大小小的厂家基本都是跟这3家拿货,换个名字而已

我们的 智能对话娃娃,语音识别 tom变音猫,  会动的仓鼠等等, 占据80%以上的市场份额

出0入0汤圆

发表于 2017-2-16 11:13:41 | 显示全部楼层
scofiled 发表于 2017-2-16 10:53
不用那么贵,PCBA看功能只要 十几元不等,简单的可以做到10元以下, 中国能做单片机语音识别的就那么几家, ...

没看到你店里有语音识别芯片?

出0入34汤圆

发表于 2017-2-16 11:19:29 | 显示全部楼层
LD3320?要不自己 DIY 吧!资料在 这里 & 这里

出0入0汤圆

发表于 2017-2-16 11:38:43 | 显示全部楼层
scofiled 发表于 2017-2-16 10:53
不用那么贵,PCBA看功能只要 十几元不等,简单的可以做到10元以下, 中国能做单片机语音识别的就那么几家, ...

十年前刚玩单片机时,好像是凌阳单片机专门搞这个语音识别的,不知道现在还有没有,他们用的是哪家的.

出0入0汤圆

发表于 2017-2-16 11:44:11 | 显示全部楼层
vvi 发表于 2017-2-16 11:13
没看到你店里有语音识别芯片?

语音识别项目都是 专门定制的,不是一个标准的芯片,直接立项开发就行

出0入0汤圆

发表于 2017-2-16 11:45:04 | 显示全部楼层
hyz_avr 发表于 2017-2-16 11:38
十年前刚玩单片机时,好像是凌阳单片机专门搞这个语音识别的,不知道现在还有没有,他们用的是哪家的. ...

凌阳是很久前做过语音识别,但现在已经很少人用了,因为凌阳的芯片比较老了

凌阳现在已经转战其他领域

出0入0汤圆

发表于 2017-2-16 11:50:34 | 显示全部楼层
scofiled 发表于 2017-2-16 11:45
凌阳是很久前做过语音识别,但现在已经很少人用了,因为凌阳的芯片比较老了

凌阳现在已经转战其他领域 ...

哦,是这样,那时候觉得好牛逼,但一直没机会玩玩.

你的有没demo模块,搞一批让大家玩玩.

出0入0汤圆

发表于 2017-2-16 11:52:09 | 显示全部楼层
hyz_avr 发表于 2017-2-16 11:50
哦,是这样,那时候觉得好牛逼,但一直没机会玩玩.

你的有没demo模块,搞一批让大家玩玩. ...

迟点会搞模块,就是自己可以更换识别指令的,这样玩起来比较爽

之前都是专案开发模式,很多用户不能接受

现在我先把语音flash模块搞定,然后我就有空搞 识别flash模块了

出0入0汤圆

发表于 2017-2-16 12:02:56 | 显示全部楼层
这个有用,先记号吧!!!

出0入0汤圆

 楼主| 发表于 2017-2-16 13:48:47 | 显示全部楼层
scofiled 发表于 2017-2-16 10:53
不用那么贵,PCBA看功能只要 十几元不等,简单的可以做到10元以下, 中国能做单片机语音识别的就那么几家, ...

请问你的方案是什么芯片?还是模块是否可以发点资料给我?

出0入0汤圆

发表于 2017-2-16 14:55:12 | 显示全部楼层
nanfang2000 发表于 2017-2-16 13:48
请问你的方案是什么芯片?还是模块是否可以发点资料给我?

你好,语音识别不是您理解的常规单片机开发, 是一个系统, 系统由什么芯片实现不重要

主要看的是语音指令,一般便宜的单片系统支持  十几条语音指令是没问题的

语音识别需要了解的资料是语音指令

语音识别分两种:特定人识别和非特定人识别

常规做的是非特定人识别,就是人人都可以说话,但这种便宜的系统需要 预先采集好指令, 我们已经采集好几百条常用的指令库,例如:“你好”

一条指令平均要找700个人录音,男女老少,所以每一条指令都是由钱堆出来的,价格非常昂贵

如果你需要的指令不在我们的 指令库里面,就需要自己出录音费,一般都几万元起,不是一般人玩得起的


这种预先录音的叫整词识别

当然整词识别有很多限制,但好处就是低成本,识别率高,而且不用连接云端

还有一种延伸的脱机识别方法是 非整词识别,就是将拼音录好,就不用具体录一个词了,这种不受词库限制,但缺点也很明显:价格高(就像楼上科大讯飞的芯片 动砸几十元一片)

价格贵的同时,因为识别由拼音音素组合得出,所以识别效果也没有整词的好,所以应用一直很少。 大部分案例还是用整词的多,包括现在很流行的电视语音识别遥控器,很多都是整词做的

出0入0汤圆

 楼主| 发表于 2017-2-16 15:22:57 | 显示全部楼层
scofiled 发表于 2017-2-16 14:55
你好,语音识别不是您理解的常规单片机开发, 是一个系统, 系统由什么芯片实现不重要

主要看的是语音指 ...

你好,因为我是个简单的玩具单片机系统,所以不知道你的系统有多大多复杂,是否方便集成到我的系统。我的需求是除了命令以外,最好用户可以自己存自己的声音命令能做到吗?比如用户给玩具起名叫汤姆

出0入0汤圆

发表于 2017-2-16 15:47:38 | 显示全部楼层
最好不要用词库没有的词条,上面有清晰说明原因

所以自己起名也不是很现实,虽然市场有类似可以起名的产品,但效果都不是很好

低成本的建议用整词方式

出0入0汤圆

发表于 2017-2-16 15:50:38 | 显示全部楼层
关注中,对语音识别很感兴趣

出0入0汤圆

 楼主| 发表于 2017-2-16 15:54:32 | 显示全部楼层
scofiled 发表于 2017-2-16 15:47
最好不要用词库没有的词条,上面有清晰说明原因

所以自己起名也不是很现实,虽然市场有类似可以起名的产品 ...

非常感谢你的详细解释!再问一下,你们的方案是否是纯软件方案?因为我的系统已经有数字麦克风输入了,我已经得到了PCM数据

出0入0汤圆

发表于 2017-2-16 16:02:03 | 显示全部楼层
自己做个?
http://www.amobbs.com/thread-5477228-1-1.html

出0入0汤圆

发表于 2017-2-16 16:07:28 | 显示全部楼层
nanfang2000 发表于 2017-2-16 15:54
非常感谢你的详细解释!再问一下,你们的方案是否是纯软件方案?因为我的系统已经有数字麦克风输入了,我 ...

讯飞有 离线识别方案,不过需要跑安卓系统, 一台机授权费4元。

出0入0汤圆

发表于 2017-2-16 16:39:34 | 显示全部楼层
新唐isd9160,有你想要的功能

出0入0汤圆

 楼主| 发表于 2017-2-16 18:05:57 | 显示全部楼层
hpu07 发表于 2017-2-16 16:39
新唐isd9160,有你想要的功能

谢谢,这个不错,才10来块钱,就是不知道效果如何

出0入0汤圆

发表于 2017-2-16 18:12:49 | 显示全部楼层
nanfang2000 发表于 2017-2-16 18:05
谢谢,这个不错,才10来块钱,就是不知道效果如何


公司其他同事用它做语音控制,识别语音指令还可以

出0入0汤圆

 楼主| 发表于 2017-2-16 18:26:05 | 显示全部楼层
hpu07 发表于 2017-2-16 18:12
公司其他同事用它做语音控制,识别语音指令还可以

请教一下是像LDxxxx那样识别拼音还是需要录音存模板的?

出0入0汤圆

发表于 2017-2-16 18:30:19 | 显示全部楼层
scofiled 发表于 2017-2-16 14:55
你好,语音识别不是您理解的常规单片机开发, 是一个系统, 系统由什么芯片实现不重要

主要看的是语音指 ...

按你这样说,科大讯飞之类的只能通过通讯,将特定的指令发到他们的数据库,再搜索数据库分析出是什么指令,然后再通过通讯返回本地进行操作,这个过程不是需要很漫长,我的理解对吗?

出0入0汤圆

发表于 2017-2-16 19:31:03 来自手机 | 显示全部楼层
是外挂个flash吧 8M能存多少条简单的2字 3字  5字指令

出0入0汤圆

发表于 2017-2-16 20:11:05 | 显示全部楼层
nanfang2000 发表于 2017-2-16 15:54
非常感谢你的详细解释!再问一下,你们的方案是否是纯软件方案?因为我的系统已经有数字麦克风输入了,我 ...

低成本版本都是离线的方案了,不是纯软件的,是软件和芯片结合,芯片设计的时候就做了部分硬件运算模块,不然速度跟不上,跟上成本也高,例如新唐的,成本就比较高

出0入0汤圆

发表于 2017-2-16 20:12:55 | 显示全部楼层
88mw300 发表于 2017-2-16 16:07
讯飞有 离线识别方案,不过需要跑安卓系统, 一台机授权费4元。

科大讯飞基本都是卖授权,或者卖算法, 自己基本不做芯片

因为这个竞争太激烈,做几块钱的芯片根本养不活科大讯飞的那个团队,人家是上市公司

小钱不挣,也挣不了,他们一个工程师的工资都数以万计,所以低端市场他基本放弃了

出0入0汤圆

发表于 2017-2-16 20:15:24 | 显示全部楼层
新唐的isd9160 是一个M0内核 芯片,价格昂贵,而且新唐本身没有做语音识别 技术积累,只提供了一个简单的识别库

只能起到演示作用,很少人拿来做产品,因为做出来效果一般般,也很难卖得出去

但有科大讯飞的合作公司拿这个芯片移植科大讯飞的算法,加上授权费,那价格就上去了,所以低端市场还是我们的天下

出0入0汤圆

发表于 2017-2-16 20:17:45 | 显示全部楼层
nanfang2000 发表于 2017-2-16 18:26
请教一下是像LDxxxx那样识别拼音还是需要录音存模板的?

LDxxx或类似的芯片 几十元 一片,因为内部集成的比较大的 音调库,所以价格昂贵

这类芯片基本采用拼音组合识别方式

优点:不用采库,可以任意定义语音识别指令

缺点:识别效果不理想,价格昂贵

所以这里芯片大家可以看到在淘宝上基本都是学生买回去做毕业论文用

实际量产产品用得很少

出0入0汤圆

发表于 2017-2-16 20:19:08 | 显示全部楼层
sinc_mark 发表于 2017-2-16 18:30
按你这样说,科大讯飞之类的只能通过通讯,将特定的指令发到他们的数据库,再搜索数据库分析出是什么指令 ...

参照28楼内容

这类芯片都是串口 发送控制指令,生成需要识别的指令,内部一般是拼音组合

出0入0汤圆

发表于 2017-2-16 20:26:25 来自手机 | 显示全部楼层
学习了,留个几号,语音识别

出0入0汤圆

发表于 2017-2-16 20:35:53 | 显示全部楼层
scofiled 发表于 2017-2-16 20:19
参照28楼内容

这类芯片都是串口 发送控制指令,生成需要识别的指令,内部一般是拼音组合 ...

有用在智能家居行业中的语音识别吗?

出0入0汤圆

发表于 2017-2-16 20:37:18 | 显示全部楼层
mfkqqw 发表于 2017-2-16 20:35
有用在智能家居行业中的语音识别吗?

智能家居 基本都用安卓做了,跟科大讯飞买授权

用芯片离线实现的效果不会太好的,实话实说

就算是在线的siri,你也觉得它很“RZ”

出0入0汤圆

发表于 2017-2-17 00:54:59 | 显示全部楼层
                     
mark

出0入0汤圆

发表于 2017-2-17 09:36:43 | 显示全部楼层
nanfang2000 发表于 2017-2-16 18:26
请教一下是像LDxxxx那样识别拼音还是需要录音存模板的?

具体操作我就不知道是怎样的了

出0入0汤圆

 楼主| 发表于 2017-2-17 10:03:47 | 显示全部楼层
scofiled 发表于 2017-2-16 20:11
低成本版本都是离线的方案了,不是纯软件的,是软件和芯片结合,芯片设计的时候就做了部分硬件运算模块, ...

那你们的方案到底什么价位,多大体积,功耗,接口,能否提供一下参数?

出0入0汤圆

发表于 2017-2-17 13:26:25 | 显示全部楼层
scofiled 发表于 2017-2-16 20:37
智能家居 基本都用安卓做了,跟科大讯飞买授权

用芯片离线实现的效果不会太好的,实话实说

看了你的OTP片子,我以前买贵了,好几万片呀。
不过现在不做了,以后有机会就用你家的

出0入0汤圆

发表于 2017-2-17 16:52:43 | 显示全部楼层
scofiled 发表于 2017-2-16 10:53
不用那么贵,PCBA看功能只要 十几元不等,简单的可以做到10元以下, 中国能做单片机语音识别的就那么几家, ...


,先留个爪,以后可能会有交往。。。
顺便问下,放在产品中能过EMC的相关要求吗?

出0入0汤圆

发表于 2017-2-17 22:27:34 | 显示全部楼层
nanfang2000 发表于 2017-2-17 10:03
那你们的方案到底什么价位,多大体积,功耗,接口,能否提供一下参数? ...

不同的需求会有不同的芯片完成,有需要跟客服联系

出0入0汤圆

发表于 2017-2-17 22:28:22 | 显示全部楼层
markdif 发表于 2017-2-17 16:52
,先留个爪,以后可能会有交往。。。
顺便问下,放在产品中能过EMC的相关要求吗? ...

语音芯片的 EMC都不高,主要靠外围

出0入0汤圆

发表于 2017-3-8 10:02:10 | 显示全部楼层
mark一下,以后可能用到。

出0入0汤圆

发表于 2017-3-8 10:41:18 | 显示全部楼层
mark一下,低端市场~~大家举个例子?

出0入0汤圆

发表于 2017-7-10 12:25:47 | 显示全部楼层
scofiled 发表于 2017-2-16 10:53
不用那么贵,PCBA看功能只要 十几元不等,简单的可以做到10元以下, 中国能做单片机语音识别的就那么几家, ...

你好,怎么联系

出0入0汤圆

发表于 2017-7-15 10:31:57 | 显示全部楼层
台湾NY有做语音,九齐IC

出0入0汤圆

发表于 2017-9-9 10:01:32 | 显示全部楼层
用ISD9160 做过几个案子,效果还行。

出5入10汤圆

发表于 2020-7-31 16:11:07 | 显示全部楼层
scofiled 发表于 2017-2-16 10:53
不用那么贵,PCBA看功能只要 十几元不等,简单的可以做到10元以下, 中国能做单片机语音识别的就那么几家, ...

你们是哪个公司,有在淘宝卖语音识别模块吗?

出0入0汤圆

发表于 2020-8-7 15:29:56 | 显示全部楼层
chen849928055 发表于 2020-7-31 16:11
你们是哪个公司,有在淘宝卖语音识别模块吗?

我们公司有离线语音识别模块  十块出头的价格

出5入10汤圆

发表于 2020-8-7 15:33:07 | 显示全部楼层
MP568742974 发表于 2020-8-7 15:29
我们公司有离线语音识别模块  十块出头的价格

给个链接看看         

出0入0汤圆

发表于 2020-8-7 15:35:50 | 显示全部楼层

深圳市威凯特科技有限公司  直接百度一下就能看到信息  也可以联系我一下电话了解一下 13878305857

出0入60汤圆

发表于 2020-8-7 15:52:05 来自手机 | 显示全部楼层
MP568742974 发表于 2020-8-7 15:29
我们公司有离线语音识别模块  十块出头的价格

识别程度如何?

出0入0汤圆

发表于 2020-8-7 15:52:58 | 显示全部楼层

百分之95

出0入0汤圆

发表于 2020-8-7 15:54:24 | 显示全部楼层

直接买模块也行直接买MCU自己研发也行    自己研发还能提供FAE支持

出0入60汤圆

发表于 2020-8-7 16:06:37 来自手机 | 显示全部楼层
MP568742974 发表于 2020-8-7 15:52
百分之95

能离线像siri那样的?95%?

出0入0汤圆

发表于 2020-8-7 16:29:38 | 显示全部楼层
Bunny_Girl 发表于 2020-8-7 16:06
能离线像siri那样的?95%?

是的   有空可以联系一下

出90入0汤圆

发表于 2020-8-7 16:31:04 | 显示全部楼层
MP568742974 发表于 2020-8-7 15:35
深圳市威凯特科技有限公司  直接百度一下就能看到信息  也可以联系我一下电话了解一下 13878305857 ...

搞一点模块出售啊。

出0入0汤圆

发表于 2020-8-7 16:33:41 | 显示全部楼层
hzpyl 发表于 2020-8-7 16:31
搞一点模块出售啊。

可以啊   你可以给我个电话加个微信留个信息- -

出0入60汤圆

发表于 2020-8-7 16:37:05 来自手机 | 显示全部楼层
本帖最后由 Bunny_Girl 于 2020-8-7 16:40 编辑
MP568742974 发表于 2020-8-7 16:29
是的   有空可以联系一下


搜到了,是这种吧?
就是上面几楼说的ISD9160

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入0汤圆

发表于 2020-8-7 16:41:15 | 显示全部楼层
Bunny_Girl 发表于 2020-8-7 16:37
搜到了,是这种吧?
就是上面几楼说的ISD9160

对 是这颗IC   不过开发起来比较困难   新唐的代理商里只有我们一家能做  有意向希望可以联系一下我

出0入60汤圆

发表于 2020-8-7 16:45:01 来自手机 | 显示全部楼层
另外还有上面提到的LD3320
市面上已经上市的有就这样了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入0汤圆

发表于 2020-8-7 16:48:15 | 显示全部楼层
mark一下

出0入60汤圆

发表于 2020-8-7 16:48:38 来自手机 | 显示全部楼层
的确是比较低端

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

出0入0汤圆

发表于 2020-8-7 16:49:16 | 显示全部楼层
Bunny_Girl 发表于 2020-8-7 16:45
另外还有上面提到的LD3320
市面上已经上市的有就这样了

EMMMM  怎么说呢  你要综合评估一下的    比如加个啥的   我们十块出头是个模块   他们20来块是颗IC  然后我们模块还能识别36种国家的语音     其实总得来说综合性价比的话确实新唐9160很有优势你可以对比一下的

出0入60汤圆

发表于 2020-8-7 16:51:13 来自手机 | 显示全部楼层
本帖最后由 Bunny_Girl 于 2020-8-7 16:52 编辑
MP568742974 发表于 2020-8-7 16:49
EMMMM  怎么说呢  你要综合评估一下的    比如加个啥的   我们十块出头是个模块   他们20来块是颗IC  然 ...


额,不好意思
只是刚好路过,了解下同行的情况……
顺便帮楼主大家搜下资料
不厚道了,闪人……

出0入0汤圆

发表于 2020-8-7 16:52:21 | 显示全部楼层
Bunny_Girl 发表于 2020-8-7 16:51
额,不好意思
只是刚好路过,了解下同行的情况……
不厚道了,闪人…… ...

- -没事没事  同行交流一下也是可以的

出0入0汤圆

发表于 2020-8-7 16:53:00 | 显示全部楼层
Bunny_Girl 发表于 2020-8-7 16:51
额,不好意思
只是刚好路过,了解下同行的情况……
顺便帮楼主大家搜下资料

LD3320主要是用来做演示用的,实际效果不太好   你实际测试一下就知道了

出0入4汤圆

发表于 2022-8-4 22:06:47 | 显示全部楼层
Bunny_Girl 发表于 2020-8-7 16:51
额,不好意思
只是刚好路过,了解下同行的情况……
顺便帮楼主大家搜下资料
(引用自62楼)

有啥好用语音识别的IC
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-4-20 09:05

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表