搜索
bottom↓
楼主: lcw_swust

一个简单的语音识别程序

  [复制链接]

出0入0汤圆

发表于 2012-11-27 16:45:44 | 显示全部楼层
     

出0入0汤圆

发表于 2012-11-27 18:14:33 | 显示全部楼层
之前搞过一次,没搞成。由于时间原因放下了,打算重新拾起。。。。

出0入0汤圆

发表于 2012-11-29 09:24:26 | 显示全部楼层
在识别状态下,用这34个功率谱去与模板匹配,找出误差最小的,若误差小于一定值,则识别成功.


请问这个误差小于一定值 ,这个一定值怎么定义呢?

出0入0汤圆

 楼主| 发表于 2012-11-29 09:28:07 | 显示全部楼层
时代还怪 发表于 2012-11-29 09:24
请问这个误差小于一定值 ,这个一定值怎么定义呢?

这个值由实验确定

出0入0汤圆

发表于 2012-11-29 11:23:30 | 显示全部楼层
厉害,不知道效果如何

出0入0汤圆

发表于 2012-11-29 12:28:47 | 显示全部楼层
这东东可以简单么?

出0入0汤圆

发表于 2012-11-29 13:36:52 | 显示全部楼层

出0入0汤圆

发表于 2012-11-29 23:12:52 | 显示全部楼层
MARK,记号。

出0入24汤圆

发表于 2012-11-29 23:16:30 | 显示全部楼层
学习一下,长见识了

出0入0汤圆

发表于 2013-1-8 21:48:11 | 显示全部楼层
顶起  我也是做语音的  不过还在起步阶段  现在的发展应该很好  

出0入0汤圆

发表于 2013-1-8 22:28:21 | 显示全部楼层
有意思,不错

出0入0汤圆

发表于 2013-1-18 10:40:29 | 显示全部楼层
一个用Atmega32实现的语音识别,mark

出0入0汤圆

发表于 2013-1-18 10:51:14 | 显示全部楼层
楼主厉害厉害

出0入0汤圆

 楼主| 发表于 2013-1-18 10:56:21 | 显示全部楼层
xiaohuixh 发表于 2013-1-18 10:40
一个用Atmega32实现的语音识别,mark

也许是被前面的语言误导了
其实这个电路里所用的单片机是STC12C5604AD。
由于占用RAM以及FLASH的量较小,程序移植到AVR单片机上也没问题。(如ATmega8、ATmega32...)

出0入0汤圆

发表于 2013-6-20 11:48:13 | 显示全部楼层
这个特别厉害啊!

出0入0汤圆

发表于 2013-6-20 12:55:21 | 显示全部楼层
感谢共享~~~~~~~~~~~~~~

出0入0汤圆

发表于 2013-6-20 16:05:12 | 显示全部楼层
搞不懂,记号

出100入0汤圆

发表于 2013-6-20 16:37:27 | 显示全部楼层
这个好,mark以后用得着~

出0入17汤圆

发表于 2013-6-21 08:49:19 | 显示全部楼层
要做好不容易~~~~

出0入0汤圆

发表于 2013-6-21 09:04:22 | 显示全部楼层
大三时参加比赛用凌阳的做过,感觉识别能力有待提高,不知道楼主这个怎样?

出0入0汤圆

发表于 2013-6-21 10:36:57 | 显示全部楼层
學習,學習 mark

出0入0汤圆

发表于 2013-6-22 14:14:11 | 显示全部楼层
好资料,一直想搞语音识别,谢谢。

出0入0汤圆

发表于 2013-7-7 21:05:32 来自手机 | 显示全部楼层
标记一下先

出0入0汤圆

发表于 2013-7-7 21:37:11 | 显示全部楼层
这个必须支持下

出0入0汤圆

发表于 2013-7-9 15:50:54 | 显示全部楼层
好东西,新手学习中

出0入0汤圆

发表于 2013-8-12 00:35:09 | 显示全部楼层
mark            

出0入0汤圆

发表于 2013-8-14 12:34:24 来自手机 | 显示全部楼层
mark……
顶一个…

出0入0汤圆

发表于 2013-8-14 12:53:36 | 显示全部楼层
好资料,建议用更高的处理芯片

出0入0汤圆

发表于 2013-8-14 13:07:00 | 显示全部楼层

学习了      

出0入0汤圆

发表于 2013-8-15 08:21:19 来自手机 | 显示全部楼层
识别有限的范围,还比较容易。要能到siri的程度难

出0入0汤圆

发表于 2013-8-15 08:29:48 | 显示全部楼层
这个帖子一定得顶啊。计划搞语音识别5年了,到现在都没有动手。

出0入0汤圆

发表于 2013-8-15 10:28:05 | 显示全部楼层
bucuo   看看  谢谢楼主

出0入0汤圆

发表于 2013-8-15 11:30:38 | 显示全部楼层
敢于探索, 支持鼓励!

出0入0汤圆

发表于 2013-8-15 11:35:21 | 显示全部楼层
为什么不直接比较波形呢? ---- 因为时域信号不稳定,特征不明显。
因此,语音识别这类问题,都转化到频域里求解。

声音的频率特性,是和说话人发音系统的物理特性相关的,特征明显,稳定性好,易于重现。

楼主做的实际上是特定人语音识别,建立的模型就是所谓的“声纹”,类似指纹,是描述特定人特征的。非特定人语音识别不是这样做的

鼓励楼主的探索精神!

出0入0汤圆

发表于 2013-10-23 16:25:00 | 显示全部楼层
好资料,有时间研究下,多谢分享

出0入0汤圆

发表于 2013-10-23 16:25:45 | 显示全部楼层
没接触过。。。

出0入0汤圆

发表于 2013-10-23 22:01:50 | 显示全部楼层
太好了,我正想把房间的灯改成语音控制的,这样就不用下床关灯了。

出0入0汤圆

发表于 2014-3-5 18:07:47 | 显示全部楼层
hendry 发表于 2013-8-15 11:35
为什么不直接比较波形呢? ---- 因为时域信号不稳定,特征不明显。
因此,语音识别这类问题,都转化到频域 ...

哥们儿说的有问题吧?
现在的识别特征,都是在倒谱域的特征,频域的特征用的少。
而且语音识别 和 声纹识别根本不是一样的东西。声纹识别即说话人识别,用于辨识说话人或确认说话人。语音识别是识别说话内容。

出0入0汤圆

发表于 2014-3-5 19:23:12 | 显示全部楼层
顶  先拿来看看再说

出0入0汤圆

发表于 2014-3-5 21:10:28 | 显示全部楼层
学习了~~~~~~~~~~~~~~~~~~~~

出0入0汤圆

发表于 2014-3-5 21:46:12 | 显示全部楼层
标记下

出0入0汤圆

发表于 2014-3-5 23:00:16 | 显示全部楼层

特来学习

出0入0汤圆

发表于 2014-3-6 04:29:47 来自手机 | 显示全部楼层
谢谢分享

出0入0汤圆

发表于 2014-3-6 14:16:50 | 显示全部楼层
学习了。看看

出0入0汤圆

发表于 2014-3-6 15:39:56 | 显示全部楼层
语音识别mark

出0入0汤圆

发表于 2014-3-6 16:06:56 | 显示全部楼层
高手在民间

出0入0汤圆

发表于 2014-3-12 11:15:11 | 显示全部楼层
不错,感谢分享,好东西

出0入0汤圆

发表于 2014-3-12 11:23:15 | 显示全部楼层
这个东西不错

出0入0汤圆

发表于 2014-3-12 13:13:22 | 显示全部楼层
mark...一直很有兴趣

出0入0汤圆

发表于 2014-3-12 15:38:31 | 显示全部楼层
好东西,好东西啊..

出0入0汤圆

发表于 2014-3-12 17:00:28 | 显示全部楼层
COOL

出0入8汤圆

发表于 2014-5-14 22:22:24 | 显示全部楼层
MARK!!!

出0入0汤圆

发表于 2014-5-15 09:45:30 来自手机 | 显示全部楼层
MARK  音频通信

出0入0汤圆

发表于 2014-5-15 10:06:25 | 显示全部楼层
好东西,下来看看。谢谢LZ共享

出0入0汤圆

发表于 2014-5-15 10:11:47 | 显示全部楼层
不知道准确率如何?

出0入0汤圆

发表于 2014-5-15 11:03:10 | 显示全部楼层
看到过 Robi 机器人 介绍,前面也有先学习,原理不清楚

出0入54汤圆

发表于 2014-5-15 12:21:06 | 显示全部楼层
LD3320 能做非特定人声识别

出0入0汤圆

发表于 2014-5-16 12:51:52 | 显示全部楼层
很不错,学习一下!!!

出0入0汤圆

发表于 2014-5-16 13:15:01 | 显示全部楼层
好东西!!!!

出0入0汤圆

发表于 2014-5-16 13:59:24 | 显示全部楼层
MARK            以防有用

出0入0汤圆

发表于 2014-5-16 16:49:32 | 显示全部楼层
简单的控制一下 我觉得可以

出0入0汤圆

发表于 2014-5-16 17:03:44 | 显示全部楼层
mark.......

出0入0汤圆

发表于 2014-5-16 22:40:51 | 显示全部楼层
顶一下!         

出0入0汤圆

发表于 2014-5-17 06:57:26 | 显示全部楼层
挺有意思的啊,不错!

出0入16汤圆

发表于 2014-5-17 08:33:37 | 显示全部楼层
厉害

出0入0汤圆

发表于 2014-5-18 07:07:39 来自手机 | 显示全部楼层
不知道准不准

出0入0汤圆

发表于 2014-5-18 10:33:15 | 显示全部楼层
学习学习

出0入0汤圆

发表于 2014-5-18 12:29:48 | 显示全部楼层
这个好啊

出0入0汤圆

发表于 2014-5-18 18:07:31 | 显示全部楼层
不错!!!!

出0入0汤圆

发表于 2014-5-19 10:08:35 | 显示全部楼层
标记一下,有时间再来研究一下

出0入0汤圆

发表于 2015-1-20 13:35:38 | 显示全部楼层
这个比较有意思,有时间试一下

出0入0汤圆

发表于 2015-1-20 13:56:43 | 显示全部楼层
学习一下!!

出0入0汤圆

发表于 2015-1-20 15:53:52 | 显示全部楼层
暂时用不上,收藏了

出0入0汤圆

发表于 2015-1-20 15:57:55 | 显示全部楼层
这个支持一下

出0入0汤圆

发表于 2015-1-20 18:44:12 | 显示全部楼层
不错                    学习                       

出0入0汤圆

发表于 2015-1-20 22:11:25 | 显示全部楼层
太NB了!!学习!!

有没有FDT简单介绍?

出0入0汤圆

发表于 2015-1-21 00:31:13 | 显示全部楼层
以前跟中科院的一起搞过图像识别。不过我都是做外围的,核心算法在别人那里。语言识别还真没涉足过。楼主高人……

出0入0汤圆

 楼主| 发表于 2015-1-21 09:30:31 | 显示全部楼层
cn520 发表于 2015-1-20 22:11
太NB了!!学习!!

有没有FDT简单介绍?

DFT在《数字信号处理》中有详细的介绍,但是也相当抽象。
网上也有很多这种资料:
http://www.docin.com/p-343379213.html

出0入0汤圆

发表于 2015-1-21 09:42:40 | 显示全部楼层
MARK ,学习了。

出0入0汤圆

发表于 2015-1-21 10:47:22 | 显示全部楼层
特别想知道 楼主怎么发现这个网站的

出0入0汤圆

 楼主| 发表于 2015-1-21 10:59:51 | 显示全部楼层
richards 发表于 2015-1-21 10:47
特别想知道 楼主怎么发现这个网站的

这个很久了,不太记得了,刚试了下在坛内搜“语音识别”,找到了下面这个帖:
http://www.amobbs.com/forum.php? ... 3%E8%AF%86%E5%88%AB

出0入0汤圆

发表于 2015-1-21 12:55:21 | 显示全部楼层
这个可以学习一下

出0入0汤圆

发表于 2015-1-22 00:02:56 | 显示全部楼层
好帖必须顶!最近稍微没那么忙,打算在智能家居方面研究点东东,感谢LZ!

出0入0汤圆

发表于 2015-1-22 01:11:48 | 显示全部楼层
厉害,佩服佩服

出0入0汤圆

发表于 2015-1-22 11:57:27 | 显示全部楼层
不错 MAEK一下   

出0入0汤圆

发表于 2015-1-22 12:04:23 | 显示全部楼层
强力MARK

出0入0汤圆

发表于 2015-1-22 12:12:47 | 显示全部楼层
101楼说楼主很牛逼.

出0入0汤圆

发表于 2015-1-22 12:23:46 | 显示全部楼层
一直想弄呀。自己的数学功底不够。顶一下。

出0入0汤圆

发表于 2015-1-22 12:52:25 | 显示全部楼层
语音识别,好强大

出0入0汤圆

发表于 2015-12-16 17:58:03 | 显示全部楼层
谢谢楼主分享资料!!

出0入0汤圆

发表于 2015-12-16 19:17:34 | 显示全部楼层
顶,收藏!

出0入0汤圆

发表于 2015-12-16 21:56:25 | 显示全部楼层
语音、图像交互,人工智能,很好的发展方向

出0入0汤圆

发表于 2015-12-16 23:03:10 | 显示全部楼层
看着挺不错的

出0入0汤圆

发表于 2015-12-17 08:51:05 | 显示全部楼层
好资料。谢谢!

出0入0汤圆

发表于 2015-12-17 09:09:16 | 显示全部楼层
挺有意思的

出0入10汤圆

发表于 2015-12-17 09:11:46 | 显示全部楼层
赞!!!!!!!!!!!!

出0入0汤圆

发表于 2015-12-17 09:26:23 | 显示全部楼层
厉害,语音识别
做个记号

出0入0汤圆

发表于 2015-12-17 10:21:39 | 显示全部楼层
Mark, 学习下

出0入0汤圆

发表于 2015-12-18 18:48:29 | 显示全部楼层
楼主,这个程序是用什么编写?

出0入0汤圆

 楼主| 发表于 2015-12-18 19:33:46 | 显示全部楼层
gaojing326 发表于 2015-12-18 18:48
楼主,这个程序是用什么编写?

C语言              
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-4-25 22:45

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表