有没有人用DTW算法去做语音识别的？能交流一下吗？

20114016039 · 发表于 2012-4-22 20:46:40

小弟现在正在用tiny6410去做一个语音识别，用的是孤立词汇识别的方法去做的，用DTW算法，用它的一个累积和最小的方法，

现在遇到的问题就是怎么将一个音频文件转换成一个二维的数组，然后再去计算它的欧氏距离！有没有人做过的呢，能交流一下吗？

dds · 发表于 2012-4-22 20:49:46

没有接触这方面，帮顶，随便学习下

20114016039 · 发表于 2012-4-22 20:51:24

dds 发表于 2012-4-22 20:49
没有接触这方面，帮顶，随便学习下

呵呵，谢谢哈！

其实这个网站很好的，之前我一直在找，没想到已经搬了！

dds · 发表于 2012-4-22 21:00:16

对于音视频算法类的东东，一般使用matlab仿真，效果理想后生产c？？？
不知道是不是这么个过程？？

20114016039 · 发表于 2012-4-22 22:03:19

dds 发表于 2012-4-22 21:00
对于音视频算法类的东东，一般使用matlab仿真，效果理想后生产c？？？
不知道是不是这么个过程？？ ...

这个呀，我是用ARM的，直接去打开声卡设备就可以了，再用write或read就可以发声了，至于做mp3或者是wav格式的这个就还要再加一个头就可以了，仿真的话，是用matlab好，但是我还没有去实践，现在用DTW感觉都很ok就没有必要去动matlab了

albert_w · 发表于 2012-4-23 01:24:50

不懂，绝对是高科技。google黑板报有一些自然语言识别的概述。感觉全拆成词又不显示，逐字读取再加向前试探？

20114016039 · 发表于 2012-4-23 12:55:08

现在已经实现了用简单的文件，像。txt这样的较准了，现在就是想把音频文件写到.txt文件中去，再去较准，读取最吻合的那个文件，再去读它～～下午过实验室里去试试，不知成不成功～～

w_ying_qun · 发表于 2012-6-6 22:18:09

关注一下

lologame · 发表于 2014-3-5 18:03:49

DTW略显粗糙，算法原理简单，但是计算量太大，现在没啥实用价值了吧

dengxiaofeng · 发表于 2014-6-24 15:37:24

结果如何了哥们

随风允诺2015 · 发表于 2015-5-25 20:08:15

帮顶。最近也在学习语音识别与信息处理技术

皮尔斯 · 发表于 2019-5-9 11:18:16

要先经过MFCC提取语音段里的特征值，再去DTW，直接拿音频DTW不现实，计算量也大。

阿莫论坛20周年了！感谢大家的支持与爱护！！