搜索
bottom↓
回复: 11

有没有人用DTW算法去做语音识别的?能交流一下吗?

[复制链接]

出0入0汤圆

发表于 2012-4-22 20:46:40 | 显示全部楼层 |阅读模式
小弟现在正在用tiny6410去做一个语音识别,用的是孤立词汇识别的方法去做的,用DTW算法,用它的一个累积和最小的方法,

现在遇到的问题就是怎么将一个音频文件转换成一个二维的数组,然后再去计算它的欧氏距离!有没有人做过的呢,能交流一下吗?

出0入0汤圆

发表于 2012-4-22 20:49:46 | 显示全部楼层
没有接触这方面,帮顶,随便学习下

出0入0汤圆

 楼主| 发表于 2012-4-22 20:51:24 | 显示全部楼层
dds 发表于 2012-4-22 20:49
没有接触这方面,帮顶,随便学习下

呵呵,谢谢哈!

其实这个网站很好的,之前我一直在找,没想到已经搬了!

出0入0汤圆

发表于 2012-4-22 21:00:16 | 显示全部楼层
对于音视频算法类的东东,一般使用matlab仿真,效果理想后生产c???
不知道是不是这么个过程??

出0入0汤圆

 楼主| 发表于 2012-4-22 22:03:19 | 显示全部楼层
dds 发表于 2012-4-22 21:00
对于音视频算法类的东东,一般使用matlab仿真,效果理想后生产c???
不知道是不是这么个过程?? ...

这个呀,我是用ARM的,直接去打开声卡设备就可以了,再用write或read就可以发声了,至于做mp3或者是wav格式的这个就还要再加一个头就可以了,仿真的话,是用matlab好,但是我还没有去实践,现在用DTW感觉都很ok就没有必要去动matlab了

出0入42汤圆

发表于 2012-4-23 01:24:50 | 显示全部楼层
不懂,绝对是高科技。google黑板报有一些自然语言识别的概述。感觉全拆成词又不显示,逐字读取再加向前试探?

出0入0汤圆

 楼主| 发表于 2012-4-23 12:55:08 | 显示全部楼层
现在已经实现了用简单的文件,像。txt这样的较准了,现在就是想把音频文件写到.txt文件中去,再去较准,读取最吻合的那个文件,再去读它~~下午过实验室里去试试,不知成不成功~~

出0入0汤圆

发表于 2012-6-6 22:18:09 | 显示全部楼层
关注一下

出0入0汤圆

发表于 2014-3-5 18:03:49 | 显示全部楼层
DTW略显粗糙,算法原理简单,但是计算量太大,现在没啥实用价值了吧

出0入18汤圆

发表于 2014-6-24 15:37:24 | 显示全部楼层
结果如何 了 哥们

出0入0汤圆

发表于 2015-5-25 20:08:15 | 显示全部楼层
帮顶。最近也在学习语音识别与信息处理技术

出0入0汤圆

发表于 2019-5-9 11:18:16 | 显示全部楼层
要先经过MFCC提取语音段里的特征值,再去DTW,直接拿音频DTW不现实,计算量也大。
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-4-20 08:00

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表