GB2312汉字语音系统!
之前手里有一个汉字的语音库,将其数据“破_解”后用业余时间做了一款GB2312的汉字语音系统,试了下,效果还不错。用8M 的Flash时还额外加了一首歌,听起来效果也不错。单声道,使用C8051F330作主控,使用4M的Flash(也可以使用2M的,使用ADPCM编码,但效果不是很好),成本不高,这样就可以做成银行等地的播报系统。
后来我还加入了多音字功能,因ROM空间不足而只加入了常用一级汉字的多音处理。
系统中除了汉字发音外,还有多个常用的乐音,如机场和车站常用的那几个提示音,还有数字,字母及其它特殊符号的发音,基本上是做全了。
1.数字及字母符号发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640078OY2AD0.JPG
(原文件名:1.JPG)
2.符号发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640080FC7A8W.JPG
(原文件名:2.JPG)
3.常用罗马符号发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640082Q5YPQL.JPG
(原文件名:3.JPG)
4.生僻符号发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640083Z901U4.JPG
(原文件名:4.JPG)
5.音乐发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640084JGMGAB.JPG
(原文件名:5.JPG)
6.多音字
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640085U9XKQR.JPG
(原文件名:6.JPG)
语音库目前还有一些错误要修改加上其它一些方面的东西,暂不上传,先送上程序以供大家学习
点击此处下载 ourdev_640086BN1DLZ.rar(文件大小:140K) (原文件名:C8051 语音编码.rar) 大家也顶顶....说实话,做这些表真头疼.... 我来顶楼主 我来顶 我在二年前就做出了这个东西,16K8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5M,若使用8M则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。 这个没玩过,有点意思,狂顶楼主 回复【4楼】if_else
我在二年前就做出了这个东西,16k8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5m,若使用8m则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。
-----------------------------------------------------------------------
这位兄弟能否共享些资料学习下呢? 这个有意思~
语音识别的话
估计的100MHz以上的单片机才可以计算的过来吧 好东东,顶~ good 楼主有没有原理图和相关资料,共享一下 回复【4楼】if_else
我在二年前就做出了这个东西,16k8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5m,若使用8m则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。
-----------------------------------------------------------------------
if_else 太牛啦,本人弄VOIP都弄得昏天地转./emotion/em004.gif 回复【6楼】amazing030
-----------------------------------------------------------------------
同求共享资料哈 回复【4楼】if_else
我在二年前就做出了这个东西,16k8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5m,若使用8m则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。
-----------------------------------------------------------------------
童鞋,能不能分享1下 牛.!!! 好东西。 mark 不错! 都是牛人 非常好的东西。单片机也多媒体了。 niuren谢谢分享 回复【6楼】amazing030
-----------------------------------------------------------------------
语音库是可以自己做的,也可以用科大迅飞的,获取很容易的。文字转语音的难点在于自然音处理,不然发出来太生硬,在嵌入式条件下,做起来比较难。我是先用VB按8位单片机的格式编程来仿真,做好了后再移植到单片机中。用批处理格式做的一键编译。就是把语音和相关文档准备好,一键就可以编译得到结果。 记号~~ Go 回复【22楼】if_else
回复【6楼】amazing030
-----------------------------------------------------------------------
语音库是可以自己做的,也可以用科大迅飞的,获取很容易的。文字转语音的难点在于自然音处理,不然发出来太生硬,在嵌入式条件下,做起来比较难。我是先用vb按8位单片机的格式编程来仿真,做好了后再移植到单片机中。用批处理格式做的一键编译。就是把语音和相关文档准备好,一键就可以编译得到结果。
-----------------------------------------------------------------------
我是直接用DA播放WAV格式的音频,声音不生硬,我还特意存了一首歌曲试了下,效果也非常好 达人! mark 牛人啊 我来标记这个潜力贴 mark一下 很难想象,这种效果会好到哪去。 语音库方便上传吗 想找一位上位机写的好的朋友帮写个简单的上位机程序,把原始语音库提取出来,我现在使用的不压缩的语音库没处理好,导致有部分发音发生偏差 都是牛人,顶一个 牛,这个表真的很麻烦滴~~ MARK 语音库 回复【25楼】amazing030
-----------------------------------------------------------------------
他的意思不是这个,if_else说的是语调的处理,最简单的的例子:问句的最后一个或几个字语调需要提高,这样才不会听起来太"机器化" 回复【37楼】majianjia 阿嘉^_^
回复【25楼】amazing030
-----------------------------------------------------------------------
他的意思不是这个,if_else说的是语调的处理,最简单的的例子:问句的最后一个或几个字语调需要提高,这样才不会听起来太"机器化"
-----------------------------------------------------------------------
....这个还真不知道如何处理,能否提点下?我这个肯定是开源的 mark的说 mark 留个记号 好东西那出来分享,共同进步! 这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了! mark 回复【43楼】abc378
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!
-----------------------------------------------------------------------
http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4677639&bbs_page_no=1&search_mode=3&search_text=amazing030&bbs_id=9999
你可以看下我这个贴子,你参考的那个楼主程序写的有点乱,我也只看了一部分,主要是用他的上位机。
做一个东西不能全照搬吧,你做GPS重要的也就是GPS数据解析、显示和存储,可以看看我的那个程序,都有体现,结构也很明了 期待楼主的完善程序 mark! 回复【45楼】amazing030
回复【43楼】abc378
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!
-----------------------------------------------------------------------
http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4677639&bbs_page_no=1&search_mode=3&search_text=amazing030&bbs_id=9999
你可以看下我这个贴子,你参考的那个楼主程序写的有点乱,我也只看了一部分,主要是用他的上位......
-----------------------------------------------------------------------
多谢amazing030老师!我去买c8051f330试验。 回复【45楼】amazing030
回复【43楼】abc378
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!
-----------------------------------------------------------------------
http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4677639&bbs_page_no=1&search_mode=3&search_text=amazing030&bbs_id=9999
你可以看下我这个贴子,你参考的那个楼主程序写的有点乱,我也只看了一部分,主要是用他的上位......
-----------------------------------------------------------------------
多谢amazing030老师!我去买c8051f330试验。 语音库怎么提取哦,,哪位大虾提取出来了? 怎么就没看见那位很牛的人分享点东西呢? 谁有语音库哦?本人不会上位机提取 思路不错 MARK 这个赶紧留脚丫,慢慢研究 这方法很实用。。。再顶 mark 谢谢了,这个要支持。。。 不敢想象效果! MARK! mark 楼主进展怎样了? 做好了啊,自己硬着头皮写的上位机,没想只花了一天也写好了,看来上位机也差不多,C语言的东西......
烧写文件:
点击此处下载 ourdev_651417F1S6KH.rar(文件大小:2.76M) (原文件名:烧写文件.rar)
里面有两个文件,一个为语音库,一个为汉字编码索引,一看程序就知道了。
再找个广州天河及佛山的公司把我收了吧.....不然就上网投简历去./emotion/em019.gif 我还是再整理一个帖子好了,上位机,原理图什么的 这还涉及到上位机吗?语音库楼主是怎么破_解的呀?能否用讯飞的软件生成语音库呢? 重来没做过这方面的东西,学习学习 mark 有意思 我试验了下。。。语音是一个字一个字的读出来的,不流畅,要求不高的话还可以。银行那<<请1023号到3号窗口>>类似的提示音,不知道是怎么做的?应该是录音做出来的吧。 mark mark 回复【63楼】amazing030
-----------------------------------------------------------------------
这文件拿过来就可以做个简单的语言播报了吗? Mark! 有意思 mark! 回复【72楼】lanyuye
回复【63楼】amazing030
-----------------------------------------------------------------------
这文件拿过来就可以做个简单的语言播报了吗?
-----------------------------------------------------------------------
可以,而且是GB2312带全的,只是没有那种语调效果,生硬一点,但多数场合也足够了 新版的带自定义语音段下载功能,能下载自定义的WAV语音段
http://cache.amobbs.com/bbs_upload782111/files_53/ourdev_725485Z1AF2S.JPG
(原文件名:wavtool.JPG) 拜读&受教了,原来还有语音库这个东西的,我只用过GB2312 的汉字库,
这样做成本很低呀。8M SPI flash 1元多。C8051 5元左右。准备试试。
谢谢你的无私奉献。 mark 回复【78楼】kation122远传
拜读&受教了,原来还有语音库这个东西的,我只用过gb2312 的汉字库,
这样做成本很低呀。8m spi flash 1元多。c8051 5元左右。准备试试。
谢谢你的无私奉献。
-----------------------------------------------------------------------
请问哪里有8M spiflash 1元多,什么型号 mark mark 长见识了。。 mark mark 这个语音播放,难点就是怎么做到流畅。如果一个汉字一个汉字简单的拼接起来,会有点生硬 语音 MARK 回复【80楼】first_blood
-----------------------------------------------------------------------
回复【80楼】first_blood
回复【78楼】kation122远传
拜读&受教了,原来还有语音库这个东西的,我只用过gb2312 的汉字库,
这样做成本很低呀。8m spi flash 1元多。c8051 5元左右。准备试试。
谢谢你的无私奉献。
-----------------------------------------------------------------------
请问哪里有8m spiflash 1元多,什么型号
-----------------------------------------------------------------------
有的,正在大批量使用,8M SPI 8PIN ,一元出头,要烧录加0.06,当然这里的8M 是8M bit,
避免广告之嫌疑,你联络我,我可以将供应商给你。 好东西 MARK一下 如何提取语音库,不用上位机,能直接提取,保存成wav吗? 不知音效如何? 不知音效如何? 不错不错噢 mark学习学习 还是不错的东东 不错好资料啊 楼主好人,帮忙把语音文件分解出来? 先Mark再说。 mark了,有时间试试 学习................................................... 楼主牛人啊,最近在搞语音呢,简单的发音,iso4004之类的8K采样率,不确定实际效果,要自然,清晰,浑厚,洪亮!
页:
[1]
2