搜索
bottom↓
回复: 169

GB2312汉字语音系统!

  [复制链接]

出20入0汤圆

发表于 2011-5-16 10:01:55 | 显示全部楼层 |阅读模式
  之前手里有一个汉字的语音库,将其数据“破_解”后用业余时间做了一款GB2312的汉字语音系统,试了下,效果还不错。用8M 的Flash时还额外加了一首歌,听起来效果也不错。
  单声道,使用C8051F330作主控,使用4M的Flash(也可以使用2M的,使用ADPCM编码,但效果不是很好),成本不高,这样就可以做成银行等地的播报系统。
后来我还加入了多音字功能,因ROM空间不足而只加入了常用一级汉字的多音处理。
  系统中除了汉字发音外,还有多个常用的乐音,如机场和车站常用的那几个提示音,还有数字,字母及其它特殊符号的发音,基本上是做全了。

  1.数字及字母符号发音

(原文件名:1.JPG)

  2.符号发音

(原文件名:2.JPG)
 
  3.常用罗马符号发音

(原文件名:3.JPG)

    4.生僻符号发音

(原文件名:4.JPG)

    5.音乐发音

(原文件名:5.JPG)

  6.多音字

(原文件名:6.JPG)
 
 语音库目前还有一些错误要修改加上其它一些方面的东西,暂不上传,先送上程序以供大家学习

点击此处下载 ourdev_640086BN1DLZ.rar(文件大小:140K) (原文件名:C8051 语音编码.rar)

阿莫论坛20周年了!感谢大家的支持与爱护!!

有一句段子是这样说的,身家过亿的只关心自己的身体,身家千万的,在担心传承,勉强糊口度日才天天看国际新闻,关心国家大事。

出20入0汤圆

 楼主| 发表于 2011-5-16 10:04:52 | 显示全部楼层
大家也顶顶....说实话,做这些表真头疼....

出0入0汤圆

发表于 2011-5-16 10:38:38 | 显示全部楼层
我来顶楼主

出0入0汤圆

发表于 2011-5-16 10:45:27 | 显示全部楼层
我来顶

出0入0汤圆

发表于 2011-5-16 10:58:30 | 显示全部楼层
我在二年前就做出了这个东西,16K8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5M,若使用8M则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。

出0入0汤圆

发表于 2011-5-16 11:02:02 | 显示全部楼层
这个没玩过,有点意思,狂顶楼主

出20入0汤圆

 楼主| 发表于 2011-5-16 11:02:57 | 显示全部楼层
回复【4楼】if_else
我在二年前就做出了这个东西,16k8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5m,若使用8m则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。
-----------------------------------------------------------------------

这位兄弟能否共享些资料学习下呢?

出0入0汤圆

发表于 2011-5-16 11:12:44 | 显示全部楼层
这个有意思~

语音识别的话
估计的100MHz以上的单片机才可以计算的过来吧

出0入0汤圆

发表于 2011-5-16 11:28:29 | 显示全部楼层
好东东,顶~

出0入0汤圆

发表于 2011-5-16 11:31:04 | 显示全部楼层
good

出0入0汤圆

发表于 2011-5-16 11:34:02 | 显示全部楼层
楼主有没有原理图和相关资料,共享一下

出0入8汤圆

发表于 2011-5-16 11:49:32 | 显示全部楼层
回复【4楼】if_else  
我在二年前就做出了这个东西,16k8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5m,若使用8m则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。
-----------------------------------------------------------------------
if_else 太牛啦,本人弄VOIP都弄得昏天地转

出0入0汤圆

发表于 2011-5-16 11:50:54 | 显示全部楼层
回复【6楼】amazing030
-----------------------------------------------------------------------

同求共享资料哈

出0入12汤圆

发表于 2011-5-16 11:53:48 | 显示全部楼层
回复【4楼】if_else
我在二年前就做出了这个东西,16k8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5m,若使用8m则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。
-----------------------------------------------------------------------

童鞋,能不能分享1下

出0入0汤圆

发表于 2011-5-16 11:54:17 | 显示全部楼层
牛.!!!

出0入168汤圆

发表于 2011-5-16 12:13:50 | 显示全部楼层
好东西。

出0入0汤圆

发表于 2011-5-16 12:31:33 | 显示全部楼层
mark

出0入0汤圆

发表于 2011-5-16 12:34:05 | 显示全部楼层
不错!

出0入0汤圆

发表于 2011-5-16 12:35:34 | 显示全部楼层
都是牛人

出0入0汤圆

发表于 2011-5-16 12:40:02 | 显示全部楼层
非常好的东西。单片机也多媒体了。

出0入0汤圆

发表于 2011-5-16 12:58:07 | 显示全部楼层
niuren谢谢分享

出0入0汤圆

发表于 2011-5-16 17:08:42 | 显示全部楼层
回复【6楼】amazing030
-----------------------------------------------------------------------
语音库是可以自己做的,也可以用科大迅飞的,获取很容易的。文字转语音的难点在于自然音处理,不然发出来太生硬,在嵌入式条件下,做起来比较难。我是先用VB按8位单片机的格式编程来仿真,做好了后再移植到单片机中。用批处理格式做的一键编译。就是把语音和相关文档准备好,一键就可以编译得到结果。

出0入0汤圆

发表于 2011-5-16 17:19:26 | 显示全部楼层
记号~~

出0入0汤圆

发表于 2011-5-16 17:23:29 | 显示全部楼层
Go

出20入0汤圆

 楼主| 发表于 2011-5-16 17:35:01 | 显示全部楼层
回复【22楼】if_else
回复【6楼】amazing030  
-----------------------------------------------------------------------
语音库是可以自己做的,也可以用科大迅飞的,获取很容易的。文字转语音的难点在于自然音处理,不然发出来太生硬,在嵌入式条件下,做起来比较难。我是先用vb按8位单片机的格式编程来仿真,做好了后再移植到单片机中。用批处理格式做的一键编译。就是把语音和相关文档准备好,一键就可以编译得到结果。

-----------------------------------------------------------------------

我是直接用DA播放WAV格式的音频,声音不生硬,我还特意存了一首歌曲试了下,效果也非常好

出0入0汤圆

发表于 2011-5-16 19:06:19 | 显示全部楼层
达人!

出0入0汤圆

发表于 2011-5-16 19:20:48 | 显示全部楼层
mark

出0入0汤圆

发表于 2011-5-16 19:41:48 | 显示全部楼层
牛人啊

出0入0汤圆

发表于 2011-5-16 20:40:12 | 显示全部楼层
我来标记这个潜力贴

出0入0汤圆

发表于 2011-5-16 21:36:19 | 显示全部楼层
mark一下

出0入0汤圆

发表于 2011-5-16 21:37:35 | 显示全部楼层
很难想象,这种效果会好到哪去。

出0入0汤圆

发表于 2011-5-16 22:18:51 | 显示全部楼层
语音库方便上传吗

出20入0汤圆

 楼主| 发表于 2011-5-16 23:24:42 | 显示全部楼层
想找一位上位机写的好的朋友帮写个简单的上位机程序,把原始语音库提取出来,我现在使用的不压缩的语音库没处理好,导致有部分发音发生偏差

出0入0汤圆

发表于 2011-5-17 00:15:12 | 显示全部楼层
都是牛人,顶一个

出0入0汤圆

发表于 2011-5-17 01:36:25 | 显示全部楼层
牛,这个表真的很麻烦滴~~

出90入4汤圆

发表于 2011-5-17 08:11:19 | 显示全部楼层
MARK 语音库

出0入0汤圆

发表于 2011-5-17 08:25:59 | 显示全部楼层
回复【25楼】amazing030  
-----------------------------------------------------------------------

他的意思不是这个,if_else说的是语调的处理,最简单的的例子:问句的最后一个或几个字语调需要提高,这样才不会听起来太"机器化"

出20入0汤圆

 楼主| 发表于 2011-5-17 08:30:42 | 显示全部楼层
回复【37楼】majianjia 阿嘉^_^
回复【25楼】amazing030   
-----------------------------------------------------------------------
他的意思不是这个,if_else说的是语调的处理,最简单的的例子:问句的最后一个或几个字语调需要提高,这样才不会听起来太"机器化"
-----------------------------------------------------------------------

....这个还真不知道如何处理,能否提点下?我这个肯定是开源的

出0入0汤圆

发表于 2011-5-17 08:34:51 | 显示全部楼层
mark的说

出0入0汤圆

发表于 2011-5-17 11:46:23 | 显示全部楼层
mark

出0入0汤圆

发表于 2011-5-17 12:02:08 | 显示全部楼层
留个记号

出0入0汤圆

发表于 2011-5-19 08:30:20 | 显示全部楼层
好东西那出来分享,共同进步!

出0入0汤圆

发表于 2011-5-28 21:27:17 | 显示全部楼层
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!

出0入0汤圆

发表于 2011-5-29 19:36:24 | 显示全部楼层
mark

出20入0汤圆

 楼主| 发表于 2011-5-30 09:09:18 | 显示全部楼层
回复【43楼】abc378
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!
-----------------------------------------------------------------------

http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4677639&bbs_page_no=1&search_mode=3&search_text=amazing030&bbs_id=9999

你可以看下我这个贴子,你参考的那个楼主程序写的有点乱,我也只看了一部分,主要是用他的上位机。
做一个东西不能全照搬吧,你做GPS重要的也就是GPS数据解析、显示和存储,可以看看我的那个程序,都有体现,结构也很明了

出0入0汤圆

发表于 2011-5-30 09:14:55 | 显示全部楼层
期待楼主的完善程序

出0入0汤圆

发表于 2011-5-30 10:36:53 | 显示全部楼层
mark!

出0入0汤圆

发表于 2011-5-31 22:50:15 | 显示全部楼层
回复【45楼】amazing030
回复【43楼】abc378  
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!
-----------------------------------------------------------------------
http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4677639&bbs_page_no=1&search_mode=3&search_text=amazing030&bbs_id=9999
你可以看下我这个贴子,你参考的那个楼主程序写的有点乱,我也只看了一部分,主要是用他的上位......
-----------------------------------------------------------------------

多谢amazing030老师!我去买c8051f330试验。

出0入0汤圆

发表于 2011-5-31 22:50:30 | 显示全部楼层
回复【45楼】amazing030
回复【43楼】abc378  
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!
-----------------------------------------------------------------------
http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4677639&bbs_page_no=1&search_mode=3&search_text=amazing030&bbs_id=9999
你可以看下我这个贴子,你参考的那个楼主程序写的有点乱,我也只看了一部分,主要是用他的上位......
-----------------------------------------------------------------------

多谢amazing030老师!我去买c8051f330试验。

出0入0汤圆

发表于 2011-6-9 21:13:01 | 显示全部楼层
语音库怎么提取哦,,哪位大虾提取出来了?

出0入0汤圆

发表于 2011-6-11 16:09:19 | 显示全部楼层
怎么就没看见那位很牛的人分享点东西呢?

出0入0汤圆

发表于 2011-6-12 19:48:49 | 显示全部楼层
谁有语音库哦?本人不会上位机提取

出0入0汤圆

发表于 2011-6-12 20:03:31 | 显示全部楼层
思路不错

出0入0汤圆

发表于 2011-6-12 20:07:09 | 显示全部楼层
MARK

出0入0汤圆

发表于 2011-6-12 20:08:55 | 显示全部楼层
这个赶紧留脚丫,慢慢研究

出0入0汤圆

发表于 2011-6-12 20:35:08 | 显示全部楼层
这方法很实用。。。再顶

出0入0汤圆

发表于 2011-6-12 22:25:49 | 显示全部楼层
mark

出15入9汤圆

发表于 2011-6-12 22:31:42 | 显示全部楼层
谢谢了,这个要支持。。。

出0入0汤圆

发表于 2011-6-12 22:43:13 | 显示全部楼层
不敢想象效果!

出0入0汤圆

发表于 2011-6-12 22:49:12 | 显示全部楼层
MARK!

出0入0汤圆

发表于 2011-6-13 00:20:19 | 显示全部楼层
mark

出0入0汤圆

发表于 2011-6-23 11:07:08 | 显示全部楼层
楼主进展怎样了?

出20入0汤圆

 楼主| 发表于 2011-6-23 13:44:54 | 显示全部楼层
做好了啊,自己硬着头皮写的上位机,没想只花了一天也写好了,看来上位机也差不多,C语言的东西......

烧写文件:

点击此处下载 ourdev_651417F1S6KH.rar(文件大小:2.76M) (原文件名:烧写文件.rar)

里面有两个文件,一个为语音库,一个为汉字编码索引,一看程序就知道了。

再找个广州天河及佛山的公司把我收了吧.....不然就上网投简历去

出20入0汤圆

 楼主| 发表于 2011-6-23 13:46:14 | 显示全部楼层
我还是再整理一个帖子好了,上位机,原理图什么的

出0入0汤圆

发表于 2011-7-4 15:19:39 | 显示全部楼层
这还涉及到上位机吗?语音库楼主是怎么破_解的呀?能否用讯飞的软件生成语音库呢?

出0入0汤圆

发表于 2011-7-4 21:51:11 | 显示全部楼层
重来没做过这方面的东西,学习学习

出0入0汤圆

发表于 2011-8-9 18:21:56 | 显示全部楼层
mark

出0入0汤圆

发表于 2011-8-12 23:40:18 | 显示全部楼层
有意思

出0入0汤圆

发表于 2011-8-18 23:36:57 | 显示全部楼层
我试验了下。。。语音是一个字一个字的读出来的,不流畅,要求不高的话还可以。银行那<<请1023号到3号窗口>>类似的提示音,不知道是怎么做的?应该是录音做出来的吧。

出0入0汤圆

发表于 2011-8-19 08:09:36 | 显示全部楼层
mark

出0入0汤圆

发表于 2012-3-10 11:37:27 | 显示全部楼层
mark

出0入0汤圆

发表于 2012-3-10 11:45:14 | 显示全部楼层
回复【63楼】amazing030
-----------------------------------------------------------------------
这文件拿过来就可以做个简单的语言播报了吗?

出0入24汤圆

发表于 2012-3-10 12:35:07 | 显示全部楼层
Mark!

出0入0汤圆

发表于 2012-3-10 13:05:02 | 显示全部楼层
有意思

出0入0汤圆

发表于 2012-3-10 13:11:21 | 显示全部楼层
mark!

出20入0汤圆

 楼主| 发表于 2012-3-10 13:15:36 | 显示全部楼层
回复【72楼】lanyuye
回复【63楼】amazing030  
-----------------------------------------------------------------------
这文件拿过来就可以做个简单的语言播报了吗?
-----------------------------------------------------------------------

可以,而且是GB2312带全的,只是没有那种语调效果,生硬一点,但多数场合也足够了

出20入0汤圆

 楼主| 发表于 2012-3-10 13:25:07 | 显示全部楼层
新版的带自定义语音段下载功能,能下载自定义的WAV语音段

(原文件名:wavtool.JPG)

出0入0汤圆

发表于 2012-3-10 13:26:12 | 显示全部楼层
拜读&受教了,原来还有语音库这个东西的,我只用过GB2312 的汉字库,
这样做成本很低呀。8M   SPI flash 1元多。C8051 5元左右。准备试试。
谢谢你的无私奉献。

出0入0汤圆

发表于 2012-3-10 16:50:22 | 显示全部楼层
mark

出0入0汤圆

发表于 2012-3-10 18:30:24 | 显示全部楼层
回复【78楼】kation122  远传
拜读&amp;受教了,原来还有语音库这个东西的,我只用过gb2312 的汉字库,
这样做成本很低呀。8m   spi flash 1元多。c8051 5元左右。准备试试。
谢谢你的无私奉献。
-----------------------------------------------------------------------

请问哪里有8M spiflash 1元多,什么型号

出0入0汤圆

发表于 2012-3-10 19:26:36 | 显示全部楼层
mark

出0入0汤圆

发表于 2012-3-10 19:37:27 | 显示全部楼层
mark    长见识了。。

出0入0汤圆

发表于 2012-3-10 20:38:38 | 显示全部楼层
mark

出0入4汤圆

发表于 2012-3-10 22:09:24 | 显示全部楼层
mark

出0入0汤圆

发表于 2012-3-11 00:12:49 | 显示全部楼层
这个语音播放,难点就是怎么做到流畅。如果一个汉字一个汉字简单的拼接起来,会有点生硬

出0入0汤圆

发表于 2012-3-11 10:41:40 | 显示全部楼层
语音 MARK

出0入0汤圆

发表于 2012-3-11 13:17:43 | 显示全部楼层
回复【80楼】first_blood
-----------------------------------------------------------------------

回复【80楼】first_blood
回复【78楼】kation122  远传
拜读&amp;受教了,原来还有语音库这个东西的,我只用过gb2312 的汉字库,
这样做成本很低呀。8m   spi flash 1元多。c8051 5元左右。准备试试。
谢谢你的无私奉献。
-----------------------------------------------------------------------
请问哪里有8m spiflash 1元多,什么型号
-----------------------------------------------------------------------
有的,正在大批量使用,8M SPI 8PIN ,一元出头,要烧录加0.06,当然这里的8M 是8M bit,

避免广告之嫌疑,你联络我,我可以将供应商给你。

出0入0汤圆

发表于 2012-3-11 19:31:55 | 显示全部楼层
好东西 MARK一下

出0入0汤圆

发表于 2012-10-22 12:34:06 | 显示全部楼层
如何提取语音库,不用上位机,能直接提取,保存成wav吗?

出0入0汤圆

发表于 2012-10-22 19:34:32 来自手机 | 显示全部楼层
不知音效如何?

出0入0汤圆

发表于 2012-10-22 19:34:52 来自手机 | 显示全部楼层
不知音效如何?

出0入0汤圆

发表于 2012-10-24 00:02:21 来自手机 | 显示全部楼层
不错不错噢

出0入0汤圆

发表于 2012-10-24 08:52:26 | 显示全部楼层
mark学习学习

出0入0汤圆

发表于 2012-10-24 08:59:36 | 显示全部楼层
还是不错的东东

出0入134汤圆

发表于 2012-10-24 09:00:40 | 显示全部楼层
不错  好资料啊

出0入0汤圆

发表于 2013-1-5 15:51:07 | 显示全部楼层
楼主好人,帮忙把语音文件分解出来?

出0入0汤圆

发表于 2013-1-5 20:37:06 | 显示全部楼层
先Mark再说。

出0入0汤圆

发表于 2013-1-5 21:03:44 | 显示全部楼层
mark了,有时间试试

出0入0汤圆

发表于 2013-4-6 11:35:22 | 显示全部楼层
学习...................................................

出0入0汤圆

发表于 2013-4-11 22:21:08 | 显示全部楼层
楼主牛人啊,最近在搞语音呢,简单的发音,iso4004之类的8K采样率,不确定实际效果,要自然,清晰,浑厚,洪亮!
回帖提示: 反政府言论将被立即封锁ID 在按“提交”前,请自问一下:我这样表达会给举报吗,会给自己惹麻烦吗? 另外:尽量不要使用Mark、顶等没有意义的回复。不得大量使用大字体和彩色字。【本论坛不允许直接上传手机拍摄图片,浪费大家下载带宽和论坛服务器空间,请压缩后(图片小于1兆)才上传。压缩方法可以在微信里面发给自己(不要勾选“原图),然后下载,就能得到压缩后的图片】。另外,手机版只能上传图片,要上传附件需要切换到电脑版(不需要使用电脑,手机上切换到电脑版就行,页面底部)。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|amobbs.com 阿莫电子技术论坛 ( 粤ICP备2022115958号, 版权所有:东莞阿莫电子贸易商行 创办于2004年 (公安交互式论坛备案:44190002001997 ) )

GMT+8, 2024-12-10 20:44

© Since 2004 www.amobbs.com, 原www.ourdev.cn, 原www.ouravr.com

快速回复 返回顶部 返回列表