amazing030 发表于 2011-5-16 10:01:55

GB2312汉字语音系统!

  之前手里有一个汉字的语音库,将其数据“破_解”后用业余时间做了一款GB2312的汉字语音系统,试了下,效果还不错。用8M 的Flash时还额外加了一首歌,听起来效果也不错。
  单声道,使用C8051F330作主控,使用4M的Flash(也可以使用2M的,使用ADPCM编码,但效果不是很好),成本不高,这样就可以做成银行等地的播报系统。
后来我还加入了多音字功能,因ROM空间不足而只加入了常用一级汉字的多音处理。
  系统中除了汉字发音外,还有多个常用的乐音,如机场和车站常用的那几个提示音,还有数字,字母及其它特殊符号的发音,基本上是做全了。

  1.数字及字母符号发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640078OY2AD0.JPG
(原文件名:1.JPG)

  2.符号发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640080FC7A8W.JPG
(原文件名:2.JPG)
 
  3.常用罗马符号发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640082Q5YPQL.JPG
(原文件名:3.JPG)

    4.生僻符号发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640083Z901U4.JPG
(原文件名:4.JPG)

    5.音乐发音
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640084JGMGAB.JPG
(原文件名:5.JPG)

  6.多音字
http://cache.amobbs.com/bbs_upload782111/files_39/ourdev_640085U9XKQR.JPG
(原文件名:6.JPG)
 
 语音库目前还有一些错误要修改加上其它一些方面的东西,暂不上传,先送上程序以供大家学习

点击此处下载 ourdev_640086BN1DLZ.rar(文件大小:140K) (原文件名:C8051 语音编码.rar)

amazing030 发表于 2011-5-16 10:04:52

大家也顶顶....说实话,做这些表真头疼....

cyxavr 发表于 2011-5-16 10:38:38

我来顶楼主

wenhuaxiao 发表于 2011-5-16 10:45:27

我来顶

if_else 发表于 2011-5-16 10:58:30

我在二年前就做出了这个东西,16K8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5M,若使用8M则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。

tedden 发表于 2011-5-16 11:02:02

这个没玩过,有点意思,狂顶楼主

amazing030 发表于 2011-5-16 11:02:57

回复【4楼】if_else
我在二年前就做出了这个东西,16k8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5m,若使用8m则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。
-----------------------------------------------------------------------

这位兄弟能否共享些资料学习下呢?

Bati-Gol 发表于 2011-5-16 11:12:44

这个有意思~

语音识别的话
估计的100MHz以上的单片机才可以计算的过来吧

spely 发表于 2011-5-16 11:28:29

好东东,顶~

littlepig 发表于 2011-5-16 11:31:04

good

littlepig 发表于 2011-5-16 11:34:02

楼主有没有原理图和相关资料,共享一下

lindabell 发表于 2011-5-16 11:49:32

回复【4楼】if_else
我在二年前就做出了这个东西,16k8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5m,若使用8m则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。
-----------------------------------------------------------------------
if_else 太牛啦,本人弄VOIP都弄得昏天地转./emotion/em004.gif

voval 发表于 2011-5-16 11:50:54

回复【6楼】amazing030
-----------------------------------------------------------------------

同求共享资料哈

skynet 发表于 2011-5-16 11:53:48

回复【4楼】if_else
我在二年前就做出了这个东西,16k8位发音,声音采用二级压缩处理,包括了二级汉字,带完整的多音字处理,带中英文混读,并且带有自然音处理,发音很自然,大约5m,若使用8m则可以带800英文单词。这系统使用51单片机完成。现在我准备考虑加入简单的语音识别。
-----------------------------------------------------------------------

童鞋,能不能分享1下

danceman_uk 发表于 2011-5-16 11:54:17

牛.!!!

eiglxl 发表于 2011-5-16 12:13:50

好东西。

tomtone 发表于 2011-5-16 12:31:33

mark

wenxusun 发表于 2011-5-16 12:34:05

不错!

eworker 发表于 2011-5-16 12:35:34

都是牛人

HYLG 发表于 2011-5-16 12:40:02

非常好的东西。单片机也多媒体了。

823032003 发表于 2011-5-16 12:58:07

niuren谢谢分享

if_else 发表于 2011-5-16 17:08:42

回复【6楼】amazing030
-----------------------------------------------------------------------
语音库是可以自己做的,也可以用科大迅飞的,获取很容易的。文字转语音的难点在于自然音处理,不然发出来太生硬,在嵌入式条件下,做起来比较难。我是先用VB按8位单片机的格式编程来仿真,做好了后再移植到单片机中。用批处理格式做的一键编译。就是把语音和相关文档准备好,一键就可以编译得到结果。

zbjzxc 发表于 2011-5-16 17:19:26

记号~~

jrcsh 发表于 2011-5-16 17:23:29

Go

amazing030 发表于 2011-5-16 17:35:01

回复【22楼】if_else
回复【6楼】amazing030
-----------------------------------------------------------------------
语音库是可以自己做的,也可以用科大迅飞的,获取很容易的。文字转语音的难点在于自然音处理,不然发出来太生硬,在嵌入式条件下,做起来比较难。我是先用vb按8位单片机的格式编程来仿真,做好了后再移植到单片机中。用批处理格式做的一键编译。就是把语音和相关文档准备好,一键就可以编译得到结果。

-----------------------------------------------------------------------

我是直接用DA播放WAV格式的音频,声音不生硬,我还特意存了一首歌曲试了下,效果也非常好

ddcchh 发表于 2011-5-16 19:06:19

达人!

muzheyun 发表于 2011-5-16 19:20:48

mark

heroling 发表于 2011-5-16 19:41:48

牛人啊

vipcff 发表于 2011-5-16 20:40:12

我来标记这个潜力贴

jlhgold 发表于 2011-5-16 21:36:19

mark一下

ldz2000 发表于 2011-5-16 21:37:35

很难想象,这种效果会好到哪去。

longriver05 发表于 2011-5-16 22:18:51

语音库方便上传吗

amazing030 发表于 2011-5-16 23:24:42

想找一位上位机写的好的朋友帮写个简单的上位机程序,把原始语音库提取出来,我现在使用的不压缩的语音库没处理好,导致有部分发音发生偏差

starsun 发表于 2011-5-17 00:15:12

都是牛人,顶一个

xiaorui 发表于 2011-5-17 01:36:25

牛,这个表真的很麻烦滴~~

john78 发表于 2011-5-17 08:11:19

MARK 语音库

majianjia 发表于 2011-5-17 08:25:59

回复【25楼】amazing030
-----------------------------------------------------------------------

他的意思不是这个,if_else说的是语调的处理,最简单的的例子:问句的最后一个或几个字语调需要提高,这样才不会听起来太"机器化"

amazing030 发表于 2011-5-17 08:30:42

回复【37楼】majianjia 阿嘉^_^
回复【25楼】amazing030   
-----------------------------------------------------------------------
他的意思不是这个,if_else说的是语调的处理,最简单的的例子:问句的最后一个或几个字语调需要提高,这样才不会听起来太"机器化"
-----------------------------------------------------------------------

....这个还真不知道如何处理,能否提点下?我这个肯定是开源的

yl604922959 发表于 2011-5-17 08:34:51

mark的说

wenjin0386 发表于 2011-5-17 11:46:23

mark

liren0 发表于 2011-5-17 12:02:08

留个记号

ackmi 发表于 2011-5-19 08:30:20

好东西那出来分享,共同进步!

abc378 发表于 2011-5-28 21:27:17

这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!

qdsywh 发表于 2011-5-29 19:36:24

mark

amazing030 发表于 2011-5-30 09:09:18

回复【43楼】abc378
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!
-----------------------------------------------------------------------

http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4677639&bbs_page_no=1&search_mode=3&search_text=amazing030&bbs_id=9999

你可以看下我这个贴子,你参考的那个楼主程序写的有点乱,我也只看了一部分,主要是用他的上位机。
做一个东西不能全照搬吧,你做GPS重要的也就是GPS数据解析、显示和存储,可以看看我的那个程序,都有体现,结构也很明了

amity 发表于 2011-5-30 09:14:55

期待楼主的完善程序

plc_avr 发表于 2011-5-30 10:36:53

mark!

abc378 发表于 2011-5-31 22:50:15

回复【45楼】amazing030
回复【43楼】abc378
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!
-----------------------------------------------------------------------
http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4677639&bbs_page_no=1&search_mode=3&search_text=amazing030&bbs_id=9999
你可以看下我这个贴子,你参考的那个楼主程序写的有点乱,我也只看了一部分,主要是用他的上位......
-----------------------------------------------------------------------

多谢amazing030老师!我去买c8051f330试验。

abc378 发表于 2011-5-31 22:50:30

回复【45楼】amazing030
回复【43楼】abc378
这个系统不错!amazing030老师:有时间麻烦您到这个帖子http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4769864&bbs_id=1006帮忙指导一下迷津,我想做这个东东,实在搞不懂,先谢了!
-----------------------------------------------------------------------
http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=4677639&bbs_page_no=1&search_mode=3&search_text=amazing030&bbs_id=9999
你可以看下我这个贴子,你参考的那个楼主程序写的有点乱,我也只看了一部分,主要是用他的上位......
-----------------------------------------------------------------------

多谢amazing030老师!我去买c8051f330试验。

niba 发表于 2011-6-9 21:13:01

语音库怎么提取哦,,哪位大虾提取出来了?

a305566 发表于 2011-6-11 16:09:19

怎么就没看见那位很牛的人分享点东西呢?

niba 发表于 2011-6-12 19:48:49

谁有语音库哦?本人不会上位机提取

hy317 发表于 2011-6-12 20:03:31

思路不错

416446891 发表于 2011-6-12 20:07:09

MARK

kenny17 发表于 2011-6-12 20:08:55

这个赶紧留脚丫,慢慢研究

niba 发表于 2011-6-12 20:35:08

这方法很实用。。。再顶

luck851 发表于 2011-6-12 22:25:49

mark

pcwhy 发表于 2011-6-12 22:31:42

谢谢了,这个要支持。。。

fy024 发表于 2011-6-12 22:43:13

不敢想象效果!

Forever 发表于 2011-6-12 22:49:12

MARK!

MCU678 发表于 2011-6-13 00:20:19

mark

niba 发表于 2011-6-23 11:07:08

楼主进展怎样了?

amazing030 发表于 2011-6-23 13:44:54

做好了啊,自己硬着头皮写的上位机,没想只花了一天也写好了,看来上位机也差不多,C语言的东西......

烧写文件:

点击此处下载 ourdev_651417F1S6KH.rar(文件大小:2.76M) (原文件名:烧写文件.rar)

里面有两个文件,一个为语音库,一个为汉字编码索引,一看程序就知道了。

再找个广州天河及佛山的公司把我收了吧.....不然就上网投简历去./emotion/em019.gif

amazing030 发表于 2011-6-23 13:46:14

我还是再整理一个帖子好了,上位机,原理图什么的

niba 发表于 2011-7-4 15:19:39

这还涉及到上位机吗?语音库楼主是怎么破_解的呀?能否用讯飞的软件生成语音库呢?

qq635274216 发表于 2011-7-4 21:51:11

重来没做过这方面的东西,学习学习

wjhltk 发表于 2011-8-9 18:21:56

mark

rogershek 发表于 2011-8-12 23:40:18

有意思

niba 发表于 2011-8-18 23:36:57

我试验了下。。。语音是一个字一个字的读出来的,不流畅,要求不高的话还可以。银行那<<请1023号到3号窗口>>类似的提示音,不知道是怎么做的?应该是录音做出来的吧。

kingboy100 发表于 2011-8-19 08:09:36

mark

chenyuqiu 发表于 2012-3-10 11:37:27

mark

lanyuye 发表于 2012-3-10 11:45:14

回复【63楼】amazing030
-----------------------------------------------------------------------
这文件拿过来就可以做个简单的语言播报了吗?

ycwjl728 发表于 2012-3-10 12:35:07

Mark!

xue_pic 发表于 2012-3-10 13:05:02

有意思

at90s 发表于 2012-3-10 13:11:21

mark!

amazing030 发表于 2012-3-10 13:15:36

回复【72楼】lanyuye
回复【63楼】amazing030
-----------------------------------------------------------------------
这文件拿过来就可以做个简单的语言播报了吗?
-----------------------------------------------------------------------

可以,而且是GB2312带全的,只是没有那种语调效果,生硬一点,但多数场合也足够了

amazing030 发表于 2012-3-10 13:25:07

新版的带自定义语音段下载功能,能下载自定义的WAV语音段
http://cache.amobbs.com/bbs_upload782111/files_53/ourdev_725485Z1AF2S.JPG
(原文件名:wavtool.JPG)

kation122 发表于 2012-3-10 13:26:12

拜读&受教了,原来还有语音库这个东西的,我只用过GB2312 的汉字库,
这样做成本很低呀。8M   SPI flash 1元多。C8051 5元左右。准备试试。
谢谢你的无私奉献。

jiaohaitao 发表于 2012-3-10 16:50:22

mark

first_blood 发表于 2012-3-10 18:30:24

回复【78楼】kation122远传
拜读&amp;受教了,原来还有语音库这个东西的,我只用过gb2312 的汉字库,
这样做成本很低呀。8m   spi flash 1元多。c8051 5元左右。准备试试。
谢谢你的无私奉献。
-----------------------------------------------------------------------

请问哪里有8M spiflash 1元多,什么型号

dearterry30 发表于 2012-3-10 19:26:36

mark

leijiayou 发表于 2012-3-10 19:37:27

mark    长见识了。。

SNOOKER 发表于 2012-3-10 20:38:38

mark

chenwei1919 发表于 2012-3-10 22:09:24

mark

FpvCamera 发表于 2012-3-11 00:12:49

这个语音播放,难点就是怎么做到流畅。如果一个汉字一个汉字简单的拼接起来,会有点生硬

jetimchen 发表于 2012-3-11 10:41:40

语音 MARK

kation122 发表于 2012-3-11 13:17:43

回复【80楼】first_blood
-----------------------------------------------------------------------

回复【80楼】first_blood
回复【78楼】kation122远传
拜读&amp;受教了,原来还有语音库这个东西的,我只用过gb2312 的汉字库,
这样做成本很低呀。8m   spi flash 1元多。c8051 5元左右。准备试试。
谢谢你的无私奉献。
-----------------------------------------------------------------------
请问哪里有8m spiflash 1元多,什么型号
-----------------------------------------------------------------------
有的,正在大批量使用,8M SPI 8PIN ,一元出头,要烧录加0.06,当然这里的8M 是8M bit,

避免广告之嫌疑,你联络我,我可以将供应商给你。

wszyjsw2 发表于 2012-3-11 19:31:55

好东西 MARK一下

yulyfly 发表于 2012-10-22 12:34:06

如何提取语音库,不用上位机,能直接提取,保存成wav吗?

hamipeter 发表于 2012-10-22 19:34:32

不知音效如何?

hamipeter 发表于 2012-10-22 19:34:52

不知音效如何?

夏日么么茶 发表于 2012-10-24 00:02:21

不错不错噢

xiaojun2019 发表于 2012-10-24 08:52:26

mark学习学习

Hz01800475 发表于 2012-10-24 08:59:36

还是不错的东东

elecfun 发表于 2012-10-24 09:00:40

不错好资料啊

yulyfly 发表于 2013-1-5 15:51:07

楼主好人,帮忙把语音文件分解出来?

xslff 发表于 2013-1-5 20:37:06

先Mark再说。

ndk 发表于 2013-1-5 21:03:44

mark了,有时间试试

zhzj2007 发表于 2013-4-6 11:35:22

学习...................................................

fiddly 发表于 2013-4-11 22:21:08

楼主牛人啊,最近在搞语音呢,简单的发音,iso4004之类的8K采样率,不确定实际效果,要自然,清晰,浑厚,洪亮!
页: [1] 2
查看完整版本: GB2312汉字语音系统!