jujiaqi 发表于 2010-9-4 11:54:48

关于UNICODE GBK标点转换的一些资料

对于中文标点、其它字符以及ASCII的处理
(1) ASCII(半角)
这个比较简单,对应的UNICODE和其值相同,只是补了一个0为高字节。比如对于空格,ASCII为0x20,对应的UNICODE 为0x0020。
(2)ASCII(全角)
其实ASCII全角(包含中文标点)UNICODE范围为0xff01 ~ 0xff5e,
ASCII全角已经属于中文的范畴,因此对应着GBK(0xa3a1 ~ 0xa3fe),计算方法如下:
ASCII(全角UNICODE) - ASCII(全角GBK) = 0x5b60
这是一些用到的文件和说明
点击此处下载 ourdev_580265VM7HB0.rar(文件大小:3.12M) (原文件名:GBK与UNICODE转换比较完整.rar)
http://cache.amobbs.com/bbs_upload782111/files_32/ourdev_580266OJKK19.jpg
(原文件名:文件截图.jpg)
里面参照的一些文件请看下面的这一贴
这里是一位高手做到汉字部分的转换,很厉害
http://www.ourdev.cn/bbs/bbs_content.jsp?bbs_sn=710358&bbs_page_no=1&bbs_id=1000

jujiaqi 发表于 2010-9-4 13:26:05

回复【楼主位】jujiaqi
-----------------------------------------------------------------------

自己顶一下

zhouwei0538 发表于 2011-1-11 16:33:14

给资料的都是好人!!!

cqsgcqsg 发表于 2011-3-4 19:03:35

学习

hpuchenhao 发表于 2011-7-22 13:20:03

mark。。。。

zjj841011 发表于 2011-12-23 09:00:41

好帖子。
最近用到这些东西,查了一下,楼主考虑的是最全面的。GBK->unicode的表很容易做,unicode->GBK就麻烦,只有楼主考虑到全角的处理,不过我还是有些担心,GBK里面除了全角的ASCII之外,依然还有七百多个符号,其中有偏旁部首、希腊符号等,这些又该如何处理。

cheungwen 发表于 2011-12-23 09:41:06

简单看了一下, 感觉处理得很复杂, 改天等我有空了, 我发个帖子, 简单说明一下GBK, UNICODE, UTF-8如何互换.
页: [1]
查看完整版本: 关于UNICODE GBK标点转换的一些资料