|
发表于 2018-6-13 18:02:01
|
显示全部楼层
本帖最后由 t3486784401 于 2018-6-13 18:16 编辑
Windows 下 GB2312 和 Unicode 之间互换用的是这么两个 API 函数:
#1:GB2312 -> Unicode
- int MultiByteToWideChar(
- UINT CodePage, // code page
- DWORD dwFlags, // character-type options
- LPCSTR lpMultiByteStr, // string to map
- int cbMultiByte, // number of bytes in string
- LPWSTR lpWideCharStr, // wide-character buffer
- int cchWideChar // size of buffer
- );
复制代码
#2:Unicode -> GB2312
- int WideCharToMultiByte( UINT CodePage, // code page
- DWORD dwFlags, // performance and mapping flags
- LPCWSTR lpWideCharStr, // wide-character string
- int cchWideChar, // number of chars in string
- LPSTR lpMultiByteStr, // buffer for new string
- int cbMultiByte, // size of buffer
- LPCSTR lpDefaultChar, // default for unmappable chars
- LPBOOL lpUsedDefaultChar // set when default char used);
复制代码
实际使用过程中还牵涉到乱码字符处理等问题。至于 BIG5 目前没研究过。UTF-8 的话,可以通过移位换算转到 Unicode。
如果在 Windows 端做这些转换的话,倒还是有现成的 API;你要是嵌入端搞的话,目测只剩下查表了。
搜索下载全部的(或者常用的)汉字字符集,分别另存为 GB2312/Unicode/BIG5 等,然后自己做成表格,也就几十 kB 的空间。
P.S. 发一段以前做的 GBK->UTF8 的字典加载程序,可以把其中 GBK 的码抽出来作为字符集用:
-------------------------------------------------------------------------------------
编辑原因:追加字符集源码 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|