查看文章 |
从计算机的应用开始,我国已经颁布了多种中文信息编码标准,常用的是 GB2312-1980,GB12345,GB13000 (GBK),以及最新标准 GB18030。最新的 GB18030 标准将要作为强制标准实行,所有不支持 GB18030 标准的软件将不能作为产品出售,当然,这里有个时间限制,类似 WAPI。Microsoft 已经发布了 Windows NT / XP 的相关 patch。 GB2312 的汉字编码规则为: 第一个字节的值在 0xB0 到 0xF7 之间,第二个字节的值在0xA0 到 0xFE 之间。 GB12345 和 GB13000 是对 GB2312-1980 的扩充,所有已经包含在 GB2312 中的汉字编码不变,另外增加更多的码位。 其编码规则大致为:第一个字节的值在 0x81 到 0xFE 之间,第二个字节的值在 0x40 到 0xFE 之间。由于 GB13000 是对GB2312 的扩展,所以也被称为 GBK。 GB18030 也是对 GB2312 的扩展 (原有编码不变),其编码长度由 2 个字节变为 1 - 4 个字节。其中包括: |