GB 18030-2022《信息技术 中文编码字符集》解读
一、标准的基本信息
标准号:GB 18030-2022
发布日期:2022年7月19日
实施日期:2023年8月1日
主管部门:工业和信息化部
归口部门:工业和信息化部
发布单位:国家市场监督管理总局、国家标准化管理委员会
标准性质:强制性国家标准
适用范围:适用于中文和其他文字图形字符信息的处理、交换、存储、传输、显现、输入和输出
二、标准内容
字符集构成:
基本集:包括常用汉字、英文字母、数字及基本符号等,满足日常文本处理需求。
扩展集A:包含更多的汉字、异体字及罕见字符,满足古籍整理、学术研究等领域的特殊需求。
扩展集B:进一步扩展了字符集范围,收录了大量生僻字和专业领域用字,如中国绝大部分人名、地名用生僻字以及文献、科技等专业领域的用字。
编码方法:
采用变长多字节编码方法,字符以单字节、双字节或四字节编码。
兼容GB/T 2312、GBK等旧标准,提高了编码效率和字符集完整性。
字符收录:
汉字:共收录汉字87887个,包括简体和繁体汉字。
少数民族文字:支持中国少数民族现行文字。
日韩象形文字:包含日韩等国的象形文字。
康熙部首:包括214个康熙部首(KANGXI RADICALS)。
三、标准作用
信息技术产品:涉及计算机、通信设备、信息安全产品等信息技术产品的设计、开发、生产等环节,确保产品能够准确处理和显示中文字符。
互联网应用:对互联网上的中文信息交换、存储和检索等应用产生重要影响,如搜索引擎、社交媒体等,提高中文信息的处理效率和准确性。
软件与信息服务:对使用中文编码的软件产品、信息服务等产生直接影响,包括操作系统、数据库、中间件等,确保软件和信息系统能够正确处理和显示中文字符。
电子政务与公共服务:涉及政府、公共事业等领域的信息化系统,需确保与新版标准的一致性,保障政务信息和公共服务信息的准确传达和处理。
出版与印刷:在出版、印刷等领域,GB 18030-2022字符集能够支持更多的汉字和少数民族字符,满足出版需求。