在计算机系统中,汉字的表示方法主要有以下几种:
机内码
机内码,也称为“汉字ASCII码”或简称“内码”,是计算机内部存储、处理和传输汉字时所用的由0和1符号组成的代码。
根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。机内码将两个字节的最高位都规定为1,以区别于ASCII码。
交换码(国标码)
国标码,即《信息交换用汉字编码字符集–基本集》,由国家标准总局发布,1981年5月1日实施,通行于大陆。GB2312收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中汉字占6763个。国标码是用于计算机之间或与终端之间信息交换时的汉字代码,由连续的两个字节组成,每个字节七位有效,最高位为1。
点阵码和矢量码
记录汉字字形通常有两种方法:点阵法和矢量法,分别对应两种字形编码:点阵码和矢量码。
点阵码用一个二维数组(点阵)表示汉字字形,每个点对应一个二进制位。点阵码缩放困难且容易失真。例如,一个16x16点阵的汉字要占用32个字节,一个32x32点阵的汉字则要占用128字节。
矢量码用数学公式(如笔划的起始、终止坐标、半径、弧度等)描述汉字字形,可以随意放大缩小,输出时不需要点阵信息,因此显示效果更好。
输入码
汉字输入码可分为流水码、音码、形码和音形结合码四种。不同的输入法对应不同的输入码,例如拼音码、五笔字型码、自然码等。输入码是用来将汉字输入到计算机中的一组键盘符号。
字形码
字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。
总结:
在计算机系统中,汉字的表示主要通过机内码进行存储和处理,交换码(国标码)用于信息交换。此外,还有点阵码和矢量码用于字形表示,输入码用于汉字的输入。不同的应用场景下,可以选择合适的编码方式来满足需求。