
微机中,西文字符所采用的编码通常是ASCII(AmericanStandardCodeforInformationInterchange,美国信息交换标准代码)。
1、在计算机科学中,字符编码的拓展主要是为了支持更多的字符集,特别是非拉丁字母的字符集,如中文、日文、阿拉伯文等。ASCII编码由于其局限性(只能表示128个字符),无法满足多语言字符的需求,因此发展了多种扩展和新的编码标准。
2、扩展ASCII编码:扩展ASCII编码是在7位或8位ASCII编码的基础上,通过定义额外的位来表示更多的字符。例如,一些系统使用8位ASCII编码(也称为ISO-8859-1),它可以表示256个字符,但仍然局限于西欧语言字符。
3、多字节编码:多字节编码是一种使用多个字节来表示一个字符的方法。例如,GB2312是中国国家强制标准,用于简化中文字符的编码,它使用1到2个字节来表示一个字符。类似地,Big5用于繁体中文,Shift-JIS用于日文,UTF-16也可以看作是ASCII的多字节扩展。
4、Unicode编码:Unicode是一个全球性的字符编码标准,它设计用于覆盖几乎所有的语言字符,并为其提供一个统一的编码方式。最初的Unicode标准(Unicode1.0)于1991年发布,包括了超过65,000个字符。Unicode编码有多种表示形式,如UTF-8、UTF-16和UTF-32。UTF-8是互联网上最常用的Unicode编码方式,因为它对ASCII字符的兼容性较好,同时能够高效表示各种语言的字符。