整理计算机编码

计算机编码,书上都是很简单的介绍,篇幅不长,大致介绍了各种编码系统,但是从我这段时间学习Python中发现,好多坑,都是因为编码问题。

不同的位模式集合被设计用于表示文本符号。每一个集合被称为代码。表示符号的过程被称为编码

编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编码的逆过程。

碰到过各种各样的编码,比如GBK,UTF-8, ASCII, Unico等等。不同的操作系统,采用的默认编码不同。这些都在编程的过程中都是值得注意的。

下面按照编码系统出现的顺序来一一分析。

unicode(UTF-8)

unicode(UTF-16)

中文

GBK

GB 2312

GB 18030

Big 5