unicode万国码,支持全球所有的语言,Unicode 2-4字节。还可以与全球各个语言进行转换,Unicode—-gbk。

Unicode带来了新的问题,在内存里空间大没问题,存储起来浪费空间。针对Unicode的传输+存储,新编码utf-8出现。

utf-8:使用1、2、3、4个字节表示所有字符;优先使用1个字节(ASCII),无法满足增加一个字节,最多4个字节。英文占一个字节,欧洲语系占2个,东亚占3个,其它及特殊字符占4个。

utf-16:使用2、4个字节表示所有字符;优先使用2个字节,否则使用4个字节。

uff-32:使用4个字节表示所有字符。

文字在内存是是Unicode ,传输转成utf-8

python2 默认语言是ascii,python3默认语言是Unicode。

声明:

# -*- encoding:utf-8 -*-
Categories: python

0 Comments

发表评论

Avatar placeholder

邮箱地址不会被公开。 必填项已用*标注