unicode万国码,支持全球所有的语言,Unicode 2-4字节。还可以与全球各个语言进行转换,Unicode—-gbk。
Unicode带来了新的问题,在内存里空间大没问题,存储起来浪费空间。针对Unicode的传输+存储,新编码utf-8出现。
utf-8:使用1、2、3、4个字节表示所有字符;优先使用1个字节(ASCII),无法满足增加一个字节,最多4个字节。英文占一个字节,欧洲语系占2个,东亚占3个,其它及特殊字符占4个。
utf-16:使用2、4个字节表示所有字符;优先使用2个字节,否则使用4个字节。
uff-32:使用4个字节表示所有字符。
文字在内存是是Unicode ,传输转成utf-8
python2 默认语言是ascii,python3默认语言是Unicode。
声明:
# -*- encoding:utf-8 -*-
0 Comments