python - 基础 - 基础知识2
2020-12-13 06:14
标签:unicode 表示 一个 中国人 中国 bit 字母 基础知识 bsp 电报,电脑的传输,存储都是01010101 最早的‘密码本‘ ascii 涵盖了英文字母大小写,特殊字符,数字。 gbk 中国人自己发明的,一个中文用两个字节 16位去表示。 11000000 1bit 8bit = 1bytes python - 基础 - 基础知识2 标签:unicode 表示 一个 中国人 中国 bit 字母 基础知识 bsp 原文地址:https://www.cnblogs.com/bigbigbird/p/11172245.html
01010101
ascii 只能表示256种可能,太少,
创办了万国码 unicode
16表示一个字符不行,32位表示一个字符。
A 01000001010000010100000101000001
B 01000010010000100100001001000010
我 01000010010000100100001001000010
Unicode 升级 utf-8 utf-16 utf-32
8位 = 1字节bytes
utf-8 一个字符最少用8位去表示,英文用8位 一个字节
欧洲文字用16位去表示 两个字节
中文用24 位去表示 三个字节
utf-16 一个字符最少用16位去表示
1byte 1024byte = 1KB
1KB 1024kb = 1MB
1MB 1024MB = 1GB
1GB 1024GB = 1TB