python3中编码和解码
2021-02-20 15:20
标签:cos border python 内容 ext open() 的区别 只读 式表 ------------恢复内容开始------------ 一、python3与python2.7在字符编码上的差异 二、python3中str和bytes的区别 (1)python3有两种数据类型:str 和bytes。 1、编码为Unicode的文本显示为str; 2、其他编码(比如gbk,utf8等)显示为bytes(16进制方式表示) (2)在python3中的encode和decode都是相对于Unicode而言的 1、encode()方法是str类型数据拥有的方法,将Unicode编码的数据,转换为其他编码,作为新对象返回 2、decode()方法是bytes类型数据拥有的方法,将其他编码的数据解码为Unicode编码,作为新对象返回 三、在python3中,汉字的编码及其显示方式 例如,输入汉字“中文”时 另外,ASCII码可以表示所有到的英文字符,仅占一个字节,ASCII码表示的字符会始终以字符形式在屏幕中显示。 四、当在python3中用open()方法打开文件的注意事项 open()方法有很多参数,其中常用的有 file:文件所在路径及文件名 mode: r:只读,以text的模式打开文件 w:写入,以文本的模式打开文件,且打开时将文件内容清空 b :以bytes的模式打开文件 a:在文件后添加内容 r+:可读可写,在文件已有文本的后面继续写入 w+:以可读可写方式打开文件,且打开文件时,清空文件,文件不存在则创建文件 encoding:指定解码文件使用的‘编码方式’,比如‘utf8’、‘gbk’等,默认使用操作系统的编码方式。windows默认是GBK, macOS、linux默认使用utf8 ------------恢复内容结束------------ python3中编码和解码 标签:cos border python 内容 ext open() 的区别 只读 式表 原文地址:https://www.cnblogs.com/wl413911/p/12680867.html
编码方式
编码二进制格式
在屏幕中的显示
Unicode
‘\u4e2d\u6587‘
"中文"
GBK
b‘\xd6\xd0\xce\xc4‘
b‘\xd6\xd0\xce\xc4‘
UTF8
b‘\xe4\xb8\xad\xe6\x96\x87‘
b‘\xe4\xb8\xad\xe6\x96\x87‘
注解
b:代表bytes类型 ;\x代表编码是16进制表示 ;\u表示编码是Unicode