python2升级到python3时遇到的编码问题汇总
2021-03-31 15:25
标签:python2 -- can txt 分析 uft 遇到 信息 ann 本文档总结了python2->3升级过程中遇到的编码问题 1.UnicodeDecodeError:“ascii” codec cannot decode byte oxe6 in position 501:ordinal not in range 定位:从报错日志可以发现代码运行到with open(a.txt, "r")as f:时报错,即读取文件时出错。 分析:with open 方法参数encoding没有写则默认为ascii,查看磁盘上的文件编码格式为utf8。故导致指定的ascii不能打开utf8编码的文件,ascii不能完全匹配utf8的字符集。 解决:with open(a.txt, "r")as f:改为with open(a.txt, "r", encoding="uft8")as f: ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 2.UnicodeDecodeError:“utf8” codec cannot decode byte oxa3 in position 25:invalid start byte 定位:报错日志指向with open(b.txt, "r", encoding="uft8")as f: 分析:磁盘上b.txt是utf8的编码格式,encodeing也指定了,但oxa3(utf8编码)是一个无效的字节,在文本模式(“r”)读取时无法解码为unicode编码格式。 解决: 方法1.删除b.txt里面的中文。 方法2.r->rb,以二进制形式读取,byte->byte,不会出现byte->str的解码报错信息。 python2升级到python3时遇到的编码问题汇总 标签:python2 -- can txt 分析 uft 遇到 信息 ann 原文地址:https://www.cnblogs.com/frantz/p/13558258.html