python字符串类型介绍
2020-12-13 14:39
标签:单位 磁盘 内置函数 换行符 英文字母 没有 换行 介绍 编辑 python字符串类型介绍 标签:单位 磁盘 内置函数 换行符 英文字母 没有 换行 介绍 编辑 原文地址:https://blog.51cto.com/xlazj/2440037
1.单引号或双引号
二. 字符串是不会变的
1.字符串不会变,只会新增后再赋值
a = ‘ABC‘
b = a
a = ‘XYZ‘
print(b)
结果还是ABC
三. 字符串的拼接
1.用加号+
2.字符串不能与数字类型相加,需要使用内置函数str()将数字类型转换成字符串类型再拼接
四. 字符串的常用方法
1.title()
将字符串里面的英文单词(空格隔开的叫一个单词)首字母变大写,其他字符不变
2.upper()
将字符串里面的所有英文字符变大写,其他字符不变
3.lower()
将字符串里面的所有英文字符变小写,其他字符不变
4.rstrip(chars)
rstrip(chars) 方法用于截掉字符串右边特定的字符序列(可以是一个字符,可以是一个字符串),默认字符为所有空字符,包括空格、换行(\n)、制表符(\t)等,如果有参数表示删除末尾的特定字符序列
5.lstrip(chars)
lstrip(chars)方法用于截掉字符串左边的空格或指定字符后生成的新字符串
6.strip(chars)
方法用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列
7.format()
用{}代替占位符%,字符串里面用{变量/下标等等}括起来,format()方法里面传递参数
五. 字符串的转义字符、制表符、换行符
1.转义字符(),用\‘表示‘,用\表示\
2.制表符(\t),占四个空格
3.换行符(\n),print会换行,所以\n一般不放在字符串尾部,\n\t换行缩进4个空格
六.编码(python字符串在内存中用unicode编码)
1.ASCII编码(一个字节)全是对英文字符或特殊符号编码,并没有把全球其他语言统一编码,所以用unicode编码(两个字节),但是针对不同的字符又太浪费空间,不方便存储和传输,所以用UTF-8编码,UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间
2.计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件:
3.python内置函数ord(c)函数获取字符的整数表示,chr(code)函数把编码转换为对应的字符
4.由于Python的字符串类型是str,在内存中以Unicode表示,一个字符对应若干个字节。如果要在网络上传输,或者保存到磁盘上,就需要把str变为以字节为单位的bytes字节流,需要编码和解码。Python对bytes类型的数据用带b前缀的单引号或双引号表示:b‘ABC‘。
1)纯英文的字符串用encode(‘ascii‘)方法将字符串转为以字节为单位bytes
2)如果我们从网络或磁盘上读取了字节流,那么读到的数据就是bytes。要把bytes变为str,就需要用decode(‘utf-8‘)方法,
3)字符char,字节流byte,字符串str,内存中用的unicode编码,需要保存文本或者在网络上传输,就需要把str编码转换成字节流然后保存和传输,再取出的时候再解码