Python的基本数据类型2
2020-12-13 05:30
标签:操作 bit 内容 decode 改变 print 字符串 strip spl 1、切片 2、字符串相关方法 3、字符串查找的方法 4、字符串条件判断 1、is和==的区别 2、编码 2.1、字符串串在传输时转化成bytes=> encode(字符集)来完成 2.2、那么在对方接收的时候. 也是接收的bytes类型的数据. 我们可以使用decode()来进行解码操作. 把bytes类型的数据还原回我们熟悉的字符串: 1、浅拷贝 2、深拷贝 Python的基本数据类型2 标签:操作 bit 内容 decode 改变 print 字符串 strip spl 原文地址:https://www.cnblogs.com/jknote/p/11142381.html1、str(字符串)
str = "你好,我是Python"
s = str[0:4] #用法[start:end:step],指定开始下标和结束下标,step是步长,默认是1,可以不指定
#包括开头的下标,但是不包括结尾的下标,所以结果是:你好,我
str = "ok,你好,我是Python,我包括123456789,还包括abcdefghijklmnopQRstuvwxyz"
str.capitalize() #首字母大写,其他都小写
str.upper() #字母全部转大写
str.lower() #全部字母转小写
str.swapcase() #大小写转换
str.title() #被字符隔开的首字母大写
str.center(90,"*") #将str居中,字符串拉长到90,其他字符补*
str.strip() #去左右两端空格
str.lstrip() #去左边的空格
str.rstrip() #去右边的空格
str.strip("abc") #去左右两端的abc
str.replace("123","哈哈") #替换字符串,还可以指定替换的个数用法:replace("","",2)
str.split(",") #以逗号分割字符串
str = "ok,你好,我是Python,我包括123456789,还包括abcdefghijklmnopQRstuvwxyz"
str.startswith("o") #查询是否以o开头,返回True或False
str.endswith("z") #查询是否以z结尾,返回True或False
str.count("o") #查询o出现的次数
str.find("n") #查询n第一次出现的位置,没有返回-1
str.find("n",8,12) #切片查询n第一次出现的位置,没有返回-1
str.index("n") #查询n的索引位置,和find用法结果相同,但是找不到会报错
str = "ok,你好,我是Python,我包括123456789,还包括abcdefghijklmnopQRstuvwxyz"
str.isalnum() #是否有字母和数字组成,只要含字母就为True
str.isalpha() #是否有字母组成,只要含字母就为True
str.isdigit() #是否有数字构成,不含小数点
len(str) #计算字符串的长度
2、字符串的编码以及常量池
s = ‘alex‘
print(id(s)) # 4326667072
s1 = "alex"
print(id(s1)) # 4326667072
print(s == s1) #True
lst = [1, 2, 4]
print(id(lst)) # 4326685768
lst1 = [1, 2, 4]
print(id(lst1)) # 4326684360
print(lst == lst1) #True
#首先id是比较内存地址,==比较的是值
#其次str和int都是在常量池中,所以他的内存地址都相同,但是list不在常量池中,所以他的内存地址不相同
1. ASCII : 最早的编码. ?里里?面有英?文?大写字?母, ?小写字?母, 数字, ?一些特殊字符. 没有中?文,
8个01代码, 8个bit, 1个byte
2. GBK: 中?文国标码, ?里里?面包含了了ASCII编码和中?文常?用编码. 16个bit, 2个byte
3. UNICODE: 万国码, ?里里?面包含了了全世界所有国家?文字的编码. 32个bit, 4个byte, 包含了了
ASCII
4. UTF-8: 可变?长度的万国码. 是unicode的?一种实现. 最?小字符占8位
s = "alex"
print(s.encode("utf-8")) # 将字符串串编码成UTF-8
print(s.encode("GBK")) # 将字符串串编码成GBK
结果:
b‘alex‘
b‘alex‘
s = "中"
print(s.encode("UTF-8")) # 中?文编码成UTF-8
print(s.encode("GBK")) # 中?文编码成GBK
结果:
b‘\xe4\xb8\xad‘
b‘\xd6\xd0‘
#英文编码之后的结果和源字符串一致. 中文编码之后的结果根据编码的不同.s = bs.decode("GBK") # 解码
# 然后需要进?行行重新编码成UTF-8
bss = s.encode("UTF-8") # 重新编码
3、深拷贝和浅拷贝
lst1 = ["何炅", "杜?涛","周渝民"]
lst2 = lst1.copy()
lst1.append("李嘉诚")
print(lst1)
print(lst2)
print(id(lst1), id(lst2))
结果:
两个lst完全不一样. 内存地址和内容也不一样. 发现实现了内存的拷贝
lst1 = ["何炅", "杜?涛","周渝民", ["麻花藤", "马芸", "周笔畅"]]
lst2 = lst1.copy()
lst1[3].append("无敌是多磨寂寞")
print(lst1)
print(lst2)
print(id(lst1[3]), id(lst2[3]))
结果:
[‘何炅‘, ‘杜?涛‘, ‘周渝民‘, [‘麻花藤‘, ‘马芸‘, ‘周笔畅‘, ‘无敌是多磨寂寞‘]]
[‘何炅‘, ‘杜?涛‘, ‘周渝民‘, [‘麻花藤‘, ‘马芸‘, ‘周笔畅‘, ‘无敌是多磨寂寞‘]]
4417248328 4417248328
#经过上面的方法,我们可以看出,浅拷贝只能拷贝最外一层的,如果拷贝深层的,就是直接指定内存地址了,不再是拷贝内容了import copy
lst1 = ["何炅", "杜?涛","周渝民", ["麻花藤", "马芸", "周笔畅"]]
lst2 = copy.deepcopy(lst1)
lst1[3].append("无敌是多磨寂寞")
print(lst1)
print(lst2)
print(id(lst1[3]), id(lst2[3]))
结果:
[‘何炅‘, ‘杜?涛‘, ‘周渝民‘, [‘麻花藤‘, ‘马芸‘, ‘周笔畅‘, ‘无敌是多磨寂寞‘]]
[‘何炅‘, ‘杜?涛‘, ‘周渝民‘, [‘麻花藤‘, ‘马芸‘, ‘周笔畅‘]]
4447221448 4447233800
#都不一样了. 深度拷贝. 把元素内部的元素完全进行拷贝复制. 不会产生一个改变另一个跟着改变的问题