python学习记录
2021-03-13 10:29
标签:列表 函数 返回 mamicode join 技术 int imp 记录 python学习记录 标签:列表 函数 返回 mamicode join 技术 int imp 记录 原文地址:https://www.cnblogs.com/Serenaxy/p/14060370.html
jieba
分词
‘‘‘
函数 jieba.cut(sentence, cut_all=False)
参数 sentence为待分词的字符串 cut_all为是否为全模式
返回指 生成器
‘‘‘
import jieba
sentence = "我考上了清华大学"
seg_list = jieba.cut(sentence, cut_all=True)
print(‘[全模式]:‘ + ‘/‘.join(seg_list))
seg_list = jieba.cut(sentence, cut_all=False)
print(‘[精确模式]:‘ + ‘/‘.join(seg_list))
‘‘‘
函数 jieba.lcut(sentence, cut_all=False)
参数 sentence为待分词的字符串,cut_all为是否使用全模式
返回值 列表
‘‘‘
import jieba
sentence = "我考上了清华大学"
seg_list = jieba.lcut(sentence, cut_all=True)
print(‘[全模式]:‘ + ‘/‘.join(seg_list))
seg_list = jieba.lcut(sentence, cut_all=False)
print(‘[精确模式]:‘ + ‘/‘.join(seg_list))
词性标注
‘‘‘
函数 jieba.posseg.cut(sentence)
参数 setence待分词的字符串
返回值 生成器
同理cut前面加上l返回列表
‘‘‘
import jieba.posseg
sentence = ‘我是中国人‘
for w, p in jieba.posseg.cut(sentence):
print(w, p)
添加字典
‘‘‘
函数 jieba.load_userdict(path)
参数 path添加字典路径
‘‘‘
import jieba
jieba.load_userdict(‘mydict.txt‘)
上一篇:021 如何设计一个C++的类