python学习记录

2021-03-13 10:29

阅读:624

标签:列表   函数   返回   mamicode   join   技术   int   imp   记录   

目录
  • jieba
    • 分词
    • 词性标注
    • 添加字典

jieba

分词

‘‘‘ 
函数 jieba.cut(sentence, cut_all=False)
参数 sentence为待分词的字符串 cut_all为是否为全模式
返回指 生成器
‘‘‘
import jieba
sentence = "我考上了清华大学"
seg_list = jieba.cut(sentence, cut_all=True)
print(‘[全模式]:‘ + ‘/‘.join(seg_list))
seg_list = jieba.cut(sentence, cut_all=False)
print(‘[精确模式]:‘ + ‘/‘.join(seg_list))
‘‘‘
函数 jieba.lcut(sentence, cut_all=False)
参数 sentence为待分词的字符串,cut_all为是否使用全模式
返回值 列表
‘‘‘
import jieba
sentence = "我考上了清华大学"
seg_list = jieba.lcut(sentence, cut_all=True)
print(‘[全模式]:‘ + ‘/‘.join(seg_list))
seg_list = jieba.lcut(sentence, cut_all=False)
print(‘[精确模式]:‘ + ‘/‘.join(seg_list))

技术图片

词性标注

‘‘‘
函数 jieba.posseg.cut(sentence)
参数 setence待分词的字符串
返回值 生成器
同理cut前面加上l返回列表
‘‘‘
import jieba.posseg
sentence = ‘我是中国人‘
for w, p in jieba.posseg.cut(sentence):
    print(w, p)

技术图片

添加字典

‘‘‘
函数 jieba.load_userdict(path)
参数 path添加字典路径
‘‘‘
import jieba
jieba.load_userdict(‘mydict.txt‘)

python学习记录

标签:列表   函数   返回   mamicode   join   技术   int   imp   记录   

原文地址:https://www.cnblogs.com/Serenaxy/p/14060370.html


评论


亲,登录后才可以留言!