再聊聊自然语言处理中的结构化预测问题

2021-03-14 16:34

阅读:376

标签:句法分析   直接   结构化   图片   自然语言   代码   个人   mamicode   nta   

上次文章从广泛意义上说了结构化预测【见下文】闲聊结构化预测(structured learning)【这是一类问题】 本文聊一下自然语言处理中的结构化预测问题。

Structured Prediction

技术图片
一开始还是说一下结构化预测的概念,结构化预测不是输出一个标量(回归问题)或者一个类别(分类问题),而是输出一个结构,树、图或者其它序列能够互相影响彼此。

在自然语言处理中,结构化预测问题有以下几种:

  • Sequence segmentation
  • Sequence labeling / Tagging
  • Parsing
    下面来分开举例

Sequence Segmentation

技术图片
序列分割,指的是将一个序列分割为连续的片段。

更广泛的有句子分割,段落分割,他们的输出片段与片段直接其实是互相联系,全部构成一个整体sequence。

Sequence Labeling / Tagging

技术图片
序列标注是一类问题,是对一个序列的每个word打上一个标签,在nlp中非常多的任务都可以转为序列标注任务,这里不是重点,只是说序列标注是结构化预测问题。序列标注问题还有:

技术图片
技术图片
技术图片
技术图片
以上任务均可以转化为序列标注任务,然后通过一定的解码算法就能得到需要的结果,它们是结构化预测问题,不是简单回归或者分类问题。

Parsing Algorithm

技术图片
最后一类问题是parsing问题,对句法分析的介绍可以看:
技术图片

上面两篇文章(知乎搜索相关关键字即可!)
本篇文章主要总结了在自然语言处理方向的结构化预测问题,每一类问题其实都可以展开讲解,欢迎大家交流!

所以ppt来自哈工大车万翔老师slides

技术图片

推荐阅读:

【荐号】汇集百万粉丝的个人技术号
我就不信看完这篇你还搞不懂信息熵
通俗易懂讲解感知机(三)--收敛性证明与对偶形式以及python代码讲解
技术图片

再聊聊自然语言处理中的结构化预测问题

标签:句法分析   直接   结构化   图片   自然语言   代码   个人   mamicode   nta   

原文地址:https://blog.51cto.com/15009309/2553322

上一篇:Python 学习之路起航

下一篇:Python3 列表


评论


亲,登录后才可以留言!