Index
Computer Science
Artificial Intelligence
Natural Language Processing

Natural Language Processing

实体识别NER:

给文本中的每一个token分类,类别为 标签开始、标签中、无标签 之一。 分类通常使用 IOB 格式, 有两个变种,一个B 连续同种标签的开始token,I标签token,O非标签,另一个B 任意标签开始token,I标签中间token,O非标签。 例如地点就可以拆成 B-LOC 和 I-LOC 。

美国B-地点   O   O   苹果B-产品   13I-产品   ProI-产品   MaxI-产品   O   好用O

问答系统:

有一段文本和一个问题,给出文本中答案所在的位置。 和NER的区别在于问题是不确定的,标注也是用开始-结束的方式。

Created by sine at 2022-01-06 08:37:21. Last modification: 2022-01-06 09:24:13