实体识别NER:
给文本中的每一个token分类,类别为 标签开始、标签中、无标签 之一。 分类通常使用 IOB 格式, 有两个变种,一个B 连续同种标签的开始token,I标签token,O非标签,另一个B 任意标签开始token,I标签中间token,O非标签。 例如地点就可以拆成 B-LOC 和 I-LOC 。
美国B-地点 产O 的O 苹果B-产品 13I-产品 ProI-产品 MaxI-产品 真O 好用O
问答系统:
有一段文本和一个问题,给出文本中答案所在的位置。 和NER的区别在于问题是不确定的,标注也是用开始-结束的方式。