什么是弱监督学习?
0 538
0
该提问暂无详细描述
收藏
2021-01-06 17:09 更新 🍊小桔子 •  2439
共 1 个回答
高赞 时间
0

简单来说,在弱监督学习中,只能使用数量有限的标记数据。如何选择这些数据以及如何使用它们取决于方法。通常,使用的数据数量有限,很容易获取和产生实际影响的数据,然后学习其余的数据。
我认为bootstrapping是一种可以在弱监督学习中使用的方法,但这不是一种普遍接受的观点。
Bootstrapping也称为自我训练,是一种学习形式,旨在使用更少的训练示例,因此有时称为弱监督。Bootstrapping从几个训练例子开始,训练一个分类器,并使用这个分类器产生的被认为是正面的例子来进行再训练。随着训练样本集的增加,分类器得到了改进。前提是没有太多的负面样本被误分类为正面,否则可能导致性能的恶化。
在词性标记的例子中,通常会对10000个单词训练一个HMM(或最大熵或其他形式)标注器,每个单词都有其词性。在弱监督标记的情况下,可能只需要使用一个非常小的100个单词的语料库,就可以得到一些标签,用它们来标记更大的语料库。

收藏
2021-01-06 17:53 更新 Lisa •  1796