在自然语言处理中,监督学习和非监督学习哪一种是最合适的方法?
计算机/软件
1 658
2
该提问暂无详细描述
收藏
2021-01-19 05:54 更新 gitvrar •  435
共 1 个回答
高赞 时间
0

我不确定什么才是最合适的,但是有很多采用半监督和远程监督的方法。 我不是这些方面的专家,但是你可以使用关键字远程监管和信息提取来在Google上搜索很多好东西。

也许,半监督学习中最著名的例子是语音识别和机器翻译的问题。 基本上,在两个任务中,你都具有并行数据:使用不同语言或语音功能和转录的相同(或相似)句子。 但是,没有为你提供对齐数据:例如,你不知道哪些声学特征代表哪些音素和字母。

有趣的是,人们称这种设置为监督,但很明显,这并不完全正确。无论如何,你的学习算法必须同时推断对齐和翻译模型,这是相当困难的。在过去,这些问题是通过使用期望最大化算法的变量来解决的。现在,我们使用端到端神经网络(CTC, listen-attend-spell)或混合方法(HMM-DNN)。

最后但并非最不重要的是,无监督的预训练和表示学习可能被认为是部分无监督的方法。例如,您可以使用word2vec算法训练单词嵌入,并将嵌入插入神经网络,该神经网络进行POS标记和/或问题回答

收藏
2021-01-19 06:12 更新 同步 •  1253