什么是多视图数据?
0 1012
2
该提问暂无详细描述
收藏
2021-02-09 17:19 更新 小眼的铁板烧 •  3502
共 1 个回答
高赞 时间
0

现实中的多视图数据

在现实应用中,一个数据对象往往拥有多个“属性集“,每个属性集构成了一个”视图“。例如对一部电影来说,它拥有多个属性集:图像画面信息所对应的属性集、声音信息所对应的属性集、字幕信息对应的属性集、甚至网上的宣传讨论所对应的属性集等等。每个属性集都可以看作一个视图。 为简化讨论,我们暂且仅考虑图像画面属性集所构成的视图和声音属性集所构成的视图。于是,一个电影片段可表示为样本(<x1,x2>,y),其中xi是样本在视图i中的示例,即基于该视图属性描述而得的属性向量,不妨假定x1为图像中的属性向量;x2为声音视图中的属性向量;y是标记,假定是电影的类型,例如”动作片“、”爱情片“等(<x1,x2>,y)这样的数据就是多视图数据。

多视图相容性

假设不同视图具有“相容性“,即其所包含的关于输出空间У的信息是一致的:令У1表示从图像画面信息判别的标记空间,У2表示从声音信息判别的标记空间,则有У=У1=У2,例如两者都是{爱情片、动作片},而不能是У={爱情片、动作片}而У2={文艺片、惊悚片},在此假设下,现实地考虑多视图有很多好处。 仍以电影为例,某个片段上有两人对视,仅凭图像画面信息难以分辨其类型,但此时若从声音信息听到“我爱你”,则可以判断出该片段很可能属于“爱情片”;另一方面,若仅凭图像信息认为“可能是动作片”,仅凭声音信息也认为“可能是动作片”,则当两者一起考虑是就有很大把握判别为“动作片”。显然在相容性基础上,不同视图信息的“互补性”会给学习器的构建带来很多便利。

收藏
2021-02-09 17:23 更新 空心人 •  3330