统计学习和机器学习有什么不同之处?
计算机/软件
0 1316
3
该提问暂无详细描述
收藏
2021-01-11 04:09 更新 李姐万岁 •  10551
共 1 个回答
高赞 时间
0

好问题!我总是以这个提问开始我给研究生的机器学习第一课。我喜欢类比,这个问题我也将通过类比来回答。

机器学习之于统计学就像工程学之于物理学一样。

土木、电气或机械工程与物理学有何不同?物理学主要研究宇宙、物质、能量守恒、对称原理等基本规律。而工程学领域主要是尝试建立结构、工具、机器等,它们建立在人们对物理学的深刻理解之上。

有的人认为即使没有对物理学特别是量子力学有深刻的认识,人们也会发明出计算机,这种想法非常搞笑。

贝尔实验室的先驱科学家在开发第一代晶体管时,使用了量子理论。晶体管一种固态开关,性能远优于当时广泛使用的真空管。如果没有量子力学,晶体管就永远不会被发明出来。

N-P-N结只能用量子效应来解释,因为它需要理解“空穴”(电子所在的间隙)是如何在结之间移动的。

同样,机器学习建立在统计学的研究基础之上。统计学是数据科学的本源,但有些讽刺的是机器学习的研究者却将他们自己包裹在数据科学的外衣中。一百多年来,统计学家一直在努力建立数据科学原理。数据科学中精深、最美丽的理论不是来自机器学习,而是来自统计。

拿“充分统计量”这个美丽的概念来举例:你能从原始数据中提取出“充分统计量”的话,你就可以保留生成模型的所有必要知识,从而“解释”数据。

著名的Rao-Blackwell定理就是这种精深理论的一个例子,它可以指导强大的机器学习系统的设计(并且已经这样做了数十年)。

如果不懂得统计学就去搞机器学习,就像是不懂物理学就去搞工程学一样。没准你可以取得一定的成功——毕竟,埃及人成功建造了金字塔——但是这将是一次又一次的冒险试错,没准会以千万条生命为代价。

科学可以使工程师能够设计出更加安全的解决方案,它们经过了仿真测试,并能被可靠地建造出来。(就像旧金山最新的摩天大楼SalesForce塔那样,它经过了全面的测试,可以承受随时而来的地震)

本回答来自马萨诸塞大学阿默斯特分校教授 Sridhar Mahadevan

收藏
2021-01-11 04:14 更新 饮水思源 •  5514