哪种数据库最适合机器学习?
0 1028
0
该提问暂无详细描述
收藏
2021-02-22 17:36 更新 张宇哲 •  6878
共 1 个回答
高赞 时间
0

简短回答:PostgreSQL是所有数据库中第二好的数据库。

详细回答:这将取决于数据中的内容(图像、文本、时间序列、营销数据等)以及数据的大小(主要是它是否适合一台机器)。还取决于你的数据源是什么以及你想要如何处理它们。

例如,如果你只想下载ImageNet数据集并在通过这构建一些网络,则使用任何数据库都不适合,你仅仅只需将数据存储在磁盘上就完美了。

有时,你还想对数据进行一些探索性分析,这实际上取决于数据类型。使用一些SQL数据库,它是超大的,非结构化/半结构化的吗?寻找一些NoSQL数据库,例如HBase / Cassandra。

有时,你的数据已经在某个数据库中(例如有关网上商店购买的数据),直接使用该数据库作为源而不是构建和维护另一个数据库,这样的做法可能很有意义。但是要小心,不要覆盖任何东西。

最后,你通常不希望将模型存储在数据库中,而是希望存储在其他地方,因为它通常只是一个大文件,你可以在应用程序/微服务中加载该文件。

基本上,你可以根据所拥有的数据类型选择SQL或NoSQL。这是一种结构化数据的方法。一旦决定使用SQL还是NoSQL,就选择一个数据库管理系统。在结构类型内,所有系统都极为相似。SQL类型系统的一些示例包括:MySQL,PostreSQL,SQL Server和SQL lite。一些NoSQL类型的系统包括MongoDB,Neo4j,Freebase,Microsoft Azure Tables和CouchDB。通常根据用户的喜好或有时在现有系统中的性能或集成来选择系统。从语法上讲,大多数系统非常相似,可能会有一些细微的变化。

收藏
2021-02-22 18:05 更新 错位时空 •  2449