数据库与特征选择相关知识解析
1. 数据库基础概念
数据库是有组织的数据集合,其数据通常被组织起来以模拟现实的相关方面,例如酒店房间的可用性,并且以支持需要这些信息的流程的方式进行组织,如查找有空房的酒店。
数据库具有诸多重要特性,除了数据持久化外,还提供可靠性、效率、可扩展性、并发控制、数据抽象和高级查询语言等特性。它在众多领域都有广泛应用,大量的网站和应用程序都依赖数据库,是电信系统、银行系统、视频游戏以及几乎任何维护一定量持久信息的软件系统或电子设备的关键组件。计算机科学专业的毕业生常常认为数据库课程对他们的行业或研究生生涯最为有用。
需要注意的是,数据库和数据库管理系统(DBMS)是不同的概念。DBMS 是用于创建和管理数据库,并为用户和应用程序提供对数据库访问权限的系统软件。可以将数据库比作文档,而 DBMS 比作文字处理器。
2. Neo4j 与 RDBMS 执行时间比较
在一项关于社交网络中查找朋友的实验中,对比了关系型数据库(RDBMS)和图数据库 Neo4j 的执行时间。实验旨在查找社交网络中最多深度为 5 的朋友的朋友,对于包含 100 万人且每人约有 50 个朋友的社交网络,结果如下表所示:
| 深度 | RDBMS 执行时间 (s) | Neo4j 执行时间 (s) | 返回记录数 |
| — | — | — | — |
| 2 | 0.016 | 0.01 | ~2500 |
| 3 | 30.267 | 0.168 | ~110,000 |
| 4 | 1543.505 | 1.359 | ~600,000 |
| 5 | 未完成 | 2.132 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



