SQL引擎
文章平均质量分 92
Whoisbug
一线大厂技术骨干,曾主导多个大型分布式系统开发,涵盖电商交易、营销增长、社交互动等核心业务,在高并发场景下保障系统稳定运行,以精湛技术助力业务腾飞。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
DuckDB:一个可嵌入的分析型数据库
SQLite的巨大成功表明,人们需要一种不引人注目的进程内数据管理解决方案。然而,目前还没有针对分析型工作负载的此类系统。我们展示了DuckDB,这是一个新型的数据管理系统,旨在嵌入到其他进程中执行分析型SQL查询。在我们的演示中,我们将DuckDB与其他数据管理解决方案进行对比,以展示其在嵌入式分析场景中的性能。DuckDB作为开源软件,采用许可性许可证发布。原创 2025-02-26 22:51:08 · 1479 阅读 · 0 评论 -
DuckDB:最快的表排序 - 重新设计 DuckDB 的排序功能
数据库系统出于多种目的使用排序,最明显的是当用户在查询中添加ORDER BY子句时。排序还用于操作符内部,例如窗口函数。DuckDB 最近改进了其排序实现,现在能够并行排序,并且可以排序比内存中更多的数据。在这篇文章中,我们将看看 DuckDB 是如何排序的,以及这与其他数据管理系统相比如何。原创 2025-01-26 23:59:43 · 1550 阅读 · 0 评论 -
DuckDB:Catalog、Schema、Table 数据组织结构简介
DuckDB 的 Catalog、Schema 和 Table 提供了一种强大的数据组织和管理机制。通过合理使用 Catalog 和 Schema,可以有效地隔离和管理数据,提高数据的可维护性和可访问性。希望这些内容能帮助你更好地理解和使用 DuckDB 的 Catalog、Schema 和 Table。如果你有更多问题,可以参考 DuckDB 的官方文档或加入 DuckDB 的社区获取更多帮助。原创 2025-01-26 11:27:02 · 1302 阅读 · 0 评论 -
DuckDB:灵活扩展机制
DuckDB 拥有一个灵活的扩展机制,允许动态加载扩展。这些扩展。扩展可以在所有客户端(例如 Python 和 R)上加载。通过核心和社区仓库分发的扩展在 macOS、Windows 和 Linux 上构建和测试。所有操作系统均支持 AMD64 和 ARM64 架构。原创 2025-01-25 01:06:32 · 1913 阅读 · 0 评论 -
DuckDB:详细解读 TableRef 类
TableRef 及其子类的设计体现了 DuckDB 对灵活性、扩展性和模块化的追求。通过抽象基类和多种子类的实现,DuckDB 能够高效地处理各种复杂的查询场景,支持多种数据源和查询逻辑。这种设计不仅提升了系统的可维护性,也为开发者提供了强大的功能扩展能力。原创 2025-01-25 00:39:24 · 1292 阅读 · 0 评论 -
依赖管理在 DuckDB 扩展中的应用
TL;DR:尽管 DuckDB 核心代码没有外部依赖,但构建带有依赖的扩展现在变得非常简单,内置支持 vcpkg,这是一个支持超过 2000 个 C/C++包的开源包管理器。有兴趣自己构建扩展吗?请查看扩展模板。原创 2025-01-24 23:40:47 · 1115 阅读 · 0 评论 -
DuckDB:QueryProfiler(查询分析器)
用户可以通过动态启用或禁用特定的性能指标。QueryProfiler 是 DuckDB 中用于查询性能分析的强大工具。它通过和多种性能指标,帮助用户深入理解查询的执行过程和性能瓶颈。通过灵活的配置和多种输出格式,用户可以轻松地分析和优化查询性能。如果你需要更深入地了解的实现细节,可以参考 DuckDB 的源码文件:••这些文件中包含了的具体实现和使用方式。//!原创 2025-01-24 08:05:28 · 1482 阅读 · 0 评论 -
DuckDB:详细解析CMakeLists.txt
CMake(Cross-Platform Make)是一种跨平台的构建系统生成器,用于管理和自动化软件的构建过程。它通过编写配置文件(通常是 CMakeLists.txt)来定义项目的构建规则,支持多种编译器和操作系统,能够生成本地化的构建文件(如 Makefile、Visual Studio 解决方案等)。跨平台项目:需要在多种操作系统上构建和部署的项目。大型项目:包含多个模块和依赖的复杂项目。团队开发:需要统一构建流程和配置的团队开发环境。原创 2025-01-22 00:29:57 · 1092 阅读 · 0 评论 -
ClickHouse 字符串替换函数
函数,它根据参数中列出的值(字符串、整数、浮点数等)格式化给定的字符串。不在大括号中的内容被视为普通文本,并原样复制到输出中。假设字符串包含有效的 UTF-8 编码文本。按照 Python 中类似的格式化方式,使用参数列表中的值(字符串、整数等)格式化。和后续格式说明符之间的内容都被视为普通文本,并原样复制到输出中。一般字符串操作函数和用于字符串搜索的函数,可参考:。同时请注意,字符串字面量需要额外的转义。中要被替换的片段的长度。中要被替换的片段的长度。:用于替换的字符串。:用于替换的字符串。原创 2025-01-21 01:07:14 · 1740 阅读 · 0 评论 -
ClickHouse 字符串操作函数
涵盖了字符串的检查、转换、编码、解码、相似度计算、格式化以及提取等功能。这些函数不仅适用于 ASCII 字符串,还支持 UTF-8 编码的 Unicode 字符串,能够满足多种复杂的字符串处理需求原创 2025-01-21 00:48:35 · 1480 阅读 · 0 评论 -
ClickHouse 字符串搜索函数
详细介绍了 ClickHouse 中用于字符串搜索的函数,包括基本搜索、正则表达式匹配、不区分大小写和 UTF-8 编码的支持,以及计算字符串相似度和子序列匹配等功能。原创 2025-01-21 00:23:37 · 1402 阅读 · 0 评论 -
DuckDB:在Apache Arrow上使用SQL
DuckDB可以查询多种不同类型的Apache Arrow对象。原创 2025-01-16 01:33:32 · 653 阅读 · 0 评论 -
DuckDB:使用DuckDB进行Python数据分析指南
在本教程中,我们查看了如何使用DuckDB进行Python数据分析。我们使用了CSV文件。但你可以以相同的方式使用parquet和JSON文件以及关系数据库。所以,是的,DuckDB是分析Python中大型数据集的有用工具,也是你的Python数据分析工具箱中相当有用的补充。我建议在你的下一个数据分析项目中使用DuckDB。编码愉快!原创 2025-01-16 01:17:50 · 2189 阅读 · 0 评论 -
DuckDB:为什么选择DuckDB
市面上有许多数据库管理系统(DBMS)。但没有一种通用的数据库系统。所有系统都通过不同的权衡来更好地适应特定用例。DuckDB也不例外。在这里,我们尝试解释DuckDB的目标以及我们如何通过技术手段实现这些目标。首先,DuckDB是一个关系型(面向表格的)DBMS,支持结构化查询语言(SQL)。原创 2025-01-16 01:02:24 · 1510 阅读 · 0 评论 -
DuckDb:Push-Based Execution 查询执行模式
在传统的 Pull-Based Execution 中,数据是由下至上从数据源逐级拉取的,每个操作符等待其下一级操作符提供数据,而在 Push-Based Execution 中,数据是由上至下主动推送的,操作符在准备好数据后将其向下推送至下一级操作符。如果你对 Push-Based Execution 的某个具体方面,如操作符的具体实现、流水线的详细构建过程,或者与其他技术的结合使用感兴趣,可以继续向我提供更详细的信息,我会为你提供更深入的解释和帮助。原创 2025-01-15 21:32:55 · 1577 阅读 · 0 评论
分享