自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Whoisbug的博客

技术分享

  • 博客(76)
  • 资源 (1)
  • 收藏
  • 关注

原创 DuckDB:一个可嵌入的分析型数据库

SQLite的巨大成功表明,人们需要一种不引人注目的进程内数据管理解决方案。然而,目前还没有针对分析型工作负载的此类系统。我们展示了DuckDB,这是一个新型的数据管理系统,旨在嵌入到其他进程中执行分析型SQL查询。在我们的演示中,我们将DuckDB与其他数据管理解决方案进行对比,以展示其在嵌入式分析场景中的性能。DuckDB作为开源软件,采用许可性许可证发布。

2025-02-26 22:51:08 1043

原创 监督微调(SFT):自然语言处理中的精细化调优技术

监督微调(SFT)作为一种重要的技术手段,在自然语言处理和人工智能领域发挥着关键作用。通过在预训练模型的基础上进行特定任务的微调,SFT能够显著提升模型的性能,使其更好地适应特定场景的需求。尽管SFT在数据隐私、模型偏见和可解释性等方面面临一些挑战,但随着技术的不断进步,这些问题有望得到解决。未来,SFT将继续在多个领域发挥重要作用,为人工智能的发展提供有力支持。

2025-02-05 12:50:47 976

原创 强化学习(Reinforcement Learning):智能决策的前沿探索

强化学习作为机器学习的重要分支,通过模拟智能体与环境的交互,为解决复杂的决策问题提供了一种强大的工具。从基本概念到实际应用,强化学习涵盖了丰富的理论基础和广泛的应用场景。尽管其发展仍面临诸多挑战,但随着技术的不断进步,强化学习有望在未来实现更广泛的应用和更深远的影响。通过不断探索和创新,强化学习将在人工智能的广阔舞台上发挥更大的作用,为人类社会的发展做出重要贡献。

2025-02-05 12:36:30 1178

原创 DuckDB:最快的表排序 - 重新设计 DuckDB 的排序功能

数据库系统出于多种目的使用排序,最明显的是当用户在查询中添加ORDER BY子句时。排序还用于操作符内部,例如窗口函数。DuckDB 最近改进了其排序实现,现在能够并行排序,并且可以排序比内存中更多的数据。在这篇文章中,我们将看看 DuckDB 是如何排序的,以及这与其他数据管理系统相比如何。

2025-01-26 23:59:43 965

原创 DuckDB:Catalog、Schema、Table 数据组织结构简介

DuckDB 的 Catalog、Schema 和 Table 提供了一种强大的数据组织和管理机制。通过合理使用 Catalog 和 Schema,可以有效地隔离和管理数据,提高数据的可维护性和可访问性。希望这些内容能帮助你更好地理解和使用 DuckDB 的 Catalog、Schema 和 Table。如果你有更多问题,可以参考 DuckDB 的官方文档或加入 DuckDB 的社区获取更多帮助。

2025-01-26 11:27:02 711

原创 DuckDB:灵活扩展机制

DuckDB 拥有一个灵活的扩展机制,允许动态加载扩展。这些扩展。扩展可以在所有客户端(例如 Python 和 R)上加载。通过核心和社区仓库分发的扩展在 macOS、Windows 和 Linux 上构建和测试。所有操作系统均支持 AMD64 和 ARM64 架构。

2025-01-25 01:06:32 1166

原创 DuckDB:详细解读 TableRef 类

TableRef 及其子类的设计体现了 DuckDB 对灵活性、扩展性和模块化的追求。通过抽象基类和多种子类的实现,DuckDB 能够高效地处理各种复杂的查询场景,支持多种数据源和查询逻辑。这种设计不仅提升了系统的可维护性,也为开发者提供了强大的功能扩展能力。

2025-01-25 00:39:24 845

原创 依赖管理在 DuckDB 扩展中的应用

TL;DR:尽管 DuckDB 核心代码没有外部依赖,但构建带有依赖的扩展现在变得非常简单,内置支持 vcpkg,这是一个支持超过 2000 个 C/C++包的开源包管理器。有兴趣自己构建扩展吗?请查看扩展模板。

2025-01-24 23:40:47 821

原创 基于Canvas的吃豆人小游戏(附完整源码,TypeScript)

吃豆人(Pac-Man)是一款经典的街机游戏,自1980年推出以来,一直是游戏界的标志性作品。玩家控制一个黄色的小圆点,在迷宫中移动,吃掉所有的豆子,同时躲避追逐的幽灵。当玩家触碰到幽灵时,游戏结束。这款游戏不仅考验玩家的反应能力,还考验策略和规划能力。在本项目中,我们将使用TypeScriptReact和来实现一个简化版的吃豆人游戏。通过这个项目,你将了解到如何结合现代前端技术来实现经典游戏的复刻,并掌握游戏开发中的一些核心技术。

2025-01-24 08:12:29 631

原创 DuckDB:QueryProfiler(查询分析器)

用户可以通过动态启用或禁用特定的性能指标。QueryProfiler 是 DuckDB 中用于查询性能分析的强大工具。它通过和多种性能指标,帮助用户深入理解查询的执行过程和性能瓶颈。通过灵活的配置和多种输出格式,用户可以轻松地分析和优化查询性能。如果你需要更深入地了解的实现细节,可以参考 DuckDB 的源码文件:••这些文件中包含了的具体实现和使用方式。//!

2025-01-24 08:05:28 938

原创 C++新年烟花代码(附源码,基于SFML3.0、C++17实现)

烟花燃放效果是一种极具视觉冲击力的动画效果,常用于庆祝节日、活动开场或游戏特效。使用 C++ 和 SFML 实现烟花效果,不仅可以提升程序的性能,还能通过代码的可维护性和扩展性,为开发者带来更高效的开发体验。本文将详细介绍如何使用 C++ 和 SFML 实现一个绚丽的新年烟花燃放效果,并探讨其在实际项目中的应用场景。C++17:提供高性能和面向对象编程的支持。SFML 3.0:一个跨平台的多媒体库,支持图形、音频、输入和网络等功能。随机数生成器:用于生成随机的烟花位置、颜色和粒子运动轨迹。

2025-01-24 01:08:00 1934 3

原创 TypeScript小游戏开发-吃豆人(附源码,趣味编程)

吃豆人(Pac-Man)是一款经典的街机游戏,自1980年推出以来,一直是游戏界的标志性作品。玩家控制一个黄色的小圆点,在迷宫中移动,吃掉所有的豆子,同时躲避追逐的幽灵。当玩家触碰到幽灵时,游戏结束。这款游戏不仅考验玩家的反应能力,还考验策略和规划能力。在本项目中,我们将使用TypeScriptReact和来实现一个简化版的吃豆人游戏。通过这个项目,你将了解到如何结合现代前端技术来实现经典游戏的复刻,并掌握游戏开发中的一些核心技术。

2025-01-23 23:59:47 135

原创 基于SFML3.0的C++17新年烟花代码(附源码,蛇年大吉)

烟花燃放效果是一种极具视觉冲击力的动画效果,常用于庆祝节日、活动开场或游戏特效。使用 C++ 和 SFML 实现烟花效果,不仅可以提升程序的性能,还能通过代码的可维护性和扩展性,为开发者带来更高效的开发体验。本文将详细介绍如何使用 C++ 和 SFML 实现一个绚丽的新年烟花燃放效果,并探讨其在实际项目中的应用场景。C++17:提供高性能和面向对象编程的支持。SFML 3.0:一个跨平台的多媒体库,支持图形、音频、输入和网络等功能。随机数生成器:用于生成随机的烟花位置、颜色和粒子运动轨迹。

2025-01-23 23:58:13 571

原创 TypeScript新年烟花代码(附源码,趣味编程)

快过年了,大家蛇年大吉,希望新的一年能有人陪你一同看烟火!!!!!烟花燃放效果是一种极具视觉冲击力的动画效果,常用于庆祝节日、活动开场或网站特效。使用 TypeScript 和 HTML5 Canvas 实现烟花效果,不仅可以提升页面的美观度,还能通过代码的可维护性和扩展性,为开发者带来更高效的开发体验。本文将详细介绍如何使用 TypeScript 和 HTML5 Canvas 实现一个绚丽的烟花燃放效果,并探讨其在实际项目中的应用场景。TypeScript:提供类型安全和代码结构化的优势。

2025-01-23 00:24:10 1039 4

原创 DuckDB:详细解析CMakeLists.txt

CMake(Cross-Platform Make)是一种跨平台的构建系统生成器,用于管理和自动化软件的构建过程。它通过编写配置文件(通常是 CMakeLists.txt)来定义项目的构建规则,支持多种编译器和操作系统,能够生成本地化的构建文件(如 Makefile、Visual Studio 解决方案等)。跨平台项目:需要在多种操作系统上构建和部署的项目。大型项目:包含多个模块和依赖的复杂项目。团队开发:需要统一构建流程和配置的团队开发环境。

2025-01-22 00:29:57 790

原创 ClickHouse 字符串替换函数

函数,它根据参数中列出的值(字符串、整数、浮点数等)格式化给定的字符串。不在大括号中的内容被视为普通文本,并原样复制到输出中。假设字符串包含有效的 UTF-8 编码文本。按照 Python 中类似的格式化方式,使用参数列表中的值(字符串、整数等)格式化。和后续格式说明符之间的内容都被视为普通文本,并原样复制到输出中。一般字符串操作函数和用于字符串搜索的函数,可参考:。同时请注意,字符串字面量需要额外的转义。中要被替换的片段的长度。中要被替换的片段的长度。:用于替换的字符串。:用于替换的字符串。

2025-01-21 01:07:14 1371

原创 ClickHouse 字符串操作函数

涵盖了字符串的检查、转换、编码、解码、相似度计算、格式化以及提取等功能。这些函数不仅适用于 ASCII 字符串,还支持 UTF-8 编码的 Unicode 字符串,能够满足多种复杂的字符串处理需求

2025-01-21 00:48:35 932

原创 ClickHouse 字符串搜索函数

详细介绍了 ClickHouse 中用于字符串搜索的函数,包括基本搜索、正则表达式匹配、不区分大小写和 UTF-8 编码的支持,以及计算字符串相似度和子序列匹配等功能。

2025-01-21 00:23:37 1010

原创 【轻松掌握数据结构与算法】其他杂项

在本系列文章的旅程中,我们深入探索了数据结构与算法的核心概念,从基础的变量和数据类型,到复杂的树、图、排序与搜索算法,再到算法设计技巧和复杂度分析。通过丰富的示例、问题与解决方案,我们不仅掌握了理论知识,更学会了如何将这些知识应用于实际编程和问题解决中。数据结构与算法是计算机科学的基石,它们为软件开发、系统设计和技术创新提供了坚实的基础。无论你是初学者,还是准备面试、参加竞赛,亦或是希望在技术领域进一步提升的开发者,这本书都为你提供了全面而深入的指导。

2025-01-21 00:05:36 233

原创 【轻松掌握数据结构与算法】复杂性类:理解算法的效率和可行性

复杂性类是理解算法效率和可行性的重要工具。通过了解不同复杂性类的定义和关系,你可以更好地选择和设计算法,解决实际问题。希望本文的示例和图表能帮助你更好地理解和掌握复杂性类。

2025-01-20 23:48:57 761

原创 【轻松掌握数据结构与算法】动态规划

动态规划和记忆化搜索是相辅相成的。分治法和动态规划的主要区别在于,分治法中的子问题是相互独立的,而在DP中子问题可能会重叠。通过使用记忆化搜索(维护一个已解决子问题的表格),动态规划将许多问题的指数级复杂度降低到多项式级复杂度(O(n²)、O(n³)等)。递归:递归地解决子问题。记忆化:将已计算的值存储在表格中(记忆化意味着缓存)。动态规划 = 递归 + 记忆化。

2025-01-20 23:41:59 1378

原创 【轻松掌握数据结构与算法】分治算法

分解:将问题分解为本身是同一类型问题的较小实例的子问题。递归:递归地解决这些子问题。合并:适当地组合它们的答案。分治法是一种通过递归地将问题分解成较小的子问题,解决这些子问题,然后合并它们的解来解决原问题的算法策略。

2025-01-19 23:44:20 964

原创 【轻松掌握数据结构与算法】贪心算法

贪心算法分阶段工作。在每个阶段,都会做出在该点看起来不错的决策,而不考虑未来的后果。通常,这意味着选择某种局部最优解。它假设局部最优选择也能构成全局最优解。贪心算法通过在每一步选择当前最优解,希望最终得到全局最优解,但并不总是有效。

2025-01-17 01:26:50 834

原创 【轻松掌握数据结构与算法】算法设计技巧

在前面的章节中,我们已经看到了许多用于解决不同类型问题的算法。在解决新问题之前,通常的做法是寻找当前问题与其他已解决问题之间的相似性。这有助于我们更容易地找到解决方案。在本章中,我们将探讨算法的不同分类方法,并在后续章节中重点介绍其中的几种(贪心算法、分治算法、动态规划)。

2025-01-17 00:51:28 892

原创 DuckDB:在Apache Arrow上使用SQL

DuckDB可以查询多种不同类型的Apache Arrow对象。

2025-01-16 01:33:32 340

原创 DuckDB:使用DuckDB进行Python数据分析指南

在本教程中,我们查看了如何使用DuckDB进行Python数据分析。我们使用了CSV文件。但你可以以相同的方式使用parquet和JSON文件以及关系数据库。所以,是的,DuckDB是分析Python中大型数据集的有用工具,也是你的Python数据分析工具箱中相当有用的补充。我建议在你的下一个数据分析项目中使用DuckDB。编码愉快!

2025-01-16 01:17:50 1266

原创 DuckDB:为什么选择DuckDB

市面上有许多数据库管理系统(DBMS)。但没有一种通用的数据库系统。所有系统都通过不同的权衡来更好地适应特定用例。DuckDB也不例外。在这里,我们尝试解释DuckDB的目标以及我们如何通过技术手段实现这些目标。首先,DuckDB是一个关系型(面向表格的)DBMS,支持结构化查询语言(SQL)。

2025-01-16 01:02:24 1036

原创 SED命令及示例|第2部分

我们在《SED命令及示例》中讨论了一些SED命令选项。SED用于查找、过滤、文本替换、替换以及文本操作,如插入、删除、搜索等。它是Linux/Unix系统提供的一款强大工具。我们可以将SED与正则表达式一起使用。希望你至少具备Linux正则表达式的基本知识。它提供非交互式文本文件编辑,因此用于自动化编辑,并且有两个缓冲区——模式缓冲区和保持缓冲区。SED_在读取文件时使用_模式缓冲区,逐行读取,当前读取的行被插入到模式缓冲区,而_保持缓冲区_是长期存储,它捕获信息、存储信息,并在需要时重新使用。最初,这两个

2025-01-16 00:16:54 747

原创 Sed命令及示例

Unix/Linux中的SED(流编辑器)命令是一个强大的工具,用于处理和操作文件中的文本。它无需打开文件编辑器即可执行多种操作,如搜索、查找替换、插入、删除等。这使得它成为管理和编辑文本的高效工具,特别是在处理大文件或在脚本中自动化任务时。• SED是一个强大的文本流编辑器。可以执行插入、删除、搜索和替换(substitution)操作。• Unix中的SED命令支持正则表达式,这使其能够执行复杂的模式匹配。语法:其中,• ‘OPTIONS’:这些是可选标志,用于修改sed命令的行为。• ‘SCRIPT

2025-01-15 23:54:18 871

原创 DuckDb:Push-Based Execution 查询执行模式

在传统的 Pull-Based Execution 中,数据是由下至上从数据源逐级拉取的,每个操作符等待其下一级操作符提供数据,而在 Push-Based Execution 中,数据是由上至下主动推送的,操作符在准备好数据后将其向下推送至下一级操作符。如果你对 Push-Based Execution 的某个具体方面,如操作符的具体实现、流水线的详细构建过程,或者与其他技术的结合使用感兴趣,可以继续向我提供更详细的信息,我会为你提供更深入的解释和帮助。

2025-01-15 21:32:55 1348

原创 【轻松掌握数据结构与算法】字符串算法(String Algorithms)

字符串匹配算法是计算机科学中的一个重要领域,主要用于在文本中查找特定模式(子字符串)的出现位置。这些算法在文本编辑器、搜索引擎、生物信息学等领域有广泛的应用。字符串匹配算法在计算机科学中有广泛的应用。暴力法、Rabin-Karp 算法、有限自动机、KMP 算法和 Boyer-Moore 算法是几种常见的字符串匹配算法,每种算法都有其特定的用途和优缺点。此外,哈希表、二叉搜索树、字典树、三叉搜索树和后缀树是用于存储和处理字符串的常用数据结构。希望这些示例代码和输入输出能帮助您更好地理解和应用字符串算法。

2025-01-14 10:45:00 1172

原创 【轻松掌握数据结构与算法】哈希(Hashing)

哈希表是一种非常高效的数据结构,适用于快速查找、插入和删除操作。通过合理设计哈希函数和冲突解决策略,可以显著提高哈希表的性能。布隆过滤器则是一种空间高效的概率型数据结构,适用于测试元素是否属于某个集合。希望这些示例代码和输入输出能帮助您更好地理解和应用哈希技术。

2025-01-14 01:13:35 1012

原创 【轻松掌握数据结构与算法】符号表(Symbol Tables)

通过上述内容,我们可以看到符号表在编译器和解释器中的重要性,以及如何实现和使用符号表。希望本文能帮助你更好地理解和实现符号表。

2025-01-14 00:44:23 1239

原创 【轻松掌握数据结构与算法】选择算法(中位数)

选择算法的目标是在未排序的列表中找到第 k 小的元素。当 k 等于列表长度的一半时,这个问题就变成了寻找中位数的问题。选择算法在数据处理、统计分析以及各种优化问题中都有广泛的应用。通过上述分析和示例代码,我们可以看到选择算法在不同场景下的应用和优化方法。这些算法在实际数据处理中非常有用,能够帮助我们高效地找到所需的元素。

2025-01-14 00:13:52 882

原创 【轻松掌握数据结构与算法】搜索算法

搜索算法的目标是在给定的数据结构中找到一个特定的元素。搜索可以分为两类:无序搜索和有序搜索。无序搜索适用于未排序的数据,而有序搜索则适用于已排序的数据。本章详细介绍了多种搜索算法,包括线性搜索、二分搜索、插值搜索、符号表和哈希表、字符串搜索算法等。每种算法都有其适用场景和性能特点。通过理解这些算法的原理和实现,可以更好地选择合适的搜索算法来解决实际问题。

2025-01-13 23:01:09 790

原创 【轻松掌握数据结构与算法】排序算法

排序是将一系列数据元素按照特定顺序排列的过程。排序算法可以分为内部排序和外部排序。内部排序在内存中完成,而外部排序需要使用外部存储设备。

2025-01-12 16:42:52 997 1

原创 【轻松掌握数据结构与算法】图算法

通过以上对图算法的深入探讨,我们可以看到这些算法在计算机科学的各个领域都有着广泛的应用。无论是在算法设计、数据存储还是网络通信中,图算法都扮演着不可或缺的角色。希望这篇文章能帮助你更好地理解和应用这些强大的算法。

2025-01-12 15:13:32 768

原创 【轻松掌握数据结构与算法】不相交集合

不相交集合 ADT 是一种非常有用的数据结构,通过路径压缩和按秩合并,可以高效地处理集合的合并和查找操作。这种数据结构在图算法、网络流问题和并查集问题中非常有用。

2025-01-12 14:51:33 980

原创 【轻松掌握数据结构与算法】优先队列和堆

优先队列是一种抽象数据类型,它支持在一组元素中插入元素,并且能够高效地删除具有最高优先级的元素。优先队列通常用于调度算法、事件驱动的模拟和图算法中。

2025-01-12 14:39:06 586

原创 【轻松掌握数据结构与算法】树的奥秘:从基础到高级应用

树是一种非线性的数据结构,它由节点组成,每个节点可以有多个子节点,但只有一个父节点。树的顶部节点称为根节点,它是树的起点。树的结构使得数据可以以层次化的方式进行组织和存储,这在很多实际应用中都非常有用,比如文件系统的目录结构、组织架构图等。

2025-01-12 14:28:46 937

基于TypeScript+Canvas实现的吃豆人(pacman)小游戏源码

基于TypeScript+Canvas实现的吃豆人(pacman)小游戏源码

2025-01-24

C++17新年烟花代码(基于SFML3.0)

C++17新年烟花代码(基于SFML3.0)

2025-01-24

基于 TypeScript 实现绚丽烟花燃放效果的源码文件

基于 TypeScript 实现2025新年绚丽烟花燃放效果的源码文件,祝各位蛇年大吉,所愿皆成

2025-01-23

任意时刻GPS导航电文生成软件

GPS导航电文生成软件基于QT开发,可生成任意时刻的GPS卫星导航电文,此版本为永久试用版,支持当前,过去,未来任意时刻的GPS导航电文模拟,可有效辅助诸多GNSS项目进行场景试验,软件调测等。该软件主界面支持GNSS系统选择、电文包含参数、模拟时刻、模拟时长以及电文存储路径等相关设置。完成基本设置后,点击生成导航电文按钮即可完成对应系统的导航电文生成。如对正式版软件感兴趣可联系本人获取,keep_dying@163.com。

2023-08-06

模拟2018年3月28日GPS卫星导航电文(时长5分钟)

此文件为GNSS导航电文模拟生成软件运行生成,模拟时刻为UTC时间,设置为2018年3月28日11时58分30秒,时长设置为5min,包含所有GPS卫星的原始电文,用于测试电文生成软件的有效性。

2018-03-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除