自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 收藏
  • 关注

原创 用电子电路解锁AI的秘密:一篇论文的奇思妙想

理解ICL和CoT如何协同工作;预测模型在不同任务上的表现;优化AI策略,甚至创造新的方法。从数学竞赛到科学研究,ECM都展现了它的价值。未来,随着AI越来越复杂,像ECM这样的框架可能会成为设计智能系统的基础,就像电路设计之于电子工程一样重要。下次你用ChatGPT解决问题时,不妨想象一下:它体内有个小电路,电压和电阻正忙着为你点亮答案的“灯泡”。而ECM,就是帮我们调好这个电路的“说明书”。想了解更多细节?GitHub链接。快去看看吧,也许你也能从中找到灵感,打造属于自己的AI“电路”!

2025-04-01 14:50:58 634

原创 PKU: Agent 是否能够具有同理心?

随着机器人、虚拟助手和AI驱动的化身(统称为“具身代理”,embodied agents)逐渐融入我们的日常生活,人们开始思考一个核心问题:这些代理能否真正展现出与人类情感共鸣的同理心?同理心(empathy)是人类互动的基石,使我们能够理解他人的情感并做出适当回应。然而,在具身代理的研究中,这一关键能力长期被忽视。论文直面这一问题,提出了——首个专门用于评估和提升具身代理同理心能力的基准测试。本篇博客将深入剖析这篇论文的动机(Motivation)、方法(Method)以及其潜在影响(Impact)

2025-03-30 22:56:37 908

原创 大型语言模型的秘密:思考链长度与提示格式的魔力

首先,咱们来简单了解一下 COT。想象一下,你在教一个孩子解数学题。你不仅告诉他答案,还一步步地解释你是如何得出这个答案的,比如:“首先,我看到有 3 个苹果,又拿了 2 个,所以总共是 5 个。”这种“边想边说”的方法就是 COT 的核心。在 LLMs 中,COT 提示通过在问题后添加“让我们一步步思考”这样的引导,让模型在生成答案前先进行一系列的推理步骤。这种方法在数学、逻辑和常识推理等任务上表现尤为出色。总的来说,这两项研究揭示了 LLMs 行为的一些深层机制。COT 的长度和prompt 的格式。

2025-03-28 19:52:02 1071

原创 LLaVA-MoD: Making LLaVA Tiny via MoE-Knowledge Distillation

从最近 MoE 在语言建模中的成功中汲取灵感,他们设计了一种 MoE 结构集成到 s-MLLM 中,以在缩小规模的同时,通过在蒸馏过程中稀疏激活的专家来保持捕捉复杂多模态知识的能力。这是一个新型框架,旨在通过从大规模多模态语言模型(l-MLLM)中提取知识,实现小规模多模态语言模型(s-MLLM)的高效训练。在 D2D 中,我们使用标准的知识蒸馏损失(KD Loss),通过通用描述和对话数据集,对齐初始化的密集 s-MLLM 和 l-MLLM 的输出 logits 分布。

2025-03-12 20:47:17 727

原创 DeepSeek-R1 论文笔记:通过强化学习提升大语言模型的推理能力

在复杂推理任务(如数学证明或多步骤逻辑推理)中,如何将整体任务分解为明确、可评估的细粒度步骤存在挑战。不同方法可能涉及不同的合理步骤,而缺乏统一标准会导致PRM评估的模糊性。

2025-03-02 17:20:18 1025 2

原创 经典背包问题详解:从0-1背包到分组背包

背包类型物品限制遍历顺序时间复杂度0-1背包每个物品选1次逆序O(NV)完全背包物品无限正序O(NV)多重背包物品选s[i]次二进制拆分优化O(NVlogS)分组背包每组选一个物品组外逆序O(KV*M)

2025-02-21 22:01:08 1063

原创 从3个元素到n个元素:容斥原理的直观理解与公式推导

容斥原理(Inclusion-Exclusion Principle)是组合数学中一个非常重要的工具,用于计算多个集合的并集大小。它的核心思想是通过“加加减减”的方式,避免重复计数,从而准确地求出多个集合的并集大小。本文将从3个元素的容斥原理出发,逐步推导出n个元素的容斥原理公式,并给出直观的解释。

2025-02-13 15:10:16 915

原创 探索数论:线性同余方程与中国剩余定理

在数论和计算机科学中,线性同余方程和中国剩余定理是两个非常重要的概念,它们不仅在理论上具有深刻的意义,而且在实际应用中也有着广泛的应用,例如密码学、计算机代数系统、编码理论等领域。本文将深入浅出地讲解线性同余方程和中国剩余定理的数学原理,并介绍相关的求解算法。线性同余方程是指形如以下形式的方程:其中,, , 是已知整数, 是未知整数, 表示模 运算。该方程的含义是:存在一个整数 ,使得 。线性同余方程的解的性质取决于 , , 之间的关系:求解线性同余方程的常用方法是扩展欧几里得算法。该算法不仅可以求

2025-02-13 12:25:25 753

原创 探索数论:欧拉函数的原理

欧拉函数(Euler’s Totient Function),记作ϕn,是数论中的一个重要函数,用于计算小于或等于正整数n且与n互质的正整数的个数。换句话说,欧拉函数ϕn给出了在1到n之间与n互质的整数的数量。

2025-02-12 15:50:47 973

原创 探索乘法逆元:模运算下的新概念

本文介绍了乘法逆元相关的数论知识,并结合代码,介绍了扩展欧几里得算法。

2025-02-12 11:29:04 805

原创 探索约数:试除法,约数之和,最大公约数

通过本文的介绍,读者可以掌握约数相关算法的原理和步骤。希望本文能够帮助读者深入理解约数及其应用。如果你对约数或其他数论算法有更多疑问,欢迎在评论区留言讨论!

2025-02-11 20:32:41 1405

原创 探索质数:从试除法到质数筛

通过本文的介绍,读者可以掌握质数相关算法的原理、实现方法以及应用场景。希望本文能够帮助读者深入理解质数及其相关算法。如果对质数或其他数论算法有更多疑问,欢迎在评论区留言讨论!

2025-02-11 17:37:54 660

原创 探索二分图:染色法与匈牙利算法

染色法:用于判定图是否为二分图,时间复杂度为OVEO(V + E)OVE。匈牙利算法:用于求解二分图的最大匹配,时间复杂度为OV×EOV×E。通过本文的介绍,读者可以掌握二分图的基本概念、染色法判定二分图的原理、匈牙利算法进行二分图匹配的原理与实现。希望本文能够帮助读者深入理解二分图及其应用。

2025-02-11 14:52:20 1322

原创 拓扑排序:任务调度背后的逻辑

给定一个有向无环图GVEG = (V, E)GVE,拓扑排序是将图中所有顶点排成一个线性序列,使得对于每一条有向边uv(u, v)uv,顶点uuu在顶点vvv之前。拓扑排序是解决有向无环图中依赖关系问题的有效算法。通过本文的介绍,读者可以掌握拓扑排序的定义、原理、实现方法以及应用场景。结合代码实现和题目讲解,希望读者能够深入理解拓扑排序,并在实际问题中灵活运用。如果你对拓扑排序或其他图论算法有更多疑问,欢迎在评论区留言讨论!

2025-02-11 00:02:41 1056

原创 探索图的遍历方式:深度优先遍历与宽度优先遍历

重心是指树中的一个结点,如果将这个点删除后,剩余各个连通块中点数的最大值最小,那么这个节点被称为树的重心。

2025-02-10 15:49:05 673

原创 探索图论算法:最小生成树的构建之道(二)

本文将详细介绍Kruskal算法的背景、理论推导、正确性证明,并与Prim算法进行对比,帮助读者深入理解这两种算法的核心思想及其适用场景。Kruskal算法是一种高效且直观的最小生成树算法,其贪心选择性质保证了算法的正确性。与Prim算法相比,Kruskal算法更适合边数较少的场景,而Prim算法更适合顶点数较少的场景。Kruskal算法是一种贪心算法,用于在加权连通图中找到最小生成树。Kruskal算法的核心在于其贪心选择性质:每次选择当前最优的边(即最小权重的边)加入生成树,并确保不形成环。

2025-02-10 11:29:31 942

原创 探索图论算法:最小生成树的构建之道(一)

Prim算法是一种高效且直观的最小生成树算法,其贪心选择性质保证了算法的正确性。通过优先队列的优化,Prim算法的时间复杂度可以进一步降低,适用于大规模图的处理。理解Prim算法的核心思想和实现细节,不仅有助于解决实际问题,也为学习其他图论算法奠定了坚实的基础。其基本思想是从一个顶点开始,逐步扩展生成树,每次选择一条连接生成树和非生成树顶点的最小权重边,直到所有顶点都被包含在生成树中。Prim算法的核心在于其贪心选择性质:每次选择当前最优的边(即最小权重的边)加入生成树。是最小生成树的一部分。

2025-02-10 10:05:43 863

原创 SPFA算法详解:高效的单源最短路径算法

介绍spfa算法求解最短路和判断负环的思路

2025-02-09 12:18:39 791

原创 Bellman-Ford算法详解:带限制的最短路径算法

详细介绍Bellman-Ford算法,并解释其检测负环的原理

2025-02-09 10:37:01 1063

原创 Floyd算法:多源最短路径的经典解法

FloydFloydFloyd算法是一种用于求解多源最短路径问题的动态规划算法,由RobertWFloydRobertWFloyd于196219621962年提出。它能够计算图中任意两点之间的最短路径,适用于带权有向图或无向图,且可以处理负权边(但不能处理负权环)。Floyd算法是解决多源最短路径问题的经典算法,适用于中小规模的图。通过动态规划的思想和三重循环的实现,它能够高效地计算任意两点之间的最短路径。

2025-02-08 18:33:44 628

原创 Dijkstra算法:从理论到实践

Dijkstra算法是解决单源最短路径问题的经典算法,由荷兰计算机科学家Edsger W. Dijkstra于1956年提出。它适用于带权有向图或无向图,且权重必须为非负数。Dijkstra算法是图论中最基础且重要的算法之一。通过本文的代码实现和详细解析,读者可以深入理解其工作原理,并掌握如何在实际问题中应用该算法。无论是学术研究还是工程实践,Dijkstra算法都是不可或缺的工具。通过不断学习和实践,我们可以在算法的世界中走得更远!

2025-02-08 16:25:00 987

原创 双向BFS:八数码问题的高效解法

双向BFS通过巧妙的双向夹逼策略,在八数码问题中展现了惊人的效率。这种算法思想启示我们:当面对复杂问题时,换个角度思考,往往能找到突破困境的新路径。正如计算机科学大师Dijkstra所说:“问题的解决往往不在于更强的算力,而在于更聪明的策略。

2025-02-08 11:43:31 1026

原创 广度优先搜索(BFS)算法详解——以走迷宫问题为例

通过走迷宫问题,我们不仅掌握了BFS的精髓,更体会到算法设计中"简单与高效"的完美统一。从古老的迷宫谜题到现代的网络路由,BFS算法始终闪耀着智慧的光芒。当您下次面对复杂问题时,不妨想想这个简单的队列,它或许就是打开问题之门的钥匙。思考题:如何修改算法使其可以输出具体的最短路径?tips:试着维护一个ppp数组,记录每一个走过的节点的父节点试试呢)

2025-02-07 21:58:16 1348

原创 深入浅出深度优先搜索(DFS)——以经典N皇后问题为例

想象你面前有一张8∗88 * 88∗8的国际象棋棋盘,现在需要摆放888个皇后,使得任意两个皇后都无法互相攻击。这个看似简单的谜题,自184818481848年被提出以来吸引了无数数学家与计算机科学家的目光。当我们把棋盘扩展到N∗NN*NN∗N规格时,就诞生了著名的N皇后问题。本文将带您通过这个经典问题,深入理解深度优先搜索(DFS)这一重要的算法思想。深度优先搜索(Depth-First Search)采用"不撞南墙不回头"的策略,其运行过程就像探险者深入洞穴:1.3 算法特性分析时间复杂度:O(b

2025-02-07 20:53:43 1020

原创 深入理解KMP算法:高效字符串匹配

KMP算法是一种用于在文本串中查找模式串的高效算法。它的核心在于利用模式串的部分匹配表(也称为next数组或ne数组),在匹配失败时跳过不必要的比较,从而减少匹配次数。关于KMP与朴素字符串匹配算法的区别可以参照下图感受一下。nextnext[i]表示模式串p中,从第1个字符到第i个字符组成的子串(即p[1...i])的最长相同前缀和后缀的长度。前缀是指从第1个字符开始的子串,后缀是指以第i个字符结尾的子串。next。

2025-02-06 18:56:52 1063

原创 深入理解Trie树:高效存储与查询字符串

Trie树是一种树形数据结构,通常用于处理字符串。它的每个节点代表一个字符,从根节点到某个节点的路径表示一个字符串的前缀。Trie树的一个重要特性是,具有相同前缀的字符串会共享路径上的节点,这使得它在处理大量字符串时非常高效。Trie树是一种非常强大的数据结构,特别适合处理字符串的存储和查询。通过共享字符串的公共前缀,Trie树能够显著减少存储空间,并且在查询时具有极高的效率。

2025-02-06 09:42:18 960

原创 哈希表与散列表的原理及C++实现

哈希表(Hash Table)是一种高效的数据结构,用于存储键值对(Key-Value Pairs)。它通过哈希函数(Hash Function)将键(Key)映射到一个固定大小的数组(称为散列表)中的某个位置,从而实现快速的插入、查找和删除操作。哈希表的核心思想是通过哈希函数将键转换为数组的索引,从而直接访问对应的值。理想情况下,哈希表的插入、查找和删除操作的时间复杂度都是O(1)。哈希表是一种高效的数据结构,通过哈希函数将键映射到数组索引,从而实现快速的插入、查找和删除操作。

2025-02-05 20:39:15 1163

原创 堆(Heap)的原理与C++实现

堆(Heap)是一种特殊的树形数据结构,通常用于实现优先队列。最大堆(Max Heap):每个节点的值都大于或等于其子节点的值。最小堆(Min Heap):每个节点的值都小于或等于其子节点的值。堆通常是一个完全二叉树,这意味着除了最后一层,其他层都是完全填满的,并且最后一层的节点都尽可能地靠左排列。堆是一种非常高效的数据结构,特别适用于需要频繁获取最大或最小元素的场景。通过数组实现堆,可以充分利用其完全二叉树的性质,使得插入、删除和构建堆的操作都能在 O(log n) 的时间内完成。

2025-02-05 17:49:21 1541

原创 K-means算法优化:三种进阶方法详解

收敛速度慢陷入局部最优聚类结果不稳定K-means++通过概率选择随机选择第一个质心计算每个点到最近质心的距离DxD(x)Dx按概率Dx2D(x)^2Dx2选择下一个质心重复直到选出k个质心传统K-means需要每次迭代计算所有数据点,计算开销大。每次迭代随机采样一个小批量(mini-batch)仅用这批数据更新质心引入学习率逐步调整质心位置将数据映射到高维特征空间在高维空间执行K-means使用核技巧避免显式计算高维映射Kxyexp⁡−。

2025-02-04 18:19:18 960

原创 解密K-means:简单易懂的算法指南

想象你在超市整理货架:把饮料放在一起,零食归为一类,日用品另放一个区域——这个过程本质上就是聚类。在机器学习中,聚类算法就是帮计算机自动完成这种分类任务的工具。关键特点无监督学习:不需要预先标记的数据发现数据内在结构适用于客户分群、图像分割、文档归类等场景K-means算法就像一位严谨的交通指挥员,通过不断调整"集合点"的位置,最终让数据点找到属于自己的最优归属。理解这个算法的核心在于把握"距离最小化"和"迭代优化"的思想,这也是许多机器学习算法的共同精髓。思考题。

2025-02-04 17:44:46 982

原创 特征缩放:深入理解标准化与归一化

理解特征缩放的本质是掌握现代机器学习的重要基础。标准化通过方差对齐消除量纲差异,而归一化通过边界约束实现尺度统一。实际应用中建议通过交叉验证对比两种方法的效果,根据具体数据和算法特性做出最佳选择。

2025-02-04 16:29:56 533

原创 扩展域并查集 & 带权并查集

扩展域并查集通过拆分域来表示复杂关系,逻辑直观且易于理解。虽然空间开销较大,但在处理复杂关系问题时非常高效。带权并查集通过维护权值来表示节点之间的关系,路径压缩和权值更新确保了高效的关系推导。虽然逻辑稍复杂,但代码简洁且高效,适合处理类似食物链的问题。

2025-02-04 14:50:09 950

原创 线性回归简介:从理论到应用

线性回归是一种用于预测数值型结果的统计方法,它通过建立一个或多个自变量(输入特征)与因变量(输出目标)之间的线性关系模型来工作。在最简单的形式中,即简单线性回归,仅涉及一个自变量和一个因变量,而多变量线性回归则考虑了多个自变量。

2025-01-31 16:25:40 1630

原创 图数据库 & Cypher语言

属性图是一种广泛用于建模关系数据的图数据结构,它将**顶点(节点)

2024-11-27 11:26:34 1141

原创 MongoDB 语法简析

MongoDBMongoDB是通用型文档数据库,存储模型为BSON(Binary JSON)文档。由C++语言编写,旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。MongoDB 的增删改查操作MongoDB 是一种 NoSQL 数据库,使用文档(document)存储数据,具有灵活的 JSON 样式结构。以下是 MongoDB 在增删改查(CRUD)操作中的具体实现及查询细节。1. 插入(Create)MongoDB 使用 insert 方法向集合中添加文档,常用命令包括:ins

2024-11-27 11:04:58 1296

原创 XML & JSON

定义版本和编码方式。:每个 XML 文件有且仅有一个根元素。</:嵌套结构表示父子关系。</</:为标签添加额外信息。</

2024-11-27 11:00:13 1251

原创 Redis核心类型----有序集合

Redis是一个key-value存储系统,和Memcached类似,Redis以内存作为数据存储介质,所以读写数据的效率极高,远远超过数据库。。

2024-11-26 20:30:28 812

原创 Dynamo----键值对系统实例

Dynamo 是一种分布式高可用的 NoSQL 数据库,主要特点是通过多副本存储与一致性协议来保障高可用性。当客户端发起写请求时,数据被写入多个副本节点,确保高可用性和容错能力。写请求被发送到负责协调的节点(称为),由它生成一个新的数据版本,并使用向量时钟 ( vector clock ) 进行版本管理。Coordinator 节点将新数据保存到自身。Coordinator 将写操作分发给中的所有副本节点(一个优先节点列表,记录了可能存储该数据的多个副本节点)。

2024-11-26 20:23:01 1069

原创 Memcached----键值对系统实例

Memcached 是一种分布式的内存缓存系统,其设计目标是提升高并发应用程序的性能。在分布式场景中,它通过将数据分布在多个缓存节点上,实现负载均衡与扩展性。关键技术点包括数据分布策略,而普通哈希和一致性哈希是两种常见的算法。1. Memcached 分布式缓存工作机制数据分布Memcached 是无状态的,多个实例可以通过客户端进行分布式管理。数据通过某种哈希算法映射到不同的缓存节点,确保同样的 Key 始终映射到同一个节点(除非节点拓扑发生变化)。工作流程存储。

2024-11-26 20:14:04 822

原创 计算机网络----基本概念

因特网』是一个世界范围内互联了数以亿计的计算设备的计算机网络;

2024-11-25 20:37:49 1251

计算机网络基础:架构、协议与关键技术详解

内容概要:本文档全面介绍了计算机网络的基本概念及其核心技术,涵盖因特网构成、网络模型(五层与OSI七层)、常见网络服务、传输层及运输层的重要协议,如HTTP协议族的应用、TCP/UDP协议的特点和应用场景,还详细讲解了网络层中路由选择协议,如RIP、OSPF、BGP4的具体运作机制。文档同时探讨了几种复用技术和数据分组在网络各个层次上的处理,尤其关注分组传输中的差错控制与流量控制策略。 适合人群:本资料旨在为计算机科学及相关专业的大专院校学生,或是从事信息技术领域的技术人员,特别是有一定网络基础知识的学习者,以及准备参与网络运维工作的初学者提供深入详尽的学习材料和技术指南。 使用场景及目标:通过这份综合性的介绍,读者可以更好地理解计算机网络的基础结构和技术原理。无论是理论课程的学习,还是实际环境中解决网络配置问题或优化现有网络性能等问题都能够获得有效的指导和支持。此外也为读者后续研究更高级别的网络安全、分布式系统等话题奠定了扎实的知识基础。 阅读建议:建议先熟悉基础概念部分,再循序渐进探索具体的网络协议和技术细节,结合实际例子加深理解和记忆,有条件的情况下配合动手实验,更能强化知识点掌握程度,同时鼓励思考如何应用学到的技术改进日常工作中遇到的实际挑战。

2025-02-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除