- 博客(624)
- 资源 (31)
- 收藏
- 关注

原创 架构师的六大生存法则与价值创造
架构师在软件架构设计中需遵循六大生存法则,确保方案与企业目标一致,尊重人性,最大化商业价值,考虑技术生命周期,注入外部适应性,并在文化环境中生存。这些法则帮助架构师在资源限制下,通过技术洞察和设计,实现商业模式的创新和效率提升,同时要求架构师具备良知和勇气,以全局和长期视角推动架构成功,为公司创造持续的商业价值。
2024-04-26 22:27:32
1244
1
原创 揭秘大模型的多语言能力:内部机制与知识迁移
近年来,大模型(如GPT系列、Claude等)的多语言能力令人叹为观止。它们不仅能流畅地理解和生成多种语言的文本,还能在不同语言间无缝切换,轻松完成翻译、问答甚至创作任务。这种能力究竟从何而来?大模型内部是否藏着一种神秘的“通用语言”?通过Anthropic对Claude Haiku 3.5模型的研究,我们得以一窥大模型多语言能力的内部机制。本文将带你揭开这一技术奇迹的面纱。
2025-03-31 20:24:55
630
原创 打造高性能中文RAG系统:多轮对话与语义检索的完美结合
打造一个高性能的中文RAG系统,需要在检索策略、对话理解和性能优化上下功夫。通过本文介绍的设计思路,相信读者能够构建更智能、更自然的AI问答系统,为用户提供卓越的体验。
2025-03-30 21:51:53
785
原创 虚实交汇:从剧本杀《告别诗》中顾言的故事到我的技术之路
在剧本杀《告别诗》中,顾言的坚韧不拔令人动容。他出身贫寒,却凭借努力学习改变命运。在技术探索中,我从顾言身上汲取力量,于数据洪流与AI挑战中砥砺前行,用技术创造价值,书写属于自己的篇章。
2025-03-26 23:28:00
869
原创 从色子到序列标注:手把手教你理解隐马尔可夫模型(HMM)与维特比算法
隐马尔可夫模型(HMM)通过隐藏状态生成观测数据,维特比算法利用动态规划高效找到最优隐藏状态序列,在自然语言处理的序列标注任务如命名实体识别中发挥重要作用,尽管有局限性,但其可解释性和效率仍使其在特定场景中不可替代。
2025-03-26 10:01:23
813
原创 Chain-of-Verification (CoVe):让大模型“自我审校”的技术如何落地?
本文深入解析了 Chain-of-Verification (CoVe) 技术,它通过让 AI 模型自我验证生成的回答,显著提升了输出的准确性和可信度。CoVe 的核心在于分阶段处理:生成初始回答、规划验证问题、独立执行验证、最终修正回答。这种技术通过提示词工程实现,无需修改模型或额外训练,成本低且效果显著,能将简单问题的准确率提升一倍以上,复杂问题的 F1 值提升 23%,长篇内容的事实准确度提高 28%。
2025-03-25 12:16:37
935
原创 注意力机制复杂度真的是对数级别吗?从新视角理解Transformer
通过"Work-Depth"模型,我们重新认识了注意力机制的复杂度:理论上,它是对数级别(O(log n)),这为Transformer的高效性提供了新的解释。然而,由于缓存和硬件限制,实际复杂度往往接近O(n log n)。
2025-03-24 10:21:46
742
原创 Solana生态中的狙击机器人:Raydium监听策略解析
Solana上的狙击机器人通过监听Raydium的新流动性池创建事件,实现了对新代币发行的高效追踪与交易。Raydium作为Solana生态中的领先AMM平台,为机器人提供了快速获取市场数据和执行交易的能力。在竞争激烈的迷因币交易中,掌握Raydium的监听策略是构建高效交易机器人的关键。
2025-03-24 09:41:18
983
原创 深入解析Flink Kafka Connector的分布式流数据采集架构与底层实现
Flink与Kafka的结合不仅仅是简单的API封装,而是两个分布式系统之间深度的架构整合。这种整合充分发挥了两个系统各自的优势,为大规模数据流处理提供了强大的技术基础。
2025-03-22 03:06:46
210
原创 为什么我们会无意识地模仿自己讨厌的人?心理学揭秘与应对策略
无意识地模仿厌恶者的行为,并不意味着你认同或喜欢对方,而是人类复杂心理机制和社会适应的自然产物。这种现象反映了大脑在社交环境中的灵活性,但也提醒我们:情绪和环境可能会悄然影响我们的行为。通过增强自我觉察、设定边界和强化自我认同,你可以将这些无意识的模仿转化为主动的选择,最终活出更真实、更独立的自己。
2025-03-18 17:22:39
450
原创 揭秘大型语言模型:从神经元到思维透明的奇妙旅程
这篇博客带你走进大型语言模型的内部世界,从神经元的小任务,到功能向量的团队合作,再到层间的协作和思维的透明化。掌握这些知识,能让你在开发中更高效地优化AI,在研究中更深入地探索模型的奥秘。建议多动手实践,把这些理论变成自己的能力!
2025-03-17 13:06:47
1126
原创 解密AI模型提升的秘密武器:5大后训练技术全解析
ReFT通过强化学习优化复杂推理;RLHF基于人类反馈对齐输出;DPO直接优化偏好,简化训练;RLAIF用AI反馈扩展训练规模;PEFT仅调整少量参数,大幅降低资源需求。五大技术各有优势,共同推动AI发展。
2025-03-17 10:18:59
974
原创 扩散模型:AIGC领域的核心引擎,解锁图像生成新维度
扩散模型是一种受热力学启发的生成模型,通过前向扩散添加噪声将数据转化为噪声分布,再通过反向扩散从噪声恢复原始数据。发展历程从DDPM开始,逐步优化采样速度,引入分类器引导和CLIP多模态技术,超越GAN,成为图像生成主流。应用涵盖计算机视觉、时序预测、自然语言及多模态任务(如文本生成图像),展现强大潜力。
2025-03-15 19:14:45
1010
1
原创 扩散模型在低级视觉任务中的应用:4个必看开源项目【附代码】
扩散模型正革新低级视觉任务,它们能处理像素级图像,完成超分辨率、去模糊、去雾、低光照增强等任务。其工作方式包括正向扩散添加噪声和反向去噪恢复图像。文章列举了4个相关GitHub开源项目,这些项目提供完整源码和预训练模型,可直接部署使用,将推动视觉AI发展。
2025-03-15 16:52:05
651
原创 RAG 系统召回优化实战:百万文档中提升检索速度与精度的 4 大方案
本文从原理到代码,展示了如何优化 RAG 系统的召回环节。无论是选择领域模型、混合检索、重排序,还是向量量化,每种方法都针对特定问题提供了解决方案。在实际应用中,可根据数据规模、硬件资源和业务需求灵活组合这些技术,构建高效且准确的检索系统。希望这篇文章能为你的 RAG 系统优化提供实用指导!
2025-03-14 00:55:56
596
原创 QwQ-32B大模型本地部署全攻略:推理能力爆表,消费级GPU也能轻松玩转!
QwQ-32B是来自Qwen的一个320亿参数的推理模型,擅长复杂问题求解。数学推理玩井字棋等游戏利用推理能力解决复杂问题生成具有真实物理模拟的代码可以看到在官方放出的评测图中, QwQ-32B 与满血版 DeepSeek R1(671B)在五项基准测试的得分不相上下,更是远超同尺寸 R1 蒸馏模型。
2025-03-13 12:39:06
1558
原创 揭秘Solana合约开发的安全陷阱:从漏洞解析到实战防护
从假Token到闪电贷,再到CPI和权限漏洞,Solana合约开发中的安全陷阱无处不在。Cashio事件的教训告诉我们,创新固然重要,但安全是DeFi应用的生命线。通过严格的验证、权限管理和状态控制,开发者可以有效防范这些攻击。只有在安全的基础上砌砖,才能打造出用户信赖的区块链应用。希望这篇文章为你提供清晰的思路和实用的工具,让你的Solana合约坚如磐石!
2025-03-12 09:11:51
882
原创 争取信任、屏蔽无关、防备恶意:人际关系的动态平衡之道
在人际博弈中,保护自己与构建信任同样重要。通过主动争取信任、屏蔽无关干扰、精准识别恶意,你不仅能在复杂的人际网络中保护核心利益,还能成就更好的自己。愿你以智慧与理性,在人际关系的动态平衡中找到属于自己的节奏。
2025-03-12 09:09:36
1236
原创 Cashio 漏洞解析:20亿美元凭空消失,DeFi安全的警钟
Cashio 漏洞事件是一个代价高昂的教训,20亿美元的损失敲响了 DeFi 安全的警钟。开发者需加强智能合约的严谨性,用户需提升风险意识,社区需共同监督,才能构建一个更安全、更可持续的区块链生态系统。只有在安全性得到保障的前提下,DeFi 才能真正实现其去中心化金融的潜力。
2025-03-11 08:10:57
630
原创 TokenSwap合约 vs Raydium:去中心化交易的终极对决,谁才是王者?
TokenSwap 是 Solana 上的基础 AMM 合约,类似“自动换币售货机”,提供简单高效的代币交换功能。Raydium 则在此基础上扩展,结合 Serum 订单簿,增加流动性挖矿、跨链支持等功能,成为高性能、多功能的去中心化交易所。两者各有定位,共同推动 Solana DeFi 发展。
2025-03-11 07:45:11
934
原创 在资源有限中逆势突围:从抗战智谋到寒门高考的破局智慧
资源受限时,唯有精准识别矛盾、优化资源配置、突破创新约束,正如八路军游击、初创企业MVP及寒门高考均证:困境亦可催生无限可能。有限条件催智慧,必创全新局面未来。
2025-03-10 15:44:30
935
原创 开源、创新与人才发展:机器人产业的战略布局与稚晖君成功案例解析
开源不仅促进技术进步,更是企业战略布局。稚晖君凭借软硬结合能力、创新精神和持续分享获得华为青睐。技术人才应聚焦领域、强化实践、积累作品、持续学习,寻找与己匹配的发展平台。
2025-03-10 14:45:39
1184
原创 美团开源INT8量化DeepSeek R1:老显卡焕发新生,推理吞吐提升50%!
美团团队通过INT8量化方案解决DeepSeek R1部署难题,在A100上实现推理吞吐量提升50%,16张卡即可部署,且精度损失小于0.5%,为大模型部署提供新思路。
2025-03-08 11:24:43
134
原创 揭秘AI自我进化:从合成轨迹到强化学习的突破性进展
通过合成高质量思维链数据和强化学习,AI模型能够从错误中学习并自我改进,显著提升复杂推理任务的表现。这一方法在多个领域中应用潜力巨大,并有助于未来AI发展的突破。
2025-03-08 10:17:42
203
原创 如何让AI学会“自我改进”?揭秘Open R1和DeepScaleR的突破性训练方法
近年来AI自我改进研究取得突破,Open R1、DeepScaleR和LIMO等项目通过合成高质量推理轨迹和分阶段强化学习,让AI逐步学会自我改进,未来AI“思考”能力有望进一步进化。
2025-03-08 10:17:24
336
原创 深度思考与资源聚焦:挖掘人类思维潜能的关键
本文探讨了深度思考与资源聚焦的结合,提出了一种创新的认知模式。通过神经认知学、数学模型、实践框架、技术增强和风险控制的综合应用,这种模式显著提升问题解决效率,降低认知能耗,并在MIT实验中得到验证。文章提供了新的思考视角和实践方法,助力读者在复杂环境中实现认知飞跃。
2025-03-07 17:52:23
1076
原创 如何避免假设错误与推理混乱:系统性思维与验证策略
避免错误假设与推理偏差需构建系统性思维框架,从识别隐性假设、提升信息质量、结构化推理、管理认知偏差及系统化验证与迭代五维度入手,结合实践方法与案例,将隐性认知显性化并通过系统性验证降低不确定性,以提升决策质量。
2025-03-04 12:21:10
851
原创 Rust 语言如何助力区块链开发?井字棋游戏带你入门
Rust 是一种高性能、内存安全的系统编程语言,适合区块链开发。支持显式数据类型,默认不可变变量,拥有强大的模式匹配控制结构。函数和模块化完善,Cargo 管理依赖和构建,项目结构含 Cargo.toml 和 src 目录。井字棋游戏展示实践实现,内置测试确保可靠性。最佳实践注重所有权管理、错误处理与性能优化,避免常见陷阱如操作符误用和生命周期错误
2025-03-03 10:36:53
970
原创 空投与转账:Solana代币核心概念及代码实战精解
本文详细介绍了Solana代币的空投与转账操作。空投通过createMintToInstruction指令铸造新代币并分发,增加总供应量,需特殊权限;转账通过createTransferInstruction指令移动已有代币,不影响总供应量,普通账户即可操作。文中还总结了代币创建与空投的核心代码,包括生成密钥对、初始化Mint账户、批量处理空投地址等步骤。
2025-03-01 18:30:31
475
原创 Solana 核心概念全解析:账户、交易、合约与租约,高流量区块链技术揭秘!
Solana 是高性能区块链,核心概念有账户、交易、合约和租约。账户存储信息,交易是交互方式,合约是可执行代码,租约保障数据存储。可通过 RPC、Web3.js 及 WalletAdapter 与之交互,涉及配置环境、查询账户、操作 Token 等多种功能,相关操作有具体命令和代码示例。
2025-03-01 14:19:05
1316
原创 KIMI K1.5:大规模强化学习在大语言模型中的应用与工程实践
KIMI K1.5模型通过长上下文强化学习、策略优化技术及工程架构创新,显著提升推理能力,在数学、编程等复杂任务上取得优异成绩,为大语言模型发展提供了新方向。
2025-02-25 12:49:22
237
原创 深度解密:Facebook、Airbnb、YouTube和阿里巴巴如何用深度学习重塑推荐系统
本文介绍了推荐系统在业界的深度学习实践,包括Facebook的GBDT+LR模型和DLRM模型,Airbnb的Embedding实时搜索推荐系统,YouTube的两级深度学习视频推荐系统,以及阿里巴巴深度学习推荐系统的进化过程。这些实践展示了深度学习在推荐系统中的应用和优化。
2025-02-24 09:53:22
582
原创 突破“第一崇拜“:五维心理重构之路
本文提出五维心理重构方案,旨在打破“大众只看第一”的狭隘成功观,通过认知解构、心智重塑、优势建构、韧性培育和价值实现,帮助个人建立健康、多元的成功观,推动个人成长与社会多元化发展。
2025-02-23 14:14:06
1161
原创 多模态特征提取与融合助力高光谱+LiDAR数据分类性能飞跃
本文提出CMIIE模块和MLFFC模块,分别用于提取高光谱与LiDAR数据的互补信息及多层特征融合。结合对抗学习策略,该方法在Houston、MUUFL和Trento数据集上显著提升分类精度,消融实验验证了其有效性。
2025-02-17 10:50:28
979
原创 压力下的大脑:认知超常表现背后的神经科学解析
在电影《少年的你》中,女主角陈念面对校园霸凌和家庭困境等多重压力,仍能保持优异的学习成绩。这一现象引发了对人类在极端环境下认知表现的深入思考。本文将从脑科学、心理学和学习方法三个维度,探讨压力下认知超常表现的神经生物学机制,以及这种适应模式可能带来的潜在风险。
2025-02-17 07:21:02
708
原创 自动驾驶数据集三剑客:nuScenes、nuImages 与 nuPlan 的技术矩阵与生态协同
Motion 的数据集矩阵,包括 nuScenes、 nuImages 和 nuPlan,支持全栈自动驾驶研发。NuScenes 侧重于三维感知,nuImages 侧重于带有时间数据的二维视觉,nuPlan 侧重于规划和决策。这些数据集相互补充,为复杂场景中的算法开发和部署提供全面的支持。未来的发展方向包括跨模式预训练、端到端模拟和社区驱动的开发。
2025-02-08 10:35:55
1328
原创 PPO 算法全知道:从原理到应用,解锁 AI 优化新姿势
PPO是一种强化学习算法,采用策略梯度方法,具有稳定性和易实现性。通过裁剪机制和演员-评论家架构,限制策略更新幅度,交替进行数据收集与优化,适用于连续和离散动作空间,在语言模型等领域有广泛应用。
2025-02-07 11:16:16
1282
原创 DeepSeek-R1:将强化学习用于激励大型语言模型的推理能力
论文记录了一个引人注目的案例:在处理一个涉及复杂数学表达式 √a - √(a + x) = x 的问题时,模型突然停下来说"Wait, wait. Wait. That's an aha moment I can flag here"(等等、等等、这是个值得标记的啊哈时刻),随后重新审视了整个解题过程。将推理能力成功蒸馏至小模型,大幅跑赢同尺寸开源模型。3. 蒸馏:将DeepSeek-R1的推理能力成功蒸馏到更小、更高效的密集模型中,如Qwen和Llama系列,极大地提升了这些小模型在推理任务上的表现。
2025-01-24 20:38:22
1476
原创 Flink Gauss CDC:深度剖析存量与增量同步的创新设计
开发Flink Gauss CDC是为了适配华为自研GaussDB的特殊日志格式和逻辑复制机制,解决Flink CDC无法直接支持的问题,同时优化存量与增量同步的效率和一体化读取能力,满足GaussDB复合主键处理、数据落库等定制化需求,以实现高效、准确的数据同步。
2025-01-22 23:40:35
1393
Chain-of-Verification (CoVe):让大模型“自我审校”的技术如何落地?
2025-03-19
基于对抗学习的多级交互融合网络用于高光谱和LiDAR数据融合分类
2025-02-17
基于李宏毅老师深度强化学习蘑菇书EasyRL
2025-02-07
扩散模型如何在智能交通(自动驾驶、交通仿真、轨迹预测等)领域发挥作用
2025-01-18
一个在有序行和列的矩阵中选择第k小元素的O(n)时间复杂度算法
2024-01-01
华为鸿蒙4谷歌鸿蒙GMS安装的安装包
2023-10-23
cdh5.9.3.rar
2021-07-20
Highcharts案例.rar
2020-07-13
elasticsearch-5.6.3+kibana-5.6.3+logstash-5.6.3.rar
2019-09-15
elasticsearch-analysis-ik-5.2.0.rar
2019-09-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人