- 博客(109)
- 资源 (4)
- 收藏
- 关注
原创 RAGFlow + LlamaIndex 本地知识库RAG增强架构与实现直播智能复盘
该方案已在电商直播、金融路演等场景验证,违规识别准确率>92%,响应延迟<500ms。核心优势在于将传统RAG从。扩展直播话术合规与复盘系统,需构建。,实现了监管要求与技术创新的深度耦合。
2025-03-19 00:42:22
839
原创 GGUF量化模型技术解析与DeepSeek-R1-Distill-Llama-8B选型指南
存储空间 | 16GB | 4-8GB | ↓ 50-75% || 内存占用 | 16GB | 5-10GB | ↓ 37-68% || 推理速度 | 100ms | 50-80ms | ↑ 20-50% || 能耗效率 | 100% | 30-60% | ↓ 40-70% || 对比项 | 原始模型 | 量化模型 | 优势提升 |正在用哪个量化版本?
2025-03-18 05:04:56
493
原创 在8GB显存设备上运行大模型deepseek-r1的终极性价比方案:从8B到32B的全方位优化指南
入门用户:选择8B-Q4_K_M,零配置快速部署开发者:14B-Q3_K_S,平衡性能与成本研究需求:32B混合量化,配合SSD扩展。
2025-03-18 04:50:13
1225
原创 【完全指南】GGUF量化技术与DeepSeek-R1模型选型:从入门到部署
传统模型:每个参数用32位浮点数(好比高清无损图片)量化模型:用4-8位整数存储(类似手机压缩照片)核心原理的数学映射,保留关键特征。
2025-03-18 04:35:59
644
原创 零基础本地部署deepseek及知识库(ollama+docker+ragflow)
(2)在Docker安装目录(Windows下默认为C:\Program Files\Docker\Docker\frontend\resources,Macos下默认为/Applications/Docker.app/Contents/MacOS/Docker Desktop.app/Contents/Resources)找到app.asar文件并将其备份,防止出现意外。(2)模型名称,我是7b,填写deepseek-r1:7b,具体根据你拉取的模型名称填写。
2025-03-02 08:02:19
1325
原创 本地RAG框架工具综合分析
2025年本地RAG开发已形成“Cognita为核心+垂直工具补充”的生态格局。优先掌握Cognita:其模块化设计能覆盖80%企业需求,且社区资源丰富深度定制需结合领域:法律/医疗等场景可基于Cognita插件体系扩展功能关注硬件级优化:利用量化/算子融合等技术在消费级GPU实现生产级性能配套教程和数据集已极大降低学习门槛,建议从官方Starter Kit入手,2周内即可完成首个生产级系统搭建。
2025-03-02 05:13:26
731
原创 deepseekR1+Ollama+chatbox本地部署并实现联网功能
按照以上步骤操作,你应该能够在本地成功部署ChatBox,并与AI模型进行对话。如果你遇到任何问题,可以查阅Ollama和ChatBox的官方文档或寻求社区帮助。
2025-03-02 04:49:54
802
原创 架构基础常识
特性 分层架构 全局架构(单体架构)系统划分 按功能划分为多个独立层次 整个应用程序作为单一整体开发难度 初期复杂度较高,但长期更易维护 初期简单,后期维护难度大性能表现 可能会因层间通信带来性能损耗 内部通信高效,无网络延迟扩展性 易于水平扩展,支持微服务化 扩展性差,不易分割部署方式 多个服务分别部署 单一应用程序实例维护成本 低,各层可独立更新 高,需整体更新。
2025-01-24 09:23:37
744
原创 职业学习路线参考
而且,更可悲的时,当毕业10年后,突然发现自己不具备这个能力时(比如晋升失败时发现了),这些能力GAP就不再是2到3年就能追得上的了。我见过一些有准备的同学,他们给自己的目标是在毕业第7年就要具备这些能力,他有严格的学习计划、实践计划、甚至是冒险的创业经历。有的同学也表示,希望在新的一年,能具有更好的技术影响力,自己能做一些技术决定,去影响其他人,这样自己会很有成就感。从公司的经营视角看,一个管理团队的人,他必要是要为业务的成功负责。到了这个年龄的人,往往已经不是“个人贡献者”了,而是“团队贡献者”。
2025-01-24 09:22:27
299
原创 DDD八讲总结:领域划分与上下文映射
在前几讲中,我们探讨了领域驱动设计的战术模式。本讲将重点介绍领域划分和上下文映射的概念,帮助大家理解如何在复杂业务中进行领域和子域的划分。最重要的原则:领域体现的是业务能力“能不能用一句话说清目标?“是不是有一组内聚的核心概念?“有没有可能成为一项独立的业务?领域划分的重要性简化认知:通过领域划分简化问题,降低认知负担。隔离变化:分离变化频繁的部分和稳定的部分,提高代码的稳定性和复用性。聚焦重点:识别和聚焦最重要的业务领域,提炼核心运营中最有价值和最专业的概念。领域分类核心域。
2025-01-24 09:17:44
383
原创 DDD架构实战第七讲总结:分层模型和代码组织
在前几讲中,我们介绍了领域驱动设计(DDD)的基本构造块和生命周期模型中的聚合。本讲将重点讨论如何将这些构造块和代码组织起来,探讨分层架构和六边形模型,以及如何组织代码结构。分层模型四层架构:接口层、应用层、领域层和基础设施层,通过分层架构,软件设计更加灵活,关注点更加分离。领域层的稳定性:领域层是业务逻辑的核心,应该是开发的重点。六边形架构依赖倒置原则:领域层依赖基础设施层提供的接口,确保核心业务逻辑的稳定性和独立性。技术独立性:可以方便地替换外部技术,实现技术独立性。代码组织聚合和分层。
2025-01-24 09:17:06
762
原创 DDD架构实战第六讲总结:领域驱动设计中的聚合
聚合提升了对象系统的粒度,保证了业务逻辑的完整性,减少了错误产生的概率将实体和值对象划分为聚合并围绕着聚合定义边界。作一个整体来定义聚合的属性和不变量,并把其执行责任赋予聚合根或指定的框架机声选择一个实体作为每个聚合的根,并仅允许外部对象持有对聚合根的引用。聚合提升了对象系统的粒度,保证了业务逻辑的完整性,减少了错误产生的概率聚合的重要性提升对象系统的力度:聚合将小的对象封装成更大的单元,提升了系统的理解和管理力度。保证业务逻辑的完整性:聚合通过聚合根管理业务逻辑,减少了代码缺陷的产生。
2025-01-24 09:16:33
1223
原创 DDD架构实战第五讲总结:将领域模型转化为代码
在前几讲中,我们讨论了领域模型的重要性及其在业务分析中的渐进获得方法。本讲将聚焦于如何将领域模型转化为代码,使得开发人员能够更轻松地实现用户的领域模型。领域驱动设计的重要性认知的重要性:领域驱动设计通过高质量的领域模型提升业务响应能力和开发效率。持续演进:领域模型需要通过实践不断演进,确保其始终反映业务的本质。构造块的应用实体、值对象、服务、事件:通过这些构造块,将领域模型转化为代码,确保业务逻辑的实现。统一语言语言的统一:统一语言是领域驱动设计的核心实践,确保领域模型的有效性和持续演进。
2025-01-24 09:15:41
736
原创 DDD第四讲总结:持续梳理业务概念,发现领域模型
在上几讲中,我们讨论了领域模型的重要性及其在业务认知和快速响应能力构建中的作用。本讲将通过一个具体的例子,展示如何在业务分析中持续梳理业务概念,发现领域模型。软件开发的本质认知的重要性:软件开发的本质是认知,领域模型是企业的核心竞争力。高质量领域模型:高质量的领域模型能够有效降低复杂性,提升业务响应能力。持续演进实践中的发现:好的领域模型是在实践中逐步摸索出来的,演进是领域模型的基本思维模式。实践与检验:没有坚实的实践支撑,概念无法得到实施,领域模型需要通过实践不断检验和改进。统一语言。
2025-01-24 09:15:07
406
原创 DDD进阶(3)高质量领域模型源于持续演进
软件开发的本质认知的重要性:软件开发的本质是认知,领域模型是企业的核心竞争力。高质量领域模型:高质量的领域模型能够有效降低复杂性,提升业务响应能力。持续演进实践中的发现:好的领域模型是在实践中逐步摸索出来的,演进是领域模型的基本思维模式。实践与检验:没有坚实的实践支撑,概念无法得到实施,领域模型需要通过实践不断检验和改进。统一语言语言的统一:统一语言是领域驱动设计的核心实践,确保领域模型的有效性。日常应用:在日常工作中坚持使用统一语言,确保领域模型的持续演进和实践。
2025-01-24 09:14:29
793
原创 第二讲总结:高质量领域模型提升业务灵活性
高质量领域模型的作用业务认知提升:领域模型建立了对业务的深度理解,提升了软件开发、业务理解和软件架构的质量。业务灵活性提升:高质量领域模型能够提升业务的灵活性,使系统更容易适应业务变化。领域模型反映业务认知核心资产:领域模型反映的是问题认知,认知是企业的核心资产。顺畅沟通:深度认知能够带来顺畅的需求沟通和更好的产品架构。领域模型与领域资产关联性:好的领域模型能够积累领域资产,提升业务响应能力。业务适应性:高质量领域模型能够适应业务变化,支持业务创新。
2025-01-24 09:13:47
752
原创 1 领域模型的本质是业务认知
定义概念模型:领域模型定义了领域内的关键概念及其关系。现实世界的反映:描述现实世界的事物及其关系。问题空间的理解:反映对问题空间本质的理解。领域模型与数据库模型关系:虽然有关系,但领域模型核心在问题域中,而非数据库。重点:领域模型关注的是问题域的概念和关系,而数据库模型关注的是数据存储。领域模型的定义特定领域的业务概念和关系描述:领域模型是对特定领域内业务概念及其关系的描述。反映重要认知:领域模型反映了对该领域的重要业务认知,服务于软件开发活动。领域模型的作用提升认知和架构质量。
2025-01-24 09:12:57
304
原创 架构师需要掌握的能力总结
架构师在不同层次和阶段需要具备多种能力,以应对复杂的业务和技术挑战。架构师需要具备多种能力,包括分析、评估、创新、抽象、提炼、设计、执行、运营和思考能力。这些能力的培养和应用需要架构师不断学习和实践。同时,架构师需要具备强大的商业理解力,能够理解和支持业务目标。在实际工作中,架构师需要运用矛盾法则,从洞见中寻找规律,从规律中发现趋势,从趋势中预判矛盾,从矛盾中发现机会,从机会中构建规划。
2025-01-23 09:40:53
462
原创 针对业务系统的开发,如何做需求分析和设计?
通过以上步骤,我们可以系统地设计和实现一个数据中台,提升电商平台的用户转化率。目标与指标:明确B类用户的业务目标和指标,深入洞察业务问题的本质。DDD解决方案:通过领域驱动设计(DDD),理解B类用户的痛点和业务流程,设计解决方案。历史分析与推演:从历史数据和现有解决方案中找到不足之处,推演未来可能出现的问题和需求。技术与产品创新:通过技术和产品创新,设计新的解决方案,提升业务目标。能力提炼与抽象:从解决方案中提炼出关键能力和流程,进行抽象和二次抽象,形成标准化的能力架构。数据中台构建。
2025-01-23 09:39:41
1238
原创 架构师需要具备的思维模式与能力
总结起来,架构设计的思考路径包括前台架构、小中台架构和平台工具的架构。这些路径的起点是矛盾法则,通过定义问题、设计商业模式、产品方案和技术方案来解决匹配问题。商业模式的本质是多方交易和匹配,通过解决匹配问题来创造新的价值。在这个过程中,需要关注社会矛盾,探索历史和社会发展中的不匹配,服务社会解决矛盾,从而带来商业价值。
2025-01-23 09:38:16
314
原创 架构基础常识
特性 分层架构 全局架构(单体架构)系统划分 按功能划分为多个独立层次 整个应用程序作为单一整体开发难度 初期复杂度较高,但长期更易维护 初期简单,后期维护难度大性能表现 可能会因层间通信带来性能损耗 内部通信高效,无网络延迟扩展性 易于水平扩展,支持微服务化 扩展性差,不易分割部署方式 多个服务分别部署 单一应用程序实例维护成本 低,各层可独立更新 高,需整体更新。
2025-01-23 09:34:27
1172
原创 设计模式思想的元规则
能适应使用者的就是好的设计。对代码而言,就是要顺应变化。因此要信奉ETC原则(Easier To Change,更容易变更)——就该如此。据我们所知,无论是什么设计原则,都是ETC的一个特例。为什么解耦很好?因为通过隔离关注焦点,可让每一部分都容易变更——此谓ETC。为什么单一职责原则很有用?因为一个需求变化仅体现为某个单一模块上的一个对应变化——此谓ETC。为什么命名很重要?因为好的命名可以使代码更容易阅读,而你需要通过阅读来变更代码——此谓ETC!”ETC 是一种价值观念,不是一条规则价值观念是帮助你做
2025-01-23 09:33:04
340
原创 本质复杂度和偶然复杂度以及复杂度的爆炸
思考?主管之所以成为主管在于其业务能力强,而不是其工程能力强。比DDD的贫血充血更重要的点。我来谈谈我对连续设计的理解。我认为在连续设计中,不应该纠结于贫血和充血,而应该关注统一的语言和上下文。限定上下文是非常关键的。在实现层面,拼写重写可能不是那么重要。在一个团队中,对于同一件事情的命名是否一致,以及这个命名是否只在同一个地方出现,是非常重要的。跨团队之后,两边的命名是否一致,是否有映射,以及一些名字是否只在某个团队中出现,这些都是领域系统设计中非常核心的部分。
2025-01-23 09:31:44
338
原创 如何画好一张架构图(落地最优)
业务建模是架构设计中的一个重要过程,它不仅是一个建立模型的过程,更是对业务进行抽象和无歧义书面描述的过程。业务建模是一个从信息收集、绘制核心业务流程图和业务功能模块图,到归类汇总和结构化表达的过程。这个过程需要不断地问自己关键问题,确保对业务的全面理解和全局视野。通过业务建模,可以达成业务共识,减少沟通成本,同时保持对整体业务的把握,避免陷入细节陷阱。业务建模的核心目的是形成逻辑清晰、结构化的业务图,确保所有参与者对业务有一致的理解,并能够在同一个层次上进行讨论和设计方案。
2025-01-23 09:30:40
677
原创 数据仓库分层设计概念
数据仓库分层设计的主要目的包括支持数据的重用、优化性能、提高数据的一致性、可维护性和可拓展性,以及提高数据的可理解性和处理的灵活性.操作数据层(Operational Data Store, ODS):存储经清洗和初步转换后的数据,接近实时更新,支持简单查询和操作,为数据分析和报表提供最新的、经过清洗的操作数据.分析和展示层(Analytics and Presentation Layer):为用户提供数据分析、报告和可视化的界面,将处理后的数据以易于理解的形式展现给业务用户和决策者.
2024-10-17 11:20:37
519
原创 数据仓库基础概念
数据仓库和维度建模是现代企业数据分析不可或缺的部分。数据仓库通过整合、清洗和转换来自不同源系统的数据,为企业提供一致、可靠的历史数据,支持战略决策和未来趋势预测。维度建模作为一种反范式化的建模方法,通过设计合理的事实表和维度表,大大提高了数据查询和分析的效率,使数据仓库更能贴近业务需求,易于理解和使用。
2024-10-17 09:31:09
1452
1
原创 数据库设计中的范式
数据库设计中的范式和ER实体关系模型是确保数据库高效、可靠的重要工具。范式通过逐步规范化减少数据冗余和异常,ER模型则直观地展示了实体间的关系,有助于概念设计和沟通。结合两者的优势,可以在实际应用中实现高性能、高可靠性的数据库系统。
2024-10-17 09:15:51
873
原创 雪花算法的基本原理与使用场景
雪花算法(Snowflake Algorithm)是一种由Twitter开发的分布式ID生成算法,旨在解决分布式系统中生成唯一ID的需求。它通过将一个64位的整数划分为不同的部分,确保生成的ID在分布式环境中是唯一的,并且具有一定的时间有序性。
2024-10-15 12:14:52
485
原创 索引设计的原则主要包括以下几点:
8.扩展索引:尽量扩展已有索引,而不是新建索引。例如,如果表中已经存在a的索引,现在要加(a,b)的索引,那么只需要修改原来的索引即可,这样可以节省空间并提高效率。7.区分度低的列:如果列不能有效区分数据(如性别,男女未知,最多也就三种),则不适合做索列,因为这样的索引对查询优化的帮助不大。9.避免不必要的索引:对于查询中很少涉及的列或重复值比较多的列,不要建立索引,因为这样的索引对查询性能的提升有限。6.更新频繁字段:对于更新频繁的字段,不适合创建索引,因为每次更新都会导致索引的修改,从而降低性能。
2024-10-15 11:50:08
315
原创 讲一讲Redis五大数据类型的底层实现
在实际应用中,Redis会根据数据的实际情况,动态地为数据对象选择最合适的底层数据结构实现,以达到节约内存、提高性能的目的。:用于存储所有键值对的键和值的字符串长度都小于64字节,且哈希对象保存的键值对的数量小于512个的情况。:用于存储所有元素都是整数值,且集合对象保存的元素数量小于等于512个的情况。:用于存储所有字符串元素的长度都小于64字节,且列表保存的元素少于512个的情况。:用于存储长度小于等于32字节的字符串值,使用简单动态字符串(SDS)结构,内存分配只需要一次,分配一块连续的空间即可。
2024-10-15 08:57:59
1014
原创 分布式锁实现细节:使用Redisson进行并发控制
在顺风车系统中,尤其是在高峰期,多个并发请求可能同时尝试修改匹配状态,例如,同一乘车需求可能被多个匹配过程尝试分配,这将导致数据不一致。通过使用Redisson提供的分布式锁功能,顺风车系统能够在高并发场景下有效控制资源的并发访问,保证数据的一致性和完整性,提高系统的稳定性和可靠性。:锁的超时时间应根据业务场景调整,确保在正常情况下锁能够被释放,避免死锁。:确保在锁的使用过程中,无论是否发生异常,锁都能被正确释放,避免资源泄露。:在多线程环境中,确保锁的使用是线程安全的。在顺风车匹配的业务代码中,使用。
2024-10-14 23:44:55
544
原创 预计算热点路径在顺风车系统中的实际应用
将每条路径的信息存储为哈希表的形式,其中键为唯一标识符(如组合了起点与终点的字符串),值为路径详细信息(如路程长度、所需时间)。综上所述,预计算热点路径的应用极大地提升了顺风车系统在固定办公区场景下的效率与用户体验,是现代出行平台不可或缺的功能之一。:根据用户的历史偏好(如愿意绕远换取更低的费用)、当前的交通状况(如避开拥堵路段),系统可提供个性化的路径建议。:基于过去的搭乘记录,系统甚至可以提前预测高峰期的乘车需求,主动向经常出行的用户提供优惠券或提醒,增强用户体验。
2024-10-14 23:34:08
388
原创 预计算热点路径技术细节
对于热点路径来说,可以将每一条可能的路径标识符(比如:起点、终点的经纬度字符串拼接)作为键,将路径的相关信息(如预计耗时、距离等)作为值。利用地图API(如Google Maps API或百度地图API)或开放的地图数据(如OpenStreetMap)配合路由算法(如Dijkstra算法或A*算法)计算从各个潜在上车点到办公区的所有可行路径。通过上述资料的学习与实践,可以深入理解如何使用GIS、Hash表与Redis实现预计算热点路径的存储与查询,进而优化顺风车系统的性能。
2024-10-14 23:32:40
566
原创 顺风车系统优化方案:针对固定办公区域的高效匹配
通过上述技术方案的综合应用,不仅能极大提升顺风车系统的匹配效率与用户体验,还能进一步挖掘数据价值,为企业决策提供更多洞见。
2024-10-14 23:30:33
440
原创 企业级应用最快速学习路线:Agent智能体项目
通过以上学习路线,您将能够快速掌握Agent智能体项目开发所需的核心技能,并具备参与企业级Agent项目实战的能力,从而能够快速入职并胜任相关工作。:在第二阶段,您将深入学习Agent智能体项目的基础知识,包括Agent的基本概念、架构设计、开发框架等。:在第七阶段,您将通过实战演练项目,提升自己的实战能力,为入职Agent智能体项目做准备。:在第五阶段,您将通过综合实践项目,将之前学到的知识融会贯通,提升自己的项目实战能力。:在第三阶段,您将通过实战项目,将理论知识应用到实际开发中,提升自己的实战能力。
2024-10-14 03:30:26
616
原创 限界上下文(Bounded Context)
限界上下文(Bounded Context)是领域驱动设计(DDD,Domain-Driven Design)中的一个核心概念,由Eric Evans在其著作《领域驱动设计》中首次提出。限界上下文定义了一个明确边界内的术语、逻辑和模型,有助于管理系统的复杂性,并保证不同团队间的一致性和沟通有效性。
2024-10-13 01:35:46
534
原创 一力破万法,高并发系统优化通解思路
以上策略及其实现细节,从集群扩展、异步处理、缓存机制、消息队列引入到数据库优化,覆盖了高并发系统从架构设计到代码实现的关键技术点。实践时,应根据具体业务场景和系统架构,合理选择和组合上述策略,以达到最佳的性能优化效果。
2024-10-12 20:55:49
524
原创 YOLO 二元分类器
TP(真阳性):模型正确预测为正类且实际为正类的样本数量。FP(假阳性):模型错误预测为正类但实际为负类的样本数量。TN(真阴性):模型正确预测为负类且实际为负类的样本数量。FN(假阴性):模型错误预测为负类但实际为正类的样本数量。
2024-10-05 13:11:20
578
软件工程完整ppt
2018-08-04
传智播客 c++讲义(扫地僧王保明版)
2018-08-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人