- 博客(202)
- 资源 (18)
- 收藏
- 关注
原创 macOS 上快速启动 Open WebUI-模型训练
本文详细介绍了在 macOS 上通过 Docker 快速部署 Open WebUI(原 Ollama Web UI)的完整流程。主要内容包括:安装 Ollama 和 Docker、拉取大语言模型、运行 Open WebUI 容器、访问 Web 界面等步骤。文章提供了清晰的命令行示例,并涵盖了常见问题解决方法。整个过程仅需 5-10 分钟,无需编程基础即可实现本地大模型交互界面。此外还包含进阶配置建议和快速启动清单,帮助用户快速上手使用。
2025-11-18 11:39:17
366
原创 FSDP、FSDP2 和 Megatron-LM 是三种主流的分布式训练框架或技术
维度开发方NVIDIA基础框架PyTorch 原生支持自研框架(基于 PyTorch)并行方式主要是数据并行 + 分片混合并行(TP + PP + DP)显存效率高(参数/梯度/优化器分片)极高(多维度分片)训练速度快(尤其是 FSDP2 + compile)非常快(高度优化)易用性较高(PyTorch 风格)较低(需深入理解并行)扩展性支持数百 GPU支持数千 GPU适用场景中大型模型、研究场景超大规模工业训练是否支持编译加速✅ FSDP2 支持。
2025-09-17 16:32:17
1689
原创 vLLM 和 SGLang 是两个近年来备受关注的开源项目
vLLM和SGLang是提升大语言模型效率的两个重要开源项目。vLLM专注于推理优化,通过创新的PagedAttention技术显著提高吞吐量,降低显存占用,适用于高并发场景。SGLang则提供结构化生成的编程框架,简化复杂逻辑的编写,支持JSON输出、多步推理等高级功能。两者可协同使用:SGLang处理应用逻辑,vLLM提供底层加速。vLLM代表基础设施优化,SGLang代表应用层抽象,共同推动大模型从"能用"到"好用"的演进,是构建AI应用的重要工具组合。
2025-09-17 15:48:56
881
原创 能力评估:如何系统评估你的技能和经验
作为一名38岁的互联网研发老兵,你已经积累了丰富的经验,包括技术深度、项目管理、团队协作等。但能力评估不是一次性事件,而是持续过程,帮助你识别优势、短板,并为职业转型铺路。38岁是理想创业年龄——Kauffman基金会数据显示,成功创业者平均40岁,40岁创始人成功率是25岁者的2.1倍。最终,建立“超级公司”不是速成,而是杠杆你的老兵优势:深度见解、韧性。通过这些,你能得出一个全面画像,例如你的优势可能是架构设计,但短板可能是新兴技术如LLM应用。记住,40岁是峰值:经验让你更高效,避免年轻人的试错。
2025-08-11 23:03:50
931
原创 多轮会话记忆的核心挑战
原则建议✅ 优先采用分层架构短期 + 摘要 + 向量 + 结构化状态✅ 控制token成本使用摘要和检索替代全量上下文✅ 保证关键信息不丢失显式提取并维护对话状态✅ 支持可扩展性使用向量数据库(如Pinecone、Chroma)✅ 工程化实现使用LangChain、LlamaIndex等框架加速开发🏆最终推荐方案对于大多数生产级AI系统,采用「分层记忆架构」LangChain或LlamaIndex实现记忆管理或Claude 3作为LLM作为向量数据库自定义状态机跟踪关键槽位。
2025-08-11 23:03:13
837
原创 AI编程插件对比分析:CodeRider、GitHub Copilot及其他
凭借成熟的生态、多语言支持和无缝IDE集成,适合快速开发和团队协作。推荐给需要高生产力和广泛语言支持的开发者,但需注意高估值项目中的代码审查。CodeRider:以项目级上下文和离线模式为亮点,适合大型代码库重构和隐私敏感场景。推荐给企业开发者和需要深度定制的团队。其他选择:Codeium适合预算有限的用户,Tabnine适合本地化需求,CodeWhisperer则为AWS开发者量身定制。
2025-08-10 14:57:40
1082
原创 《100个用AI重构的商业模式》--私人订制的婚介平台
要用 AI 做一个,核心不是“配对算法”这么简单,而是要在上,比传统交友平台更有竞争力。我会分成四个部分来拆。
2025-08-10 10:32:12
492
原创 2025年AI技术突破关键方向分析报告
2025年AI技术突破关键方向分析 本报告揭示2025年AI技术三大核心突破: 模型效率革命:小模型通过知识蒸馏实现终端部署,MoE架构降低70%训练成本,多模态模型跨模态检索准确率达91.3% 硬件性能跃升:中国"天枢-5"芯片能效比达300TOPS/W,特斯拉L4自动驾驶决策延迟缩短至30ms 应用场景落地:工业质检缺陷检出率99.99%,医疗AI诊断准确率98.7%,具身机器人进入工厂产线 产业呈现"端侧普及+多模态融合"趋势,同时面临深度伪造防御等治理挑战。A
2025-08-09 14:39:05
7713
原创 欢迎咨询年度规划2025
通过谨慎的财务管理保护好存量财富,通过持续学习投资自己的未来,通过小步快跑的方式探索新的可能性。如此,当第六波康波的浪潮真正到来时,您将是那个手握船票、准备最充分的冲浪者。在康波的萧条期,**“现金为王”和“投资于自己”**是永恒的真理。2025年的创业目标是**“验证模式”而非“赚大钱”**。投入的时间和金钱都要严格控制在自己能承受的范围内,最好是在不影响主业的情况下进行。对于属兔的您来说,2025蛇年是机遇与挑战并存的一年。利用运势中的“学习运”,在现有岗位上纵向深化,同时横向拓展与新周期相关的技能。
2025-07-23 15:15:05
853
原创 顶级 AI Agent 工作流平台与框架分析
你可以在 YouTube、Bilibili 或知识星球上创建一个频道,专门分享 Power Automate 的高级技巧和企业级应用案例,积累影响力后,提供付费的企业内训和一对一咨询服务。创建一个名为“AI Agent观察家”的公众号或网站,每日推送最新的 Agent 技术进展和有趣的开源项目,当积累了数万粉丝后,可通过广告和为 AI 公司撰写“探店”式的评测报告来盈利。这类工具为开发者提供了极大的灵活性,可以构建高度定制化的、前沿的 AI Agent。如果你是某个平台的专家,可以通过知识分享来变现。
2025-07-22 11:51:08
835
原创 AI Agents: Your Guide to Building a B2B Moneymaker
The rise of sophisticated AI agents is creating a significant opportunity for businesses to generate new revenue streams by offering intelligent, automated solutions to other companies. From streamlining complex workflows to personalizing customer interact
2025-07-21 22:28:09
796
原创 20岁职场人必读:AI工具爆发背后的职业机遇与挑战
摘要: AI工具爆发是职场变革的重要信号,为20岁左右的职场新人带来机遇与挑战。73%的95后已使用或计划学习AI工具,其核心价值在于提升效率(如智能写作、数据分析)和创造新岗位(如AI训练师)。年轻人需构建"AI+X"能力,聚焦人机协作与不可替代的软技能,同时警惕伦理风险。未来职场将形成人机分工新生态,主动掌握AI工具者将获得竞争优势。关键在于将AI视为赋能工具而非威胁,通过持续学习和差异化发展把握职业机遇。
2025-07-19 19:51:19
826
原创 乐观的死亡学
摘要: 这份心理学探讨以"死亡预设"为实验视角,融合存在主义、荣格理论和认知疗法,解构人类对生命价值的理解。研究发现:1) 当死亡被视为既定事实时,人们对得失的评判会发生本质改变;2) 时间感知在"永生"与"临终"的镜像中呈现奇特悖论;3) 剥离社会评价后,成就动机转向内在真实需求。研究提出极端认知重构方法,如"遗书视角"写作、墓地规划等,帮助人们在承认生命有限性的前提下,重新校准存在价值。这些发现不仅挑战传统心理学认知,更为提
2025-07-17 09:15:05
357
原创 一位38岁程序员的“向死而生”实践计划
摘要: 本文为38岁在职程序员提供"向死而生"的实践指南,通过四项策略优化职业与人生:1)每日"遗书清单"聚焦核心三件事,提升代码质量与协作效率;2)"复活者"心态应对技术焦虑,勇敢尝试新挑战;3)每周/年度复盘校准职业与生活平衡;4)培养非功利爱好滋养创造力。配套设置短中长期目标,如3年内精通新兴技术、10年转型技术领导者、终身构建影响力遗产,帮助在有限生命中获得深度满足。该计划强调价值优先而非效率,引导程序员超越代码维度实现全方位成长。
2025-07-17 08:46:21
531
原创 钉钉专属品牌能力:由内而外,打造全链路专属营销体验
作为深度渗透到企业日常运营的协同办公平台,钉钉提供的“专属品牌能力”正成为企业由内而外构建统一品牌认知、并与市场上各类专属营销能力高效联动的新利器。钉钉的专属品牌能力,远不止于简单的替换Logo和启动页,它为企业提供了一整套从视觉到应用层面的深度定制方案,旨在打造沉浸式的企业文化和品牌环境。真正的力量在于将这种内部凝聚的品牌力,与外部的专属营销策略相结合,形成内外呼应、体验一致的品牌护城河。本文将深入解读钉钉的专属品牌能力,并结合当前主流的专属营销策略,为企业提供一套可落地的实战指南。
2025-07-07 17:53:57
662
原创 问题:训练过程中,如果你发现模型在训练集上的表现远远好于在验证集上,可能是什么原因导致的?应该采取哪些措施可以改善这种情况
用户问的是模型在训练集上表现很好,但在验证集上差,这明显是过拟合的问题。首先我得回忆一下过拟合的原因是什么。可能是因为模型太复杂,记住了训练数据的噪声和细节,导致泛化能力差。或者训练数据太少,验证数据分布不同。接下来应该考虑怎么解决。常见的办法有正则化,比如L1/L2,或者Dropout。数据增强也是个方法,增加数据多样性。交叉验证可能帮助调整参数。早停法,在训练时监控验证集损失,及时停止。还有简化模型结构,比如减少层数或神经元数量。检查数据分布是否一致,是否有泄露的情况。
2025-06-18 11:25:43
488
原创 人工智能:神经网络原理、案例与 Python 代码
将神经网络的原理分解为几个关键部分,结合案例和代码,以用户友好的方式呈现,确保内容连贯、逻辑清晰,并且实用性强,能够帮助用户动手实践并理解背后的机制。
2025-06-15 17:57:25
479
原创 人工智能-准确率(Precision)、召回率(Recall) 和 F1 分数
准确率、召回率和F1分数在大模型评估中的应用 在自然语言处理任务中,准确率(预测为正类的正确比例)衡量模型预测的可靠性(如垃圾邮件分类),召回率(实际正类被识别的比例)反映覆盖能力(如疾病筛查)。两者常存在此消彼长的关系。F1分数(两者的调和平均)用于平衡两者,适用于需兼顾精度和覆盖的场景(如法律文本分类)。 大模型中的特殊考量: 生成任务(如摘要)需权衡生成内容的准确率(事实性)与召回率(关键信息覆盖); 多标签分类需计算宏/微平均F1; 长文本处理中召回率易下降,需针对性优化。 示例:实体识别任务中,若
2025-06-15 17:27:39
1327
原创 AI编程--插件对比分析:CodeRider、GitHub Copilot及其他
AI编程插件对比分析:CodeRider、GitHub Copilot及其他
2025-06-09 15:22:41
1496
原创 人工智能--安全大模型训练计划:基于Fine-tuning + LLM Agent
安全大模型训练计划:基于Fine-tuning + LLM Agent
2025-06-09 10:52:08
970
原创 十年三跃:一个普通技术人的热血职场路
当携程收购完成时,总监们身价千万的消息传来,车库咖啡的创业神话正在一公里外上演。”凌晨的办公室,师兄手把手教我调试烟草审计系统,那些星光至今温暖。四个月全身心投入,设计出完整的交易引擎架构图——那些供应链、报价、结算模块的线条,至今在我脑中灼灼发亮。“以史为鉴,可以明得失”——这个曾让我抗拒的句子,如今成了职场路上最忠实的伙伴。今天,我想把十年间的三次关键转身,讲给正在奋斗的你听。2010年,非名校毕业的我挤进中软研发部,与北邮硕士成为同事。——途家雪夜教会我的:能让你凌晨两点眼睛发亮的,才是人生真坐标。
2025-06-07 21:42:20
278
原创 高危文件识别的常用算法:原理、应用与企业场景
高危文件识别旨在检测可能导致安全威胁的文件,如包含恶意代码、敏感数据或欺诈内容的文档,在企业协同办公环境中(如Teams、Google Workspace)尤为重要。结合大模型技术(如MCP)和微软(Purview、Security Copilot)、Google(SAIF、Unified Security)的安全框架,本文详细介绍高危文件识别的常用算法,涵盖传统方法、机器学习和基于大模型的算法,分析其原理、优缺点、应用场景,并提供伪代码和图表建议。
2025-06-06 15:48:42
945
原创 人工智能- RAG 分块、嵌入和索引
摘要: 词嵌入(如Word2Vec)将单词映射为向量,捕捉词义关系;句子/段落嵌入(如BERT)编码整段文本为固定维向量,保留上下文语义;多模态嵌入(如CLIP)对齐不同模态(文本、图像)到同一空间,支持跨模态检索。三者均通过向量化表示语义,但应用场景不同:词嵌入适合单词级任务,句子嵌入用于段落匹配,多模态嵌入解决图文关联问题。核心挑战包括高维计算、语义一致性及跨模态对齐。
2025-06-06 08:43:56
829
原创 人工智能--大型语言模型的存储
GGUF和safetensors是两种不同的模型权重存储格式,主要差异体现在设计目标和适用场景上。GGUF专为量化模型设计(如INT4/FP16),优化推理性能,适合资源受限的设备部署;而safetensors由Hugging Face开发,强调安全性和通用性,通过禁用代码执行防止恶意攻击,兼容PyTorch等主流框架。GGUF体积更小但依赖特定工具链(如llama.cpp),safetensors兼容性更广但未针对量化优化。选择时,若需高效推理且模型已量化,优先选GGUF;若注重安全性和框架兼容性,则选s
2025-06-05 16:16:18
1313
原创 人工智能-SFT(Supervised Fine-Tuning)、RLHF 和 GRPO
SFT(Supervised Fine-Tuning)、RLHF(Reinforcement Learning from Human Feedback) 和 群体相对策略优化 (GRPO,Group Relative Policy Optimization)是一种强化学习 (RL) 算法,
2025-06-05 15:15:32
930
1
原创 人工智能-Chain of Thought Prompting(思维链提示,简称CoT)
Chain of Thought Prompting(思维链提示,简称CoT) 是一种通过引导大模型生成中间推理步骤来增强其复杂问题解决能力的技术。它让模型在回答问题时,不仅输出最终答案,还展示出逐步分解问题、逻辑推理的过程。以下是大模型如何具备这种能力的详细解析
2025-06-03 08:56:25
1216
原创 强化学习-深度学习和强化学习领域
摘要: SFT(监督式微调)和GRPO(梯度策略优化)是深度学习中两种不同的训练方法。SFT依赖标注数据,简单高效但泛化能力有限,适用于规则明确的任务(如内容过滤)。GRPO通过强化学习优化策略,能动态适应复杂目标(如反欺诈),但训练不稳定且成本高。两者核心差异在于数据需求、灵活性和计算成本。实际应用中,SFT适合快速部署静态任务,GRPO适用于动态风险场景,混合方案(如SFT+GRPO)能结合优势。总结:SFT提供基础保障,GRPO实现精细优化,互补性显著。
2025-06-02 16:12:58
1721
原创 人工智能-训练AI模型涉及多个步骤
本文详细介绍了使用Python和scikit-learn库训练AI分类模型的全流程。主要内容包括:1)导入数据处理和建模所需库;2)数据准备与特征/标签分离;3)数据预处理(缺失值处理和标准化);4)划分训练测试集;5)逻辑回归模型训练;6)模型评估(准确率和分类报告)。文末提供完整代码示例,需替换数据集文件名和目标列名即可直接使用。该流程适用于初学者的基础机器学习任务实现。
2025-05-29 22:20:48
384
原创 Prompt:开源库license的分类名称、说明、适应范围
开源许可证分为宽松许可证(如MIT、Apache 2.0、BSD)和Copyleft许可证(如GPL、AGPL、LGPL)。宽松许可证允许自由使用及闭源集成,适用于商业项目。Copyleft则要求衍生作品保持开源,其中强Copyleft(GPL)适用于核心软件,弱Copyleft(LGPL)多用于库文件。许可证选择影响代码传播、使用及合规性,需根据项目目标和兼容性谨慎选择。公共领域放弃版权限制,允许完全自由使用。
2025-05-28 08:52:07
1097
原创 最新构建和编排AI Agent是一个快速发展的领域
当前全球最优的Agent编排和快速构建平台,对于寻求灵活性和深度定制的开发者来说,LangChain 和 Microsoft AutoGen 是首选的开源框架,它们提供了强大的编排能力和丰富的生态系统。CrewAI 则专注于多Agent协作,简化了团队Agent的构建。而对于希望通过低代码/无代码快速构建和部署Agent的用户,Dify 和 Microsoft Copilot Studio 提供了更便捷的路径。
2025-05-28 08:42:11
587
原创 Python冲刺10天-如何实现基本的矩阵运算
本文介绍了如何使用Python的NumPy库实现基本矩阵运算。通过示例代码演示了矩阵加法、减法、乘法和转置操作,包括安装NumPy、定义运算函数、创建示例矩阵以及执行运算并输出结果的过程。这些基础操作为更复杂的矩阵计算提供了基础,展示了NumPy在科学计算中的高效性。
2025-05-27 17:36:28
435
原创 AI系统化学习月计划6月计划
这篇文章为技术总监设计了一份为期30天的AI系统化学习计划(每天2小时),分为四周逐步深入: 第一周聚焦AI基础与战略思维,建立技术框架和业务价值认知; 第二周夯实数学、编程及机器学习基础; 第三周专攻深度学习框架与实战应用; 第四周结合金融、制造等行业案例深化战略落地与伦理合规。 计划强调业务导向,包含每日任务(如绘制技术地图、模型部署实践)和推荐资源(书籍、课程、Kaggle)。关键建议包括:战略优先理解AI价值,通过案例分析驱动实践,并持续追踪技术趋势。最终输出《AI战略实施路线图》,助力技术决策与团
2025-05-27 14:52:32
1165
原创 构建安全AI风险识别大模型:CoT、训练集与Agent vs. Fine-Tuning对比
本文探讨了构建安全AI风险识别大模型的关键技术,聚焦于Chain-of-Thought(CoT)推理设计、训练集构建方法,以及Agent-based与Fine-Tuning两种技术路线的对比。在CoT设计方面,提出通过结构化提示引导模型分步识别风险;训练集构建强调多样化数据来源和精准标注;技术路线比较显示,Agent-based方法灵活性高但复杂,Fine-Tuning性能优但需充足数据。该研究为企业协作场景(如Microsoft Teams)的风险监控提供了实用技术框架和实施建议。
2025-05-24 10:41:22
1375
原创 如何撰写一份卓越的技术文档:从前沿技术到知识拓展
技术文档是连接开发者与用户的重要桥梁,尤其在快速发展的技术领域。本文从四个维度探讨如何撰写卓越的技术文档:1)融入前沿技术,如大模型算法,通过学术跟踪、代码示例和可视化呈现;2)通过清晰结构、互动示例吸引人才;3)以问题为导向,提供完整解决方案和错误处理;4)作为学习工具,整合跨学科知识。最佳实践包括保持技术前沿性、模块化设计、多语言支持和社区反馈迭代。高质量技术文档不仅传播知识,更能推动创新、解决问题和吸引人才。
2025-05-24 09:54:36
1164
原创 如何做好一份技术文档?——顶级技术博主的深度剖析
技术文档写作的三大核心策略:自动化生成、用户导向与人才培养。首先,拥抱文档即代码理念,采用Markdown等轻量标记语言,结合CI/CD流程实现文档自动化构建与部署。其次,以用户为中心,针对不同受众提供分层内容,建立FAQ和故障排查指南,优化搜索导航体验。最后,将文档作为吸引技术人才的重要媒介,提供完善的入门指南、架构说明和贡献规范,构建开放协作的知识社区。优秀的技术文档需要持续迭代,通过用户反馈和行为分析不断优化内容结构。
2025-05-24 09:52:25
908
原创 The Journey of a Large Language Model Algorithm Engineer: From Principles to Best Practices
本文讲述了大型语言模型(LLM)算法工程师Alex的成长历程,从初识LLM到成为多上下文处理(MCP)专家的过程。Alex在2020年首次接触LLM,通过Transformer架构和自注意力机制的学习,逐渐深入理解LLM的核心原理。他通过在线课程和开源框架(如Hugging Face)进行实践,掌握了预训练模型的微调技巧。2021年,Alex加入一家初创公司,专注于LLM架构的深入研究,特别是MCP技术,用于处理企业协作中的多模态任务。他学习了上下文聚合、跨模态注意力机制和长上下文处理等关键技术,并通过代码
2025-05-22 22:03:28
1297
1
原创 企业安全系列-企业协同办公中的100条风险行为
以下是企业协同办公环境中可能导致安全风险的行为,分为五大类别:员工行为风险、数据处理风险、系统使用风险、网络安全风险和物理安全风险。每条风险行为包括名称、指标统计方式和详细描述。
2025-05-22 21:22:53
1186
1
原创 全球科技与技术领域的权威网站和资源平台
通过以上资源,您可以系统性地追踪全球科技动态,并根据兴趣领域选择重点平台。建议结合新闻、学术、实践资源,形成多维度的信息网络。
2025-05-21 08:18:51
2449
商品进销存报表系统(C#源码).rar
2009-03-08
json_lib_2.4以及依赖的jar包
2013-08-01
postgresql-42.2.16.jar
2020-08-29
图书管理系统的数据库
2010-03-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅