- 博客(651)
- 资源 (13)
- 收藏
- 关注
原创 【大模型与机器学习解惑】概率图模型有哪些?所有模型技术对比总结
介绍目前机器学习、深度学习和大模型技术中常用的概率图模型,并通过两个分表对比它们的基本信息及优势缺点,同时针对每个模型给出了一个应用代码示例及解释。
2025-04-06 11:54:50
758
原创 【大模型与机器学习解惑】什么是判别式模型?解决什么问题?
介绍判别式模型的基本概念、解决的问题、几个应用案例(包含代码详解)以及优化方向和未来建议。
2025-04-06 11:45:15
533
原创 【大模型与机器学习解惑】什么是生成式模型,解决了什么问题?
以下内容将围绕“生成式模型(Generative Models)”展开,介绍其概念、所要解决的问题、应用场景,以及与深度学习和大模型的关系,最后辅以一些实际案例代码与优化建议,帮助您对生成式模型形成系统认识。
2025-04-05 13:01:25
385
原创 【大模型与机器学习解惑】什么是概率图模型,为了解决什么问题?
以下内容将围绕“概率图模型(Probabilistic Graphical Models, PGM)”展开,从概念与背景、应用场景、典型案例、代码示例、优化建议及未来发展方向等方面进行系统性介绍。
2025-04-05 12:52:51
798
原创 【聚类/无监督学习】各种方法总结对比、代码案例与评估方法
针对无监督学习(聚类)方法的系统总结,包含了常见聚类算法的比较,每个算法有代码示例和性能评估。末尾附有常见的聚类评估指标说明,便于在实际项目中参考和使用。
2025-04-03 11:33:01
735
原创 【深度学习实战】当前三个最佳图像分类模型的代码详解
给出三个在当前图像分类任务中精度表现突出的模型示例,分别基于 Swin Transformer、EfficientNet 与 ConvNeXt
2025-04-01 20:44:35
928
原创 【机器学习解惑】多分类问题的性能如何评估?
多分类评估指标概述多分类问题的性能评估需综合考虑模型对不同类别的识别能力、类别不平衡影响以及预测概率的可靠性。单一指标可能无法全面反映模型表现,需结合业务场景选择合适指标。
2025-04-01 13:27:51
996
原创 【机器学习解惑】什么是ROC曲线,解决了什么问题
在二分类任务中,我们通常需要对分类器的预测性能进行评估。除了常用的准确率(Accuracy),也常使用精确率(Precision)、召回率(Recall)、F1-Score等指标。但在很多场景下,由于正负样本不平衡、不同类型错误的代价差异等原因,仅凭一个或几个简单指标并不能全面反映模型的性能。ROC(Receiver Operating Characteristic)曲线及其衍生指标AUC(Area Under the Curve)就是在这种背景下产生并被广泛使用的指标之一
2025-04-01 11:44:42
966
原创 【大模型与机器学习解惑】什么是采样?采样方法与技术综合教程
本教程从均匀分布随机数出发,系统介绍了反向变换采样、接受-拒绝采样、重要性采样、分层采样等常见方法,以及在实际应用中常用的Box-Muller 高斯采样与MCMC (Metropolis-Hastings) 等高级算法。我们还介绍了贝叶斯网络前向采样和在不均衡数据分类任务中广泛使用的重采样技术。最后,对各采样方法的优缺点、适用场景和前沿挑战进行了总结。采样在统计推断、机器学习与数据分析中扮演着关键角色:从大规模数据中的随机选取到复杂高维分布的蒙特卡罗近似,都离不开合适的采样策略。随着数据和模型规模的不断
2025-04-01 00:34:02
1227
原创 【机器学习与大模型解惑】Transformer架构为何可以构建大模型
详细地讲解为什么 Transformer 架构可以构建大模型,并且与其他神经网络架构的区别。
2025-03-30 23:34:34
676
原创 【机器学习与大模型解惑】多数据类型中类别不平衡问题的处理方法及代码分析
本文围绕六种典型数据类型(结构化数值、文本、时序、图像、图结构、音频),分别选取当前在类别不均衡问题中最具代表性或表现最优的处理方法,系统探讨其原理、代码实现、优势与劣势、可行优化方向及未来研究趋势。
2025-03-29 16:04:55
602
原创 【大模型与机器学习解惑】图像数据不足时怎么办?
【大模型与机器学习解惑】图像数据不足时怎么办?数据增强和迁移学习是资源有限时的首选。GAN适合需要生成多样化数据的场景,但需高性能计算资源。半监督和自监督适合有大量未标注数据的场景,可显著提升模型鲁棒性。
2025-03-29 09:40:02
335
原创 【机器学习解惑】文本表示模型解决的核心问题与分类
内容涵盖文本表示模型的概念、核心问题、常见模型对比(采用表格形式)、每个模型的代码案例、详细解释,以及优化思路和未来研究方向。
2025-03-28 16:46:20
841
原创 【机器学习解惑】为何要构造新的特征?
给出一个详细的讲解,内容涵盖组合特征的概念、作用、解决的问题及适用场景,同时附带三个代码案例,并给出优化建议和未来发展方向。
2025-03-28 15:09:31
790
原创 【机器学习解惑】什么是高维组合特征?如何应用?
以下内容将围绕“机器学习中的高维组合特征处理”展开,深入解释其概念、常见方法、适用场景以及使用时机,并给出示例代码、未来优化思路和建议。
2025-03-28 08:05:37
800
原创 【大模型开发】详解大模型开发工具dify
内容将对大模型开发工具 Dify进行系统性介绍,并提供适合不同行业和业务场景的应用示例、配套代码思路及优化方案,最后给出未来发展建议。
2025-03-28 07:53:37
959
原创 【大模型开发】机器学习与大模型算法工程师的自我修养
机器学习与大模型算法工程师的自我修养的系统性阐述,帮助读者更全面地理解如何在技术与职场成长中不断提升自我修养
2025-03-26 22:49:14
645
原创 【机器学习解惑】什么是类别特征?与数值特征区别及编码方式
在机器学习应用中,特征通常分为数值特征与类别特征。数值特征可能是年龄、身高、价格等,而类别特征(Categorical Feature)则表示无法直接度量其大小关系的离散变量,比如性别(male/female)、城市(北京/上海/广州/…)等。由于类别特征与数值特征呈现不同的数据分布与含义,对类别特征的处理方式往往需要进行额外的编码或转换
2025-03-26 08:41:49
1106
原创 【机器学习解惑】为什么要对特征进行归一化?
特征归一化在很多机器学习和深度学习任务中都显得必不可少,有助于提升模型性能与稳定性,是数据预处理阶段常见且关键的一步
2025-03-26 07:45:04
727
原创 【大模型开发】大模型开发工具Autogenstudio详解与案例分析
AutoGen Studio 是微软推出的低代码开发工具,基于开源框架 AutoGen 构建,旨在简化多智能体(Multi-Agent)系统的开发与管理。通过可视化界面和模块化设计,开发者无需深入编码即可快速搭建复杂工作流,适用于构建虚拟助手、协作机器人、智能客服等应用
2025-03-26 07:38:07
580
原创 【大模型开发】如何对大模型输出答案进行正确性评估?
大模型输出答案的质量评估是多层次、多维度的复杂任务。在实践中,可结合传统自动化指标(BLEU、ROUGE、BERTScore等)与主观人工标注或半自动化流程,以获得较为全面的评估结论。同时,通过加强事实性验证、引入外部知识对齐和开发更细分的评估指标,可进一步提高对大模型真实性与可靠性的度量。面向未来,还需从交互式评估、行业定制化和动态权重策略等方向开展深入研究,以适应不断扩大的应用需求与技术演进
2025-03-25 20:48:34
957
原创 【大模型开发】大模型知识的时效性问题与解决方案
针对“大模型知识的时效性问题”进行较为完整的分析,包括原因、常见解决方案、代码案例与未来优化方法与建议,供参考。
2025-03-25 10:37:51
741
原创 【大模型开发】大模型知识理解力问题与解决方法
以下是一篇关于大模型在知识理解力方面存在的问题的示例性文章,包含问题来源和成因分析,以及可能的解决方案与示例代码,帮助读者更好地理解和应对大模型在知识理解方面的不足。
2025-03-21 13:18:52
713
原创 【大模型开发】大模型处理时间信息的实战扩展
通过上述扩展方案,时间信息处理系统可具备以下能力: - 解析复杂的时间表达式(如"下下个月最后一个工作日下午茶时间") - 智能处理跨语言、跨文化的特殊时间概念 - 在分布式系统中保持高性能和高可靠性 - 结合业务场景进行深度时间推理 建议在实际项目中采用模块化设计,将时间解析、时区转换、节假日计算等功能拆分为独立服务,通过API网关统一调度,同时建立完善的监控告警体系保障服务稳定性。
2025-03-21 11:58:31
835
原创 【大模型开发】大模型在提问和回答中如何处理时间信息
关于大模型在提问和回答中如何处理时间信息的文章示例,内容包含目录、原理介绍、应用场景分析以及案例代码,帮助读者了解并掌握在实际开发或使用大模型时,如何让模型理解并正确输出与时间相关的答案。
2025-03-21 11:51:42
741
原创 【大模型开发】大模型幻觉原因与解决方法
大模型幻觉是基于概率分布的语言生成机制所带来的一种常见现象,难以彻底消除。通过检索增强(RAG)、Prompt Engineering、链式推理和后处理验证等手段,可以在许多实际应用中有效减少幻觉发生率。在生产环境中,通常会使用多重验证(交叉验证、结构化检索、事实检测等)结合专业领域的知识库来进一步提高准确性。
2025-03-21 09:59:02
958
原创 【大模型开发】 RAG+AI 工作流+智能体(AI Agent) 打造智能化开发方案
以下内容将从概念和典型应用流程的角度,为你介绍如何将 RAG(Retrieval-Augmented Generation)+ AI 工作流 + Agent 技术相结合,打造一条以知识检索、自动化推理、执行为核心的智能化程序开发方案,并结合常见的开发框架做一些介绍。
2025-03-20 09:10:16
1289
原创 【大模型开发】deepseek配合开源AI agent框架开发智能体程序最快和最强分析
基于DeepSeek开发智能体程序时,选择合适的开源AI Agent框架可以显著提升开发效率和性能表现。结合搜索结果中的技术特性与案例实践,以下推荐几款在速度、功能及生态支持上表现突出的框架
2025-03-20 08:51:53
844
原创 【大模型开发】为何基于Transformer的神经网络可以无限扩大
可以先用一句话概括:**Transformer 之所以能越做越大,主要是因为它的结构更方便并行、更容易控制梯度流动,而且注意力机制可以在大规模情况下有效地“看”全局信息。**而传统的深度网络在扩大时容易遇到很多训练和结构上的瓶颈,比如梯度消失、梯度爆炸、难以并行、计算量随深度或输入大小呈爆炸式增长等等,从而使得它们很难“一路无限扩张”下去
2025-03-20 07:55:41
527
原创 【深度学习开发】目标检测集成学习中的NMS与WBF
NMS 适合单模型去重,WBF 适合多模型融合,而结合二者可以达到更好的平衡,特别适合在多模型目标检测和多尺度融合任务中使用。
2025-03-20 07:37:49
597
原创 【大模型开发】开源智能体AgentLaboratory(AMD与约翰·霍普金斯大学)进行详细介绍
AgentLaboratory 是由 AMD 与约翰·霍普金斯大学联合开发的 全流程自动化科研框架,旨在通过多智能体协作系统,实现从文献综述、实验设计到论文撰写的科研全流程自动化。该系统基于大型语言模型(LLM)驱动,显著降低了科研成本(最高节省 84%),同时提升了研究效率与代码质量。
2025-03-19 18:23:17
695
原创 【大模型开发】清华与中南大联合开源3D交互实体AI Agent框架LEGENT开发指南
以下是针对清华大学与中南大学联合开源的3D交互实体AI Agent框架LEGENT的深度解析与开发指南,结合其核心创新点、技术架构及实操案例进行详细说明:
2025-03-19 11:49:59
956
危险驾驶行为图像数据集-开车电话-喝水等
2024-02-12
美国联邦选举委员会-政治竞选赞助方面的数据集
2024-02-12
泰坦尼克号数据集
2024-02-12
电影评分数据集-用于电影推荐系统
2024-02-12
住房信息数据集
2024-02-12
葡萄酒数据集
2024-02-12
商铺logo图像集
2024-02-12
糖尿病数据集
2024-02-12
乳腺癌数据集.zip
2024-02-12
阿里真实用户-商品行为数据-推荐系统
2024-02-12
电商网站销售数据
2024-02-12
搜狗用户画像数据集
2024-02-12
开车打手机图像数据集.zip
2024-02-12
PaddleOCR文字识别的完整代码
2025-02-21
论文:DeepSeek-V3 Technical Report
2025-02-21
论文:DeepSeek-Coder: When the Large Language Model Meets Programming - The Rise of Code Intelligence
2025-02-21
论文细节:DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models
2025-02-21
论文细节:DeepSeek LLM Scaling Open-Source Language Models with Longtermism
2025-02-21
论文:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
2025-02-21
用于安全带检测的车内驾驶安全带图像
2024-06-30
深度学习-人脸卡通化-实现代码
2024-02-16
深度学习-目标检测-密集人头检测数据集002
2024-02-12
深度学习-目标检测-密集人头检测数据集001
2024-02-12
深度学习-目标检测-人头数据集002
2024-02-12
深度学习-目标检测-人头数据集001
2024-02-12
深度学习-表情识别-人脸表情数据集002
2024-02-12
深度学习-表情识别-人脸表情数据集001
2024-02-12
各种室内场景图像集003
2024-02-12
各种室内场景图像集002
2024-02-12
各种室内场景图像集001
2024-02-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人