- 博客(437)
- 收藏
- 关注
原创 为什么有的深度学习训练,有训练集、验证集、测试集3个划分,有的只是划分训练集和测试集?
最终,测试集应被视为“不可见数据”,仅在模型完全确定后使用一次,以反映真实泛化能力。
2025-04-04 22:32:29
107
原创 React: hook相当于函数吗?
自定义 Hook 的本质是将一组逻辑封装为一个可复用的单元,但它仍然是基于 React 内置 Hook 构建的。
2025-04-04 22:10:54
364
原创 AI三大主义 和 深度学习三大主义
在人工智能(AI)研究领域,"三大主义"通常指三种核心方法论或思想流派,它们代表了不同的技术路径和哲学观点。(Three Dogmas of Deep Learning)是YannLeCun在2019年提出的概念,用于概括当前深度学习研究中的核心假设或局限性。
2025-03-29 00:23:30
821
原创 Git 工作流防止git pull导致远程代码覆盖本地修改
开始│├─ 有本地修改?→ git commit 或 git stash│├─ 安全拉取 → git pull --rebase│ ├─ 冲突?→ 解决后 git rebase --continue│ └─ 无冲突 → 完成│└─ 已被覆盖?→ 通过 reflog 或 stash 恢复。
2025-03-29 00:19:23
288
原创 在线运行Python代码输出结果
• 特点:基于Jupyter Notebook的云端环境,支持GPU/TPU加速,适合机器学习和数据分析。• 特点:支持多语言协作、实时共享代码、项目管理,适合团队协作或教学场景。• 特点:主要用于前端开发,但也支持Python,适合轻量级代码演示。• 特点:支持调试功能(设置断点、逐行执行),界面简洁。• 适用场景:快速测试代码、协作开发。• 适用场景:教学、新手理解代码逻辑。• 适用场景:教学、轻量级代码演示。• 适用场景:教学、轻量级脚本编写。• 适用场景:数据分析、教学。
2025-03-19 12:55:29
254
原创 gdal-linux-whl文件安装下载地址
网址:https://sourceforge.net/projects/gdal-wheels-for-linux/files/
2025-03-15 20:09:22
260
原创 免费的人工智能编程教育学习平台
由麻省理工学院(MIT)与谷歌联合开发,专为5-18岁儿童和青少年设计,涵盖从基础知识到跨学科应用的完整课程体系。课程按年龄分为小学、初中和高中三个阶段,内容科学严谨且完全免费。提供全球顶尖AI课程,包括吴恩达的《AI For Everyone》和《机器学习》课程,适合零基础学习者。部分课程免费,证书需付费。由芬兰官方推出的免费AI通识课,涵盖AI基础和应用开发,无需编程基础。由李沐团队编写,结合Python与MXNet框架,提供理论、代码和实战结合的深度学习入门教程。
2025-03-14 13:17:54
1118
原创 深入了解 Unsloth:大模型微调利器
Unsloth 是一款专为高效微调和训练大语言模型而精心打造的开源框架,它的诞生旨在全方位攻克模型微调过程中遇到的种种瓶颈,无论是对追求极致效率的专业 AI 开发者,还是渴望尝试模型定制的爱好者,Unsloth 都展现出了极高的价值,致力于让模型微调变得轻松、快捷且高效。
2025-03-14 10:35:35
926
原创 长文本、知识库、微调对比
对比维度长文本处理知识库微调核心目标理解和生成长篇内容提供背景知识,增强回答能力优化模型在特定任务或领域的表现优点连贯性强,适合复杂任务灵活性高,可随时更新性能提升,定制化强缺点资源消耗大,上下文限制依赖检索,实时性要求高需要标注数据,硬件要求高适用场景写作助手、阅读理解智能客服、问答系统专业领域、特定任务、风格定制额外数据不需要,但可能需要优化上下文长度需要知识库数据需要特定领域的标注数据重新训练不需要,但可能需要优化模型不需要需要。
2025-03-14 10:20:42
608
原创 预训练微调类型分类
微调是在预训练模型基础上,针对特定任务或领域进行优化。:通过大规模数据训练模型,学习通用表示能力。• 多模态预训练(如CLIP、DALL·E):优化文本分类任务(如情感分析、主题分类)。:适配多模态任务(如图文生成、视觉问答)。:优化文本相关任务(如文本生成、分类)。:将模型适配到特定领域(如医疗、法律)。• 知识蒸馏:将大模型知识迁移到小模型。• 增量学习:逐步适配新任务或数据。• 掩码语言模型(如BERT):针对特定需求或场景进行优化。:使用标注数据优化特定任务。:通过奖励机制优化模型输出。
2025-03-14 09:59:10
335
原创 拿破仑希尔《思考致富》提到的领导失败的10大因素
害怕下属可能会取代自己的领导者,早晚会让恐惧成为现实。能干的领导者会培养接班人,并乐意将职位的细节托付给他人。:有能力的领导者会以鼓励而非威慑来领导下属。:能干的领导者不需头衔就可以赢得下属的尊敬。:真正伟大的领导者会视情况需要,自愿从事他要求下属做的任何事情。:因为下属的工作而邀功、自揽光环的领导者必定招致怨恨。真正伟大的领导者乐于将荣耀归于下属。真正的领导者不会因为“太忙”而无法完成分内工作。:下属不会尊重一个放纵无度的领导者。:没有想象力,领导者就无法应付紧急状况,也无法制定有效领导下属的计划。
2025-03-14 09:48:01
190
原创 探秘智能体通信协议 MCP:多智能体协作的 “隐形桥梁”
智能体通信协议 MCP 作为多智能体系统协同工作的核心支撑,正深刻地改变着我们的生活和工作方式。它以其强大的功能、显著的优势和广泛的应用场景,为人工智能技术的落地应用注入了强大动力。随着技术的不断发展和完善,MCP 必将在未来的智能世界中发挥更加重要的作用,引领我们走向一个更加智能、高效、协同的时代。让我们拭目以待,共同见证 MCP 创造的无限可能!
2025-03-14 09:25:45
935
原创 《思考致富》- 阻碍成功的31个要素
拿破仑·希尔在《思考致富》中详细总结了阻碍成功实现的31个要素,这些要素涵盖了个人思维、行为习惯以及外部环境等多个方面。
2025-03-13 14:01:30
308
原创 AI数据相关处理与交易领域的头部公司全景分析
在人工智能与大模型技术快速发展的背景下,数据作为核心生产要素的重要性愈发凸显。数据处理与交易领域已形成从底层标注到上层应用的全产业链生态。企业需在技术能力、合规框架与行业场景深度结合中构建壁垒,方能在万亿级数据经济中占据先机。
2025-03-10 17:39:56
810
原创 pytorch常用参数初始化
修正ReLU族的负区间影响,适用于ReLU/LeakyReLU。:保持输入输出方差一致,适用于tanh/sigmoid激活。:保持输入输出空间的正交性,适用于RNN/LSTM。:权重矩阵满足 ( W^T W = I ):限制采样范围在±2std内,避免极端值。:权重初始化为0(不推荐用于隐藏层):导致所有神经元对称更新,失去多样性。:随机将部分权重设为0,打破对称性。:将最后一个BN层的权重初始化为0。Kaiming初始化。
2025-03-08 12:49:38
827
原创 `mocker.patch` 和 `fixture`模拟方法的选择和区别
适合临时替换某个函数或对象的行为,灵活性高,但可能导致代码重复。• fixture:适合在多个测试中复用相同的模拟对象或逻辑,集中管理,但灵活性较低。• 根据具体需求选择合适的方法,或者结合使用两者以实现更好的测试效果。
2025-03-07 21:21:58
303
原创 结合unittest和pytest进行虚拟数据库测试
使用pytest和MagicMock模拟数据库操作,并测试假设的函数,将用户添加到数据库中。
2025-03-07 11:24:12
576
原创 ImportError: DLL load failed while importing _gdal: 找不到指定的模块。
通过设置环境变量或手动添加 DLL 目录到搜索路径,可以解决问题,并成功导入osgeo.gdal模块。
2025-03-04 14:32:50
643
原创 观察评测模型的性能时为什么需要关闭dropout及dropout一般设置
是一种广泛使用的正则化技术,用于防止神经网络过拟合。它的核心思想是在训练过程中随机“丢弃”一部分神经元,从而减少神经元之间的共适应性,增强模型的泛化能力。
2025-02-27 21:21:50
1049
原创 清华大学Deepseek教程学习总结(五)
定义学术定义:模型生成与事实不符、逻辑断裂或脱离上下文的内容,本质是统计概率驱动的"合理猜测"通俗解释:“一本正经地胡说八道”分类:事实性幻觉(与可验证事实不符)忠实性幻觉(与用户意图或上下文不符)典型案例医疗转录:Whisper系统在30,000小时医疗对话转录中,50%样本存在虚构患者死亡年龄等严重错误金融推荐:DeepSeek误推荐不存在的阿布扎比商场和虚构咖啡馆文学问答:将《水浒传》鲁智深大闹五台山错误归因于李逵。
2025-02-22 16:19:31
551
原创 清华大学Deepseek教程学习总结(四)
DeepSeek通过强化学习驱动的推理架构和开源策略,正在重塑AI产业格局。其在成本效益(训练成本降低98%)、垂直领域应用(医疗诊断准确率93.6%)和技术普惠(API价格仅为行业3%)方面的突破,为学术研究和产业应用提供了全新范式。未来随着多模态融合和自进化系统的发展,有望在2026年前实现AGI关键突破。
2025-02-22 16:10:12
744
原创 清华大学Deepseek教程学习总结(三)
产品定位核心优势能力图谱紧急项目书撰写新员工快速上手客户沟通优化课堂实时辅助科研创新突破代码能力提升紧急事务管理社交关系处理健康决策支持深度思考机制知识边界突破多模态能力能力培养体系提示语设计协作层级生产力革新认知革命产业影响
2025-02-22 16:01:48
989
原创 清华大学Deepseek教程学习总结(一)
教程构建了从基础认知到高阶应用的完整知识体系,强调"模型特性-提示策略-场景适配"的三位一体方法论,为AI工具的高效使用提供系统化指导。核心价值在于建立"需求分析→模型选择→提示设计→结果优化"的标准化工作流,适用于各类AIGC应用场景。
2025-02-22 15:34:38
801
原创 Flask必备基础
Flask 的简洁性使其成为快速开发小型项目和原型设计的理想选择,同时通过扩展也能满足企业级需求。Flask 是一个轻量级的 Python Web 框架,以简洁和灵活性著称。
2025-02-22 15:24:39
629
原创 ImportError: cannot import name ‘FixtureDef‘ from ‘pytest‘
错误信息表明pytest在尝试导入FixtureDef时出现了问题。通常是由于 pytest或引起的。
2025-02-19 13:37:07
609
原创 太空飞船任务,生成一个地球发射、火星着陆以及下一次发射窗口返回地球的动画3D代码
【代码】太空飞船任务,生成一个地球发射、火星着陆以及下一次发射窗口返回地球的动画3D代码。
2025-02-18 19:59:01
557
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人