自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 DataWhale 9月 大模型实训 T4:大模型微调

大模型虽然具备强大的通用能力,但在处理特定领域任务或高度定制化需求时,仅通过提示词往往难以达到理想效果。对于需要模型深度理解特定业务逻辑的情况,微调(Fine-Tuning)成为使得大模型更加好用的关键步骤。

2025-09-26 21:15:07 133

原创 DataWhale 9月 大模型实训 T3:提示词工程

文章摘要:本文探讨了提示词书写的关键要素和优化方法。基本提示词应包含任务、主体、细节和形式四个要素,并通过餐厅对话示例展示了标准格式。提升提示词质量可考虑角色扮演、分步思考(CoT)、定制输出格式和Few-shot四个特征。作者通过五种任务实践发现,明确的提示词比自然语言更有效,但这也带来提示词构建工作量大的问题。文章指出AI优化提示词的技术正在发展,类似"解释器"原理,并预测未来大模型将更懂人类语言,建议现阶段仍需学习AI理解的语言表达方式。

2025-09-23 22:28:26 226

原创 DataWhale 9月 大模型实训 T2:大模型使用

数据隐私性强,可完全控制模型行为,但是需要GPU支持,否则太太太慢了。难点:安装包大、启动参数多需调优+只支持有限模型架构。好处:数据完全在本地;本地小模型更适合科研场景。方便快捷,通过API密钥发送请求即可获取结果。改两行配置就能迁移现有代码。难点:数据要出网+可能被限速。好处:显存碎片压缩;难点:首次加载慢+代码量大。

2025-09-21 01:17:32 164

原创 DataWhale 9月 大模型实训 T1:大模型介绍与环境配置

大模型的核心特征主要体现在三个方面:参数规模大、训练数据量大、计算需求大。参数量决定了模型复杂度,数据量防止过拟合,算力支撑高效训练。与传统NLP模型相比,大模型具有通用性强、知识容量大的特点,能通过微调快速适应特定任务。应用领域已突破自然语言处理,扩展到计算机视觉、生物信息等多模态场景。实践表明,大模型能较好理解并执行用户指令,展现出强大的泛化能力。

2025-09-14 22:45:13 937

原创 DataWhale AI夏令营:Coze空间共学 2048作品分享

我想要一个单纯的2048,其中还可以有更多玩法:学历版、中华历史版、军旗版,棋盘大小也可以个性化调整3*3 4*4 5*5都可以,注意,在一开始我发现各个棋盘格子的大小是自适应的,我希望一开始每个格子就都是正方形。我写2048的指令的时候有时候会有小bug,直接描述现象是解决不了问题的,需要根据之前的指令,推测出可能出现问题的代码部分,才可以使AI“读懂”自己写的代码。2048:#EDC22E,金黄色,颜色非常鲜艳,是游戏中最高级的颜色。2:#EEE4DA,浅米色,颜色较浅,与其他方块颜色形成渐变效果。

2025-08-23 10:35:27 377

原创 PICO VR开发流程记录

SDK:[Android Studio安装详细教程(从下载到安装,保姆级教程)_android studio 国内下载-优快云博客](https://blog.youkuaiyun.com/weixin_45143788/article/details/127498365)配合使用:[Unity 找不到 Android SDK 及编译失败的终极解决方案 | Iifa Tree](https://blog.iifatree.com/2021/01/10/unity-android-sdk/)2. 变暗+卡顿:[

2025-08-23 10:28:13 552

原创 Datawhale AI夏令营·多模态RAG方向:赛题理解笔记

2. 输出:对于每个问题,提供回答+文件名+页码(0.5,0.25,0.25)1.train.json 有答案 供微调和训练embedding。3.sample_submit.json 为最终提交格式模版。2.test.json 只有问题,需要补全回答的三个部分。1. 输入:图文混排的PDF。

2025-08-09 22:15:40 319

原创 《机器学习》读书笔记CH6

软间隔支持向量机通过引入松弛变量和惩罚参数,允许部分数据点不满足严格的分类间隔(这样可以提升模型的泛化能力)。函数间隔:在超平面确定的情况下,函数间隔能够代表数据点距离超平面的远近。支持向量机(SVM)的基本思想是寻找一个最优的超平面,使得不同类别的数据点之间的间隔最大化,从而实现对数据的分类。几何间隔:几何间隔代表的是数据点到超平面的真实距离。在最大化间隔的过程中,只有距离超平面最近的数据点对超平面的位置有影响。:支持向量是位于最大间隔边界上的数据点,它们决定了超平面的位置和方向。

2025-07-06 23:06:04 178

原创 《机器学习》阅读笔记CH5

2025-07-03 23:00:56 107

原创 《机器学习》阅读笔记(CH4)

2025-06-30 23:35:10 192

原创 《机器学习》ch3-3

线性判别分析(LDA)是一种经典的监督线性降维方法。其核心思想是给定训练样例集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近,异类样例的投影点尽可能远离。

2025-06-28 00:22:31 281

原创 《机器学习》阅读心得体会(CH3-2)

2025-06-24 23:04:33 107

原创 《机器学习》阅读心得体会(CH3-1)

2025-06-21 22:14:03 89

原创 《机器学习》阅读心得体会(CH1 CH2)

阿瑟·塞缪尔(Arthur Samuel)的定义:“机器学习是研究如何让计算机利用经验改善性能的学科”。汤姆·米切尔(Tom Mitchell)的定义:“如果计算机程序在任务T上的性能P随着经验E的增加而提高,那么就可以说这个程序在从经验E中学习”。机器学习的核心是让计算机能够通过数据自动学习规律,而不是依赖于人工编写固定的程序。其研究的内容是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。机器学习的主要流程有数据收集与清洗、特征工程、模型选择与训练、模型评估与优化。

2025-06-18 21:36:30 745

原创 Python学习记录 1-5 条件表达式和逻辑表达式

算数运算符(乘除>加减)>关系运算符>逻辑运算符(and>or>not)>赋值运算符。其实就是与和或的性质:对于与,一假全假,对于或,一真全真。为什么会有None 其实是print()函数的返回结果。python中 and 和 or的短路操作。

2023-11-04 20:40:11 76 1

原创 Python学习记录 1-2输入输出

【代码】Python 1.2输入输出。

2023-11-01 21:48:22 79 1

原创 Qt5开发及实例(第三版)学习笔记CH1

根据教程《Qt5开发及实例(第三版)》学习。Mini项目1:circlearea。

2023-08-21 16:38:55 183 1

原创 C++实现BF算法、KMP算法

用于实现子串的比较,返回子串在主串中的位置。

2023-08-01 15:55:24 14

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除