自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 DataWhale AI春训营楼道图像检测比赛

这可能是我人生中最后一次参加AI比赛了,明天就要去考深度学习的试了,这一学期从Resnet到Lora,真的学了不少内容。同时我这学期也要毕业了,往后或许也没了学生身份,希望能够早日在自己的道路上成为top吧。task2里面讲的facal loss很好,第一次使用这个,做ai实验确实应该多读论文。用的是efficientnet_b0,总体10分钟可以运行完.

2025-05-05 22:02:01 249

原创 DataWhale AI夏令营 电力day3

窗口统计可以构建不同的窗口大小,然后基于窗口范围进统计均值、最大值、最小值、中位数、方差的信息,可以反映最近阶段数据的变化情况。:可以帮助获取相邻阶段的增长差异,描述数据的涨减变化情况。在此基础上还可以构建相邻数据比值变化、二阶差分等;这里主要构建了历史平移特征、差分特征、和窗口统计特征;:通过历史平移获取上个阶段的信息;

2024-07-20 23:04:34 574

原创 DataWhale AI夏令营 nlpDay2

给定一个中文句子“我/对/你/感到/满意”,**编码器会将这句话编码成一个实数向量(0.2, −1, 6, 5, 0.7, −2),这个向量就是源语言句子的“表示”结果。例如,在电视系统上为了便于视频的传播,会使用各种编码器将视频编码成数字信号,在客户端,相应的解码器组件会把收到的数字信号解码为视频。有了这样的源语言句子的“表示”,解码器可以把这个实数向量作为输入,然后逐词生成目标语言句子“I am satisfied with you”。在源语言句子的表示形式确定之后,需要设计相应的编码器和解码器结构。

2024-07-17 23:15:01 1050

原创 DataWhale AI夏令营 电力预测赛Day2

支持高效LightGBM (Light Gradient Boosting Machine) 是一个实现GBDT算法的框架,支持高效率的并行训练,并且具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式,可以快速处理海量数据等优点。窗口统计特征:窗口统计可以构建不同的窗口大小,然后基于窗口范围进统计均值、最大值、最小值、中位数、方差的信息,可以反映最近阶段数据的变化情况。可以将d-1时间的信息给到d时间,d时间信息给到d+1时间,这样就实现了平移一个单位的特征构建。物品类型:服饰、玩具和电子等。

2024-07-17 18:45:09 383

原创 DataWhale夏令营nlp比赛笔记

代码中主要做的事情是定义数据集,定义encoder,decoder,seq2seq,术语词典加载函数,训练函数,以及在开发集上进行评价,推理等内容,内容非常丰富,对我来讲需要学习的点有很多。计算BLEU分数时,首先会统计生成文本中n-grams的频率,然后将这些频率与参考文本中的n-grams进行比较。如果生成的翻译中包含的n-grams与参考译文中出现的相同,则认为是匹配的。最终的BLEU分数是个个于0到1之间的数值,其中1表示与参考译文完美匹配,而0则表示完全没有匹配。BLEU 评估指标的特点。

2024-07-14 00:51:10 260

原创 DataWhale夏令营电力需求预测挑战赛笔记

首先使用了pandas里面的groupby函数,按照id将前11~20天之间的数据进行聚合,计算id中每一个房屋target的均值。数据集由字段id(房屋id)、 dt(日标识)、type(房屋类型)、target(实际电力消耗)组成。[‘target’].mean()这个地方表示按照竖轴进行平均,如果是按照横轴则是mean(1)即1为数据集最近一天,其中1-10为测试集数据。想要计算C中每一个类别里面 A 列的平均值。给定多个房屋对应电力消耗历史N天的相关。等信息,预测房屋对应电力的消耗。

2024-07-12 23:15:07 273

原创 【4月DataWhale组队学习】图卷积网络

现有图神经⽹络皆基于邻居聚合的框架,即为每个⽬标节点通过聚合其邻居刻画结构信息,进⽽学习⽬标节点的表⽰。因此,在建模图神经⽹络时,研究⼈员的关注重点是如何在⽹络上构建聚合算⼦,聚合算⼦的⽬的是刻画节点的局部结构。现有的聚合算⼦构建分为两类:谱域⽅法:利⽤图上卷积定理从谱域定义图卷积。空间域⽅法:从节点域出发,通过在节点层⾯定义聚合函数来聚合每个中⼼节点和其邻近节点。主要包括空域图卷积神经⽹络、GraphSAGE和图注意⼒⽹络。

2024-04-25 00:54:55 1011

原创 【DataWhale】四月组队学习图神经网络-图表示学习

前段时间24fall终于结束了,终于可以安心的继续学习新内容了。这段时间日语、驾照、深度学习、英语等多样事情齐头并进中。终于把大家的日本语第一册学完了,下周考完科目一后开始复习背诵,接着就可以开始学第二册了好开心。。这个四月报名了图神经网络学习和GPT蝴蝶书共读,希望可以坚持下去哇。前几天比较匆忙所以没有写笔记。。今天正好科目一的题目刷完了,仔细来学一下今天的内容!话说新组装的电脑是A卡……并不能用cuda来着。不知道tensorflow能不能使用,过段时间看看吧。

2024-04-21 23:52:58 1233

原创 【DataWhale四月组队学习】图神经网络-1

在表达能力上,conventional的机器学习:前向神经网络可以近似任何感兴趣的函数(但对graph neuro network不适用),因图神经网络的本质依旧是深度学习在图中的应用,因此会带有dl带来的很多根本性的缺陷。而GNN所处理的数据,不满足时间或者空间的位移不变性,仅具有排列的不变性。好的表示方法应由数据中提取的最少和最有效的特征组成,并能通过机器学习自动获取,这就是所谓的“表示学习”。图表征学习的目标除给图中的节点指派一个低维的向量表征以外,还要求尽量保留图的结构。2: 斯坦福CS224W。

2024-04-15 23:30:01 349

原创 DataWhale组队学习-九月-Day11

这十天的学习说真的有点累了。我一开始的时候觉得自己有这个能力坚持下去,所以没有选择组队。我现在发现我确实是需要这样一个学习小组之类的东西。。从以前我就有感觉到自己其实很早就没有那个良好的学习氛围,大学也没有找到志同道合的朋友和一起交流的学习环境。一群人确实可以走得更远,希望能认识到更加优质更加积极而非无意义的卷的团体。环境影响是一个巨大的话题。一切都是相互联系的,所以很难得出一个干净的定量指标。但要真正着眼于全局。尽管如今大语言模型的还很少,但它正在快速增长。

2023-09-21 14:12:48 422

原创 DataWhale9月打卡-Day10

探测作为一种强大的分析工具,通过冻结语言模型表示编码器(上图中灰色部分)和优化特定任务的探针(上图中预测头,蓝色部分)来工作。这些模型可以是线性的或浅前馈预测头,提供了一种灵活的方法来理解和解释深度学习模型的内部工作机制。固定长度表示的策略也进一步促进了这一目的,提供了灵活而有效的解决方案。冻结(灰色):无需任何操作。优化(蓝色,每个任务有所不同):语言模型的所有参数,外加一个新的预测头。微调是一种强大的工具,可以使预先训练的语言模型更好地符合人类的期望和需求。

2023-09-21 00:04:47 457

原创 Datawhale9月组队学习打卡Day9

今天没什么要写的碎碎念,因为话题太过私人了所以我转移到github的博客上写了。昨天看分布式训练看到了很多不错的想法,下午找论文也寻找到了不错的idea,总之这场学习没有白费力气,很好。一定要去积极的搜索查找学习资料。不多说废话了,开始今天的学习。这一章是“新的模型架构”。我不知道什么是“新的模型架构”。目前来讲多模态clip也用的是transformer。回想一下第7章 模型架构,神经语言模型的核心接口是一个将token序列映射到上下文嵌入的编码器themouseatethe。

2023-09-20 00:25:40 987

原创 Datawhale组队打卡Day8

终于到Day8了,真是不容易啊。从这一周的时间上来看这周事情真的超级多。原本说昨晚应该准备口语素材的结果没准备qwq跑去占星了,昨天晚上原本有kaggle比赛的第一讲,我也没看(不过时间确实可以放在数学建模之后或者这两天有空看一下,和新的对友聊了一下发现对方连pytorch是什么都不知道,唉)、关于医学图像相关的知识我了解的也不是很多,后续可能需要做很多相关的学习。从这段时间开始我就得抓紧每天的时间去学习了,节奏可能会有点快(?

2023-09-18 15:29:32 454

原创 Datawhale组队打卡day7

今天一直很忙……所以没什么时间了。本章讨论重点为如何训练模型。真讨厌一些人啊,根本不相信然后对我说我要你帮我算一下,我说的过程中就使劲怼我说不对,虽然这点在图里面也显现了,乐。不说了,来看!学习这一篇的本章分成目标函数和优化算法两部分。

2023-09-17 23:30:19 240

原创 DataWhale-9月组队学习打卡Day6

感觉这个写在前面都快成我每天的日记本了(笑)。前天的时候终于第一次来了这边校区的图书馆,很大很漂亮。没想到我的卡竟然刷不进新校区图书馆,也是寄寄了。想着可能是因为校园卡被冻结了,于是昨天跑了一趟老图,没想到老图还能刷。很震惊。把校园卡解冻后还没尝试刷校园卡买东西,刷新图书馆还是刷不进来,图书馆管理员查询我信息也很正常。最后打电话给技术部,今天早上终于是给解决了。。不得不说学校技术部门还是给力。我昨天在图书馆里发现了一本自然语言处理的书籍,上次有说到关于《数学之美》。其实那本书我还没有读完。

2023-09-16 23:31:45 410

原创 【无标题】

今天又熬夜了,乐。原本Day4的打卡是早上10点就已经写好了的,硬是拖到了晚上回来,发现已经累到不行了(我也不懂为什么我会那么累,但是就是挺累的),直接躺床上忘记了这回事,今天早上洗澡的时候才想起来woc好像还没打卡。好在天无绝人之路我还是给补打卡了哈哈哈哈,原本想着如果不能补打卡我就一次性把这些全都看一遍,写篇笔记啥的呢。今天早上看助教点评作业我也是在反思自己,我的作业是不是只有学习而没有思考了,或者说我其实就完全学的不是很深入呢。。。带着这些问题来看看今天的学习。

2023-09-16 01:01:53 109

原创 Datawhale9月组队学习Day4

昨天晚上突然发现自己之前参加datawhale拿了优秀学习者的比赛,自己得了二等奖……证书忘记申请了。我当时真没想到自己能得奖,毕竟CV好卷。昨晚过去瞅了一眼发现自己竟然得奖了。说回这边的大模型学习,昨天做的笔记链接,我最后都没有放入打卡里面,因为实在是很丢人,把原本的笔记给照抄照搬了一份过来。今天早上看新一章节的时候就在想要怎么写笔记。我想应该还是“尝试用自己的话来概括”,第二是仔细思考能从里面学习到,或者有什么疑问吧。

2023-09-14 11:14:47 472

原创 DataWhale-9月组队学习-Day3

September9-Day3组队学习

2023-09-13 23:49:31 251

原创 datawhale组队学习9月-Day2

大模型学习day2:困惑度学习以及对各种任务的了解

2023-09-12 09:46:10 379

原创 datawhale组队学习9月Day1

大模型基础学习

2023-09-12 00:37:02 495

原创 Datawhale夏令营第二节笔记

是很基础的CNN方法,但是对于最后的结果来讲比上次提升了0.3,说明了卷积神经网络的效果之优秀。XunFeiDataset在这里主要继承了Torch中的dataset,除此之外根据数据集的自身性质进行了一定的修改。可以直接看出,XunFeiNet继承于RestNet18模型,并在其后面增加了一层卷积层,一层平均池化层,以及一层全连接层,最后输出为(512,2),符合二分类最后应有的输出。XunFeiNet是一个很简单的网络,里面包含两个函数,一个是初始化函数,另一个是前向传播函数。

2023-08-21 23:21:01 106

原创 Data whale AI夏令营(第三期)笔记-part1

data whale很友好的给出来了本次的baseline。本次比赛属于二分类问题。整体baseline符合标准的机器学习的步骤:对数据进行预处理后,提取出相应的特征。接着利用sklearn库中的逻辑回归,简单的运行得到最后的结果。fill:#333;color:#333;color:#333;fill:none;数据提取逻辑回归得到结果整体来讲框架非常简单,私以为重点在于特征提取步骤上。由于本次比赛为医疗影像比赛,因此需要使用医疗影像相关的library。

2023-08-18 23:03:24 251

原创 李宿雨的学习日记Day1

学习day1

2023-03-09 21:19:22 167

原创 Openmmlab AI实战营打卡-第6课

学习笔记

2023-02-09 21:18:51 157

原创 Openmmlab AI实战营打卡-第4课

笔记

2023-02-07 16:02:12 358

原创 Openmmlab AI实战营打卡-第3课

是一些感想

2023-02-04 21:21:15 257

原创 Openmmlab AI实战营打卡-第2课

学习笔记

2023-02-03 16:48:19 370

原创 openmmlab实战营打卡-第1课

昨天晚上是openmmlab的第一节课。介绍的内容都比较的基础,基本上是对后面要学的东西的一些概括。计算机视觉的主要任务,通过一套算法对图像信息进行数据分析。最基础的三大任务:分类,检测,分割目标检测(在图像分类上增加了很多信息,既有类别又有位置信息,位置由框来体现,通过左上角的横纵坐标和右下角的横纵坐标来确定。图像分割任务:能够把像素点直接扣出来。分割也分为两类,一种是直接对像素进行分类,也就是语义分割semantic segmentation另一类叫实例分割,不仅把像素分出来,而且把同一类别

2023-02-02 13:25:01 276

原创 2020-12-01

8255的地址由CS,A1,A0来确定。你的图上因为CS(P2.7)=0,A1(P2.1)A0(P2.0)=00这是PA口的访问地址,而P0口只传输数据,不影响地址,全1.所以地址是7CFFH

2020-12-01 19:56:26 86

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除