- 博客(94)
- 收藏
- 关注

原创 基于 VScode 的 git 详细使用指南【保姆级!建议收藏!】
建议收藏!本文介绍了基于VScode图形化界面如何使用git,内容超级详细,保姆级教程,新手必看!!!
2024-02-05 10:53:01
69527
59
原创 【Datawhale AI 夏令营】CV图像竞赛——Deepfake攻防
随着人工智能技术的迅猛发展,深度伪造技术(Deepfake)正成为数字世界中的一把双刃剑。Deepfake技术可以通过人工智能算法生成高度逼真的图像、视频和音频内容,这些内容看起来与真实的毫无二致。 Baseline代码,采用了timm库来进行图像模型的训练和推理。指标计算与显示类类用于计算和存储指标的平均值和当前值。它通常用于跟踪训练过程中每个epoch或batch的损失值、精度等。"""计算和存储指标的平均值和当前值"""# 重置所有值# 更新当前值。
2024-07-20 23:52:34
1477
2
原创 【自然语言处理】面向新冠肺炎的社会计算应用
新冠肺炎疫情牵动着我们每一个人的心,在这个案例中,我们将尝试用社会计算的方法对疫情相关的新闻和谣言进行分析,助力疫情信息研究。本次作业为开放性作业,我们提供了疫情期间的社交数据,鼓励同学们从新闻、谣言以及法律文书中分析社会趋势。(提示:运用课上学到的方法,如情感分析、信息抽取、阅读理解等分析数据)
2024-07-11 09:10:07
1304
原创 【自然语言处理】司法阅读理解
裁判文书中包含了丰富的案件信息,比如时间、地点、人物关系等等,通过机器智能化地阅读理解裁判文书,可以更快速、便捷地辅助法官、律师以及普通大众获取所需信息。本次任务覆盖多种法律文书类型,包括民事、刑事、行政,问题类型为多步推理,即对于给定问题,只通过单句文本很难得出正确回答,模型需要结合多句话通过推理得出答案。分数由两部分组成。首先,读懂已有代码并添加适量注释。使用已有代码在训练数据上进行训练,并且完成开发集评测,这部分占60%,评分依据为模型的开发集性能和报告,报告主要包括对于模型基本原理的介绍,需要同学
2024-06-30 14:53:57
716
1
原创 【自然语言处理】预训练语言模型实现与应用
案例中给出了训练代码train.py与相应的训练流程代码Config.py。下面介绍具体代码架构。自定义数据集类MyDataset类用于封装数据集的加载逻辑,包括初始化数据路径、读取 JSON 和 Numpy 文件,以及实现按索引获取数据项和获取数据集长度的方法。准确率工具类Accuracy类用于跟踪和计算模型预测的准确率。配置类Config类是Config.py核心,封装了模型训练和测试的所有配置参数和方法。__init__
2024-06-30 14:52:36
884
1
原创 千帆 AppBuilder 工作流编排功能直播总结
上个月,千帆AppBuilder推出了一项引人瞩目的新功能——工作流编排。在官方直播中,百度产品经理不仅深入介绍了这项功能,而且还通过创建多个组件,生动展示了AppBuilder组件工作流的强大功能。今天,我想通过文字的形式,将直播中学习到的宝贵知识记录下来,以便大家能够方便地学习和参考。 官方分别通过创建 菜谱查询组件 与 中考政策查询组件,主要介绍了组件的 API节点 与 知识库节点。
2024-06-04 10:30:00
1179
原创 【自然语言处理】文本情感分析
特征提取方法训练误差测试误差词袋模型0.01380.2712n-gram模型0.00060.3306词向量模型0.22030.2369从表格可以看出,n-gram模型在训练集上的误差最低,但在测试集上的误差却最高,表明其可能过拟合了训练数据。词袋模型在训练集和测试集上的误差较为平衡,而词向量模型在测试集上的表现最好,尽管其在训练集上的误差较高。性能:词袋模型在训练集上表现很好,但在测试集上有较高的误差,可能存在一定的过拟合。
2024-06-04 09:00:00
1766
原创 AppBuilder低代码体验:构建雅思大作文组件
AppBuilder 组件工作流中,除了开始和结束节点以外,目前一共有5个基础节点,分别为大模型、知识库、API、分支器与代码节点,下面分别介绍每个结点的功能。 本次体验了通过百度千帆 AppBuilder 的低代码模式,通过工作流构建组件,创建应用。整体体验下来,工作流模式的组件,能够完成更强大、更有逻辑的工作。本次应用创建,只采用了大模型节点**,没有用到其他节点,实现的功能也是比较单一,之后还有优化空间。
2024-05-11 22:50:44
1401
原创 【自然语言处理】seq2seq模型——机器翻译
可以看到,通过多种改进方式,有效提升了模型能力,最终采用了训练 150000 epoch 轮次的双向GRU编码器,训练结果最好。模型训练...loss曲线如下:模型验证通过predict来测试test.txt文件,前十条数据翻译如下。Original為什麼我一直學不好英語?她讓我坐在她的身邊。這瓶酸奶不含乳糖。這瓶酸奶不含乳糖。我不能幫你了。我不能幫你了。湯姆不是一個好司機。我會普通話、西南官話、吳語和西班牙語。這個問題沒有那麼簡單。他不會說英語也不會說法語。
2024-05-07 16:40:57
1837
原创 【自然语言处理】Word2Vec&TranE的实现
Word2Vec是词嵌入的经典模型,它通过词之间的上下文信息来建模词的相似度。TransE是知识表示学习领域的经典模型,它借鉴了Word2Vec的思路,用“头实体+关系=尾实体”这一简单的训练目标取得了惊人的效果。本次任务要求在给定的框架中分别基于Text8和Wikidata数据集实现Word2Vec和TransE,并用具体实例体会词向量和实体/关系向量的含义。
2024-04-29 15:32:32
864
原创 【深度学习】图像超分辨
本次案例将使用生成对抗网络来实现 4 倍图像超分辨任务,输入一张低分辨率图像,生成器会生成一张 4 倍超分辨率的图像,如图 1 所示。生成对抗网络选用 SRGAN 结构[1]。本案例训练集使用 DIV2K 数据集[2],包含有800张2K左右高分辨率的图像和 800 张对应的低分辨率图像;测试集使用 DIV2K 验证集[2]、 Set5 、 Set14 、 B100 、 Urban 100五个数据集,分别包括高分辨率图像和对应的低分辨率图像。
2024-04-13 13:36:51
2721
原创 【深度学习】图像自然语言描述生成
本次案例将使用深度学习技术来完成图像自然语言描述生成任务,输入一张图片,模型会给出关于图片内容的语言描述。本案例使用 coco2014 数据集[1],包含 82,783 张训练图片,40,504 张验证图片,40,775 张测试图片。案例使用 Andrej Karpathy[2]提供的数据集划分方式和图片标注信息,案例已提供数据处理的脚本,只需下载数据集和划分方式即可。
2024-04-03 16:04:52
1618
2
原创 【千帆杯】K12教育常规赛 北京场线下交流会心得
周日有幸参加了),去线下组队创作了 K12教育 相关的智能体。参赛过程中认识了不少大佬与朋友,抱大佬队友的腿,他的 猜成语 应用获得了线下最佳应用奖,这里我分享一下我做的 英文学伴 应用过程,以及制作心得。
2024-04-01 00:01:32
911
原创 【DataWhale】灵境Agent开发——低代码创建AI智能体
低代码模式支持开发者通过编排工作流的方式快速构建智能体,您可以通过拖拽和组合模型、提示词、代码等模块,实现准确的、复杂的业务流程。 个人体验下来,目前这个低代码开发功能还不是很完善,许多组件功能都十分有限,没法增加更多自定义的功能。可以说,体验效果并不是很好,不如零代码开发方便,灵活。
2024-03-23 23:04:04
2104
12
原创 【DataWhale】灵境Agent开发——零代码创建AI智能体
这次我参加了 DataWhale 的灵境Agent开发者训练营,第一次开发了一款属于自己的Agent,整体体验下来,操作还是非常方便的。灵境Agent和Coze上面创建的bot差不多,零代码开发可以仅仅通过与 bot 对话,不需要任何代码基础,就能创建属于自己的Agent,这种Agent在大模型的基础上,加上你的个性化提示词,最终达到的效果也是非常哇塞的。
2024-03-23 10:00:00
2635
原创 【DataWhale学习】用免费GPU线上跑chatGLM、SD项目实践
本文以趋动云平台为例,详细介绍下如何通过平台提供的在线开发环境,直接在云端编写、运行代码,并使用**GPU资源进行加速**。用免费GPU创建属于自己的聊天GPT用免费GPU部署自己的stable-diffusion注册即送168元算力金Datawhale专属注册链接:https://growthdata.virtaicloud.com/t/SA适用人群新手开发者、快速原型设计者;需要协作和分享的团队;对大模型部署感兴趣的人;深度学习入门学习者;对使用GPU资源有需求的人。
2024-03-22 23:37:03
1204
原创 【DataWhale学习】灵境Agent开发——Agent介绍
这次我参加了 DataWhale 的灵境Agent开发者训练营,第一次开发了一款属于自己的Agent,整体体验下来,操作还是非常方便的。灵境Agent和Coze上面创建的bot差不多,零代码开发可以仅仅通过与 bot 对话,不需要任何代码基础,就能创建属于自己的Agent,这种Agent在大模型的基础上,加上你的个性化提示词,最终达到的效果也是非常哇塞的。
2024-03-22 23:35:02
1040
原创 【深度学习】滴滴出行-交通场景目标检测
本次案例将使用深度学习技术来完成城市交通场景下的目标检测任务,案例所使用的数据集由滴滴出行提供,基于D2-City大规模行车记录视频数据集[1],经过视频抽帧等预处理步骤得到。数据集共包含12,000张图像,每张图像的大小为1080×1920或720×1280,已划分为训练集(10,000张)、验证集(1,000张)、测试集(1,000张),其中训练集和验证集提供了检测标签,测试集仅提供图像,用于提交后测试模型效果。
2024-03-18 10:00:00
2819
54
原创 【DataWhale学习】用免费GPU线上跑StableDiffusion项目实践
本文以趋动云平台为例,详细介绍下如何通过平台提供的在线开发环境,直接在云端编写、运行代码,并使用GPU资源进行加速。用免费GPU创建属于自己的聊天GPT用免费GPU部署自己的stable-diffusion注册即送168元算力金Datawhale专属注册链接:https://growthdata.virtaicloud.com/t/SA适用人群新手开发者、快速原型设计者;需要协作和分享的团队;对大模型部署感兴趣的人;深度学习入门学习者;对使用GPU资源有需求的人。
2024-03-12 12:47:05
1874
7
原创 【DataWhale学习】用免费GPU线上跑chatGLM项目实践
本文以趋动云平台为例,详细介绍下如何通过平台提供的在线开发环境,直接在云端编写、运行代码,并使用**GPU资源进行加速**。用免费GPU创建属于自己的聊天GPT用免费GPU部署自己的stable-diffusion注册即送168元算力金Datawhale专属注册链接:https://growthdata.virtaicloud.com/t/SA适用人群新手开发者、快速原型设计者;需要协作和分享的团队;对大模型部署感兴趣的人;深度学习入门学习者;对使用GPU资源有需求的人。
2024-03-11 14:33:45
2216
17
原创 【SD学习】开始绘制你的第一张美图
去年其实我已经接触过使用StableDiffusion,但是当时是自己部署的环境,费劲在本地部署完环境后,用基础模型生成几张图之后,感觉也就是那样,就没再尝试了。最近有时间又重新尝试了一下,经过几个月的变迁,StableDiffusion已经有了非常大的变化了,除了以前常用的WebUI,现在还有功能更全面模块化的ComfiUI。
2024-03-10 16:12:14
1213
26
原创 【深度学习】脑部MRI图像分割
本次案例将使用深度学习技术来完成脑部MRI(磁共振)图像分割任务,即对于处理好的一张MRI图像,通过神经网络分割出其中病变的区域。本次案例使用的数据集来自Kaggle[1],共包含110位病人的MRI数据,每位病人对应多张通道数为3的.tif格式图像,其对应的分割结果为单通道黑白图像(白色为病变区域),示例如下。第一行: MRI图像;第二行: 对应的分割标签更详细的背景介绍请参考文献[2] 对比所有模型结果的训练、测试的loss曲线与测试集上的DSC曲线,结果如下。
2024-03-05 09:13:32
5006
33
原创 【百度智能云千帆杯】对话第一期最强挑战者(文字版)
我们需要在这里明确角色的定义,比如说在这个任务里,我需要他写Python代码,因此我就告诉模型,你是一个Python代码助手。然后就是告诉模型它需要实现一个什么样的功能。例如本题就是一个优化问题,同时这里还要把我们的题目中的图像信息转换成文字信息。注意在prompt中最好不要中英混杂,我最开始也在考虑,如果提示词写英文会不会好一些,但是考虑到文心毕竟是一个中文模型,训练时候的中文语料肯定是最多的,如果贸然改成英文这反而会导致结果变差。
2024-03-01 10:00:00
2333
2
原创 AI的未来:从Sam Altman的WGS 2024发言看人工智能的局限性、潜力和价值
Sam Altman在世界政府峰会上的发言为我们提供了一个宝贵的视角,让我们更加清晰地看到了AI技术的未来走向。他强调了AI的潜力与机遇,同时也指出了其中的风险与挑战。作为全球社会,我们需要共同努力,制定出有效的政策和监管机制,以确保AI技术的健康发展,并使其真正造福于全人类。
2024-02-28 10:30:00
417
原创 【深度学习笔记】深度学习训练技巧
随机梯度下降及动量随机梯度下降算法对每批数据Xiti进行优化g∇θJθ;xitiθθ−ηg随机梯度下降算法的基本思想是,在每次迭代中,随机选择一个样本i,计算该样本的梯度g∇θJθ;xiti,然后按照梯度的反方向更新参数θ,即θθ−ηg,其中η是学习率,控制更新的步长。基于动量的更新过程。
2024-02-26 15:00:00
995
原创 【深度学习】CIFAR10图像分类
使用PyTorch分别实现多层感知机(MLP)和卷积网络(ConvNet),并完成CIFAR10数据集(http://www.cs.toronto.edu/~kriz/cifar.html)分类。本案例不提供初始代码,请自行配置网络和选取超参数,包括层数、卷积核数目、激活函数类型、损失函数类型、优化器等方面。至少从三个方面。
2024-02-26 10:00:00
2534
2
原创 隐星P15 新机开荒
双十一购买了一台七彩虹隐星P15笔记本,i713620h,4060,512g版本,性价比还是很高的,是我用的第一台win11系统的电脑。但毕竟是二线厂家嘛,售后没有线下网点,只能上门服务,加装固态需要收费120,还是比较贵的。 到手后,我又加装了一块宏碁GM7的1t固态硬盘,并重装win11系统到新的硬盘里面,过程中也出现了一些问题,比如笔记本后盖扣不开,重装系统音频掉驱动等。
2024-02-24 10:30:00
6746
5
原创 我的创作纪念日——365天,达成1000粉丝啦
昨天,客服突然给我发消息,说不知不觉今天已经是你成为创作者的 第365天(1年) 啦,不得不说时间真快呀。
2024-02-23 10:00:00
475
原创 【深度学习笔记】多层感知机
多层感知机(Multi-layer Perceptron,MLP)前向传播l1...L−1层l层的神经元j的输入ujl∑jwjilyil−1bjl,注意y0xl层的神经元j的输出yjlfujl;f⋅是激活函数lL层:对应任务层(Softmax分类、回归、图像去噪)激活函数Sigmoid函数fz1e−z1f′zfz1−fz))双曲正切函数。
2024-02-22 10:30:00
1385
原创 【深度学习笔记】回归与分类
定义目标:给定数据点Xn∈Rm和相应标签tn∈Ω,找到一个映射fRm→Ω连续的数值变量连续回归(regression)划分为离散的类离散分类(classification)回归类型线性回归:用于建立因变量和自变量之间线性关系的统计方法fxwxβ其中,y是因变量,x1x2⋯xn是自变量,β0β1⋯βn是回归系数。多项式回归:多项式回归是一种扩展了线性回归的方法,它可以拟合因变量和自变量之间的非线性关系。fx。
2024-02-22 10:00:00
1939
原创 计算机专业必看的几部电影
计算机专业的同学们,你们是否喜欢看电影呢?如果你们想要在休闲的时候,既能享受视觉的震撼,又能学习到一些计算机知识和技能,那么我为你们推荐几部计算机专业必看的电影,它们不仅有着精彩的剧情和特效,还有着深刻的主题和寓意,让你们在娱乐中收获更多。
2024-02-21 12:11:46
446
原创 【百度智能云千帆杯】贺岁灵感模型
由以上实验结果可知,在特定目标上,全量更新的训练结果更好,数据集更大按理说效果也应该更好,但从结果来看并没有明显提升,可能数据集数量上差距并不大。 最终,我又重新训练了一个版本,使用扩展后的训练集,采用全量训练的方法,训练15轮得到的模型,训练过程如下。可知本次训练结果成功收敛,训练较为不错。 之后,在平台上进行模型评估,采用自动规则打分指标结合自动裁员打分指标,结果如下。 由评估结果可知,本次训练结果较为不错,除了准确率以外的得分都比较高。
2024-02-21 10:30:00
2039
2
原创 【机器学习笔记】支持向量机SVM
分类算法回顾决策树样本的属性非数值目标函数是离散的贝叶斯学习数值或非数值连续的(概率)K-近邻空间(例如欧氏空间)中的点连续的也可以是离散的支持向量机 (Support Vector Machine)空间(例如欧氏空间)中的点连续的也可以是离散的背景信息当前版本的支持向量机大部分是由 Vapnik 和他的同事在 AT&T贝尔实验室 开发的支持向量机 (Support Vector Machine,SVM)是一个最大间隔分类器(Max Margin Classifier)
2024-02-21 10:00:00
1049
原创 【深度学习笔记】深度学习训练技巧——超参数选取
由Fei-Fei Li & Justin Johnson & Serena Yeung(CS231n 2019,Stanford University)给出的建议。超参数: 控制算法行为,且不会被算法本身所更新,通常决定了一个模型的。在全部数据上训练模型,并找到使损失值能够快速下降的学习率。当损失值下降较慢时,将学习率缩小10倍。第4步:粗粒度改变学习率,训练1-5轮。第5步:细粒度改变学习率,训练更长时间。第3步:找到使损失下降的学习率。第1步:观察初始损失。第6步:观察损失曲线。
2024-02-20 15:30:00
422
原创 【深度学习笔记】深度学习训练技巧——批归一化
批归一化(Batch Normalization,BatchNorm)是一种用于优化深度神经网络的方法,它可以通过对每一层的输入数据进行标准化处理,使其。,从而减少每一层输入数据分布的变化,加快网络的收敛速度,提高网络的泛化能力和鲁棒性。对每个标量形式的特征单独进行归一化,使其均值为0,方差为1。当使用SGD时,不同迭代次数时输入到神经网络的数据不同,ICS:训练中,深度神经网络中间节点分布的变化。是可学习的参数,用于调整数据的尺度和偏移,是一个小常数,用于防止除零错误,是该层输入数据的均值和方差,
2024-02-20 10:00:00
601
原创 【深度学习笔记】深度学习训练技巧——处理过拟合
数据增强(Data Augmentation)是一种用于优化深度学习模型的方法,它可以通过从现有数据生成新的训练数据来扩展原数据集,从而提高模型的泛化能力和防止过拟合。一个隐含层神经元不能依赖于其它存在的神经元,因此可以防止神经元出现复杂的相互协同(co-adaptations)实践中,p在低层设得较小,例如0.2,但在高层设得更大,例如0.5。旋转、缩放、裁剪、翻转、调整亮度、对比度、颜色。这些被置零的输出,将用于在反向传播中计算梯度。等,以生成新的、多样的、有代表性的样本。在训练迭代过程中,以。
2024-02-19 15:30:00
434
原创 【深度学习笔记】深度学习训练技巧——优化器
Adam 算法可以利用一阶矩和二阶矩的信息,实现自适应的学习率调整,使得参数在梯度方向上加速,而在垂直梯度方向上减速,从而避免参数在最优值附近的震荡,加快收敛速度。为了改善随机梯度下降算法的收敛性,可以引入动量(momentum)的概念,即在更新参数时,考虑之前的更新方向和幅度,使得参数沿着一个平滑的轨迹移动。是一个介于 0 和 1 之间的常数,通常为0.9、0.99、0.999,用于控制历史信息的影响程度。的梯度下降算法,它可以根据不同的参数调整不同的学习率,使得目标函数更快地收敛。
2024-02-19 10:00:00
680
原创 【深度学习】基于多层感知机的手写数字识别
案例2:构建自己的多层感知机: MNIST手写数字识别相关知识点: numpy科学计算包,如向量化操作,广播机制等1 任务目标1.1 数据集简介 MNIST手写数字识别数据集是图像分类领域最常用的数据集之一,它包含60,000张训练图片,10,000张测试图片,图片中的数字均被缩放到同一尺寸且置于图像中央,图片大小为28×28。MNIST数据集中的每个样本都是一个大小为784×1的矩阵(从28×28转换得到)。MNIST数据集中的数字包括0到9共10类,如下图所示。注意,任何关于测试集的信息
2024-02-12 15:00:00
3306
原创 【机器学习笔记】线性支持向量机
分类算法回顾决策树样本的属性非数值目标函数是离散的贝叶斯学习数值或非数值连续的(概率)K-近邻空间(例如欧氏空间)中的点连续的也可以是离散的支持向量机 (Support Vector Machine)空间(例如欧氏空间)中的点连续的也可以是离散的背景信息当前版本的支持向量机大部分是由 Vapnik 和他的同事在 AT&T贝尔实验室 开发的支持向量机 (Support Vector Machine,SVM)是一个最大间隔分类器(Max Margin Classifier)
2024-02-11 19:19:47
1543
2
【北京工业大学】微机原理 8251串行通信实验报告
2024-07-12
北京工业大学十套数据结构试题及答案
2024-07-12
【北京工业大学】嵌入式系统实验报告
2024-07-12
【北京工业大学】计算机组成原理课设报告
2024-07-12
【北京工业大学】高级语言程序设计课设实验报告
2024-07-12
Trec06中文垃圾邮件数据集
2024-05-23
基于多层感知机的手写数字识别
2024-05-14
【北京工业大学】集成电路分析与设计实验报告
2024-05-05
【北京工业大学】电子技术实验报告-测量放大器+数字积分器
2024-05-05
【北京工业大学】电子技术实验报告-数字积分器
2024-05-05
【北京工业大学】音乐厅音质设计 实验报告
2024-05-05
基于D^2-City大规模行车记录视频数据集
2024-05-05
某闯关类手游用户流失预测 数据集
2024-04-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人