- 博客(23)
- 收藏
- 关注
原创 AI+生命科学第二课:入门RNA和特征学习 【Datawhale AI夏令营】
前向传播(Forward Propagation)是神经网络中的一个重要概念,指的是数据在网络中从输入层经过隐藏层传递到输出层的过程。在这个过程中,输入数据被转换为输出预测,每层神经元都会对数据进行一定的线性和非线性变换。具体来说,前向传播包括以下几个步骤:输入层:输入数据进入网络。隐藏层:输入数据经过一系列的隐藏层处理,这些层通常包括线性变换(比如矩阵乘法),以及非线性激活函数的应用。输出层:最终的数据通过输出层产生预测结果。前向传播的目的。
2024-08-01 09:39:54
1038
原创 AI+生命科学方向第一课【Datawhale AI夏令营】
两个文件:dw大佬标注过的ipynb文件数据集文件将数据集压缩包解压完后一键运行下载submission结果、关闭实例官网提交成绩(没人每天提交三次,每次分数需要等待一分钟出分)dw提交打卡成绩。
2024-07-30 16:31:53
422
原创 模糊综合评价模型-模糊综合评价【重生之我要学数模】
对于有数据的题目更加科学一些【相较于topsis来说】题目中给定数据可以自己设定隶属函数/直接给出隶属函数时使用这个方法(自己计算数据时间不够,自己编数据不要被发现)
2024-07-26 09:47:01
772
原创 灰色关联分析【系统分析+综合评价】
找两极最大差和两级最小差(计算后在序列中找最大值即为两极最大差b,反之为最小差a)定义灰色关联度(以平均值average作为三个序列对母序列的关联度)该地区在2000年至2005年间的国内生产总值收到第三产业的影响最大。基本思想:根据序列曲线几何形状的相似程度来判断其练习是否紧密。思考:为什么直观上看第二产业的图像是更符合的。得出结论(所得灰色关联度最大的值作用最强)计算子序列中各个指标与母序列的关联系数。预处理(本章节系统分析中的方法)计算各个指标与母序列的灰色关联度。归一化:所有的值加起来为1,
2024-07-23 11:42:20
532
原创 优略解距离法—Topsis模型【清风数模学习笔记】
常见的四种指标:正向化:将所有指标都转换为极大型极小:max-x中间型:越接近特定值越好区间型:中间型的范围情况(左中间型+1+右中间型)这里M计算时的max和min需要注意:取得时所求数据中的最大值和最小值,例:可以看出来:极小型、中间型都是面向对应数值,区间型面向“数组”
2024-07-22 13:37:11
434
原创 2.4.1 浮点数的表示形式和表示范围【从零开始学计组】
在计算机中,定点小数主要用于表示浮点数的尾数,并没有高级语言数据类型与之对应。基数是提前默认规定好的,不需要进一步设置。定点小数和定点整数共同构成浮点数。浮点数有效扩大了数据表示范围。相较于浮点数的定点数表示。浮点数在机器中的表示A。阶码越长,表示范围越大。
2024-04-29 21:34:54
206
原创 Semi-supervised Vision Transformers at Scale【论文速读】
在这篇文章中,我们介绍了一种名为Semi-ViT的半监督学习方法,用于提高视觉转换器在计算机视觉任务中的性能。首先,我们简要介绍了视觉转换器(Visual Transformer)这种基于Transformer架构的深度学习模型。它已经在很多计算机视觉任务中取得了显著的效果,比如图像分类、目标检测和语义分割等。然后,我们提出了Semi-ViT这个方法。
2024-04-26 01:22:59
1466
2
原创 FixMatch:Simplifying Semi-Supervised Learning with Consistency and Confidence【论文速读】
这篇论文提出了一种名为"FixMatch"的半监督学习方法,该方法主要思想就是使用弱增强后未标记图像作为伪标签,再用强增强后同一图像作为训练样本,从而利用少量标注样本获得更好分类结果. 具体来说:1. FixMatch首先使用模型在弱增强后未标记图像上得到预测结果作为伪标签,然后再用强增强后同一图像预测结果作为真实标签;我们的算法 FixMatch 使用一致性正则化和伪标记来生成人工标签。打破了最近最先进的方法的趋势,这些方法结合了越来越复杂的机制[4,54,3],并产生了一种更简单,但也更准确的方法。
2024-04-26 01:19:37
1163
1
原创 三步精读论文法--李沐老师
在这之后根据自己需求判断这篇文章的难度适不适合自己,如果不适合就可以选择这篇文章引用的更简单、基础的一些的文章。在阅读过程中,发现作者引用的重要文献自己没有读过就可以把他圈起来。这个过后可能还不是特别懂他在讲什么,不要紧,可以留到最后。关键是知道文章每一个字在干什么,然后自己脑补自己怎么做。然后去实验和方法部分大致看一眼图和表讲的是什么。读标题、摘要和结论-->知道论文在讲什么。作者方法和别人是怎么对比的,差距又有多大。重要的图和表搞清楚他每一个字在干什么。把自己的角度代入到作者的论文中。
2024-02-01 11:23:59
676
1
原创 03 安装【动手学深度学习v2】
课程特点:实操学习效果:看 --> 听 --> 看+听 --> 做 --> 讲材料放在github上、可以修改材料和同学讲。
2024-01-31 23:25:45
363
原创 深度学习纯小白初步尝试阅读顶会
刚开始也是想通过论文的阅读来逐渐深入的了解这个领域相关的内容,在学长的推荐下看了这篇文章,当然我的英文也不是很好,刚开始凭借翻译一点点理解这里面的每个名词的含义以及他们的逻辑关系,哪个不懂搜哪个,并且借助一定的GPT的力量。我是从前往后一点点啃的,我是真的没有一点相关知识积累,前面文字部分还可以通过搜索和GPT的方法来逐渐了解,到了后面名词越来越多、其中逻辑关系的梳理不免变得困难许多,再到后面算法部分就更是摸不着头脑,现在打算先去进修一下相关知识基础再来继续阅读。
2024-01-31 23:00:10
1008
原创 02 深度学习介绍【动手学深度学习v2】
深度学习:是机器学习的一种、可以做自然语言处理、计算机视觉,也做可以更高深一点的东西。领域专家 - > 比如农业专家想看今年的收成、领域专家可以当作甲方、数据科学家是乙方。机器学习的可解释性 - > 不同模型会考虑不同的信息、现在仍在等待更多学术的进展。规划:在知道一些的基础上可以对未来做出一定的规划、我未来可以做些什么事情。数据科学家:原始数据 - > 机器学习可理解的数据 -> 训练模型。知识:根据我看到的数据、我看到的现象来形成自己的知识结构。感知:最底层的、我所了解到的东西、我所看到的。
2024-01-25 21:50:54
407
原创 01 课程安排【动手学深度学习v2】学习目标
每次直播讲四小节、每小节讲10min算法、10min代码实现、5min问答。适用人群:AI相关从业人员、数据科学家、工程师、研究员、学生。自然语言处理--深度学习和人工智能最大的两大领域之一。计算机视觉--深度学习和人工智能最大的两大领域之一。高性能计算---怎么并行、多GPU、分布式。Why -- 背后的原因(直觉、数学)What -- 深度学习里有哪些技术。损失函数、目标函数、过拟合、优化。优化算法---机器学习的基础。How -- 如何实现调参。频率:每天1-2节课视频。每月一次kaggle竞赛。
2024-01-25 21:44:20
408
原创 偷偷称为一名炼丹师、掌握核心参数然后惊艳所有人!
各种算法各有所长,如有需要可根据青葉老师的指引认真选择自己需要的训练类型,除此之外也有一些由训练结果的来的经验,比如LoHa、LoKR更擅长训练画风且面对多概念训练时会更有优势、但在单一训练集上优势并不大。但是往往我们将ai对每张图片的学习次数不设置为一,我们将对每张图片的学习次数定义为“重复次数”,当我们将“重复次数”设置为6时,学习完所有图片需要走的步数就是30*6=180步。打个比方,把炼模型比作烧菜,那么总步长就是烧菜的时间,时间短了,菜就不熟,时间长了,菜就有烧糊的风险;
2024-01-24 23:14:36
2483
原创 不知道几天能学完《概率论与数理统计》之1.1随机统计
其实按常理来说,必然事件和不可能事件都不算是随机事件,只是我们为了研究方便,把随机事件做成两个极端就有了必然事件和不可能事件。电话交换台单位时间内呼叫的次数:Ω={0,1,2,3,4,5,....n....}骰子点数不大于三:C={ C={1,2}(集合表示)扔两个硬币:Ω={(正,正),(正,反),(反,正),(反,反)}三维空间中扔一个质子,Ω={(x,y,z)|x,y,z∈R}平面内扔一个质子,Ω={(x,y)|x,y∈R}掷骰子:Ω={1,2,3,4,5,6}
2024-01-24 22:59:56
363
原创 以最快的速度带你体验炼出一炉LoRA的感觉!
这里我们只需要两步,就可以直接体验用最快的速度炼出一炉LoRA的感觉!1.将Presets(其中有很多经过检验的预设好的参数)设置为“iA3-Prodigy-sd15”2.定义训练训练时长
2024-01-18 00:25:47
1779
1
原创 2分钟教你配置好LoRA模型训练器—Kohya
重启电脑后使用Git clone进行官方程序的安装安装同时阅读附带文档(windows版),其中包含所有安装所需的脚本命令。
2024-01-18 00:14:09
3476
1
原创 60分钟速通LoRA模型训练!
Texual Inversional只微调了文本编辑器Dreambooth等手段微调文本编译器和噪声预测器两部分(噪声预测器微调难度更大,db的高配置要求就是为了同时微调其中的所有参数)训练的意义:让模型的“认知”发生改变,模型里以向量形式存储的像素分布规律发生改变,执行运算的时候,他们会被用来调节算法的运行逻辑从而输出不同的结果 ---> 模型权重在深度学习中,模型的权重·(Weights)是指神经网络中的参数,这些参数用于调整和学习模型的行为,以便能够对输入数据进行有效的映射和提取有用的特征。
2024-01-15 22:34:20
773
原创 第一章 建立数学模型
将以上概念的共同点进行汇总能得出:模型是为了一定目的,对客观事物的一部分及逆行减缩、抽象、提炼出来的原型 的替代物,它集中反映了原型中人们需要的那一部分特征。这个问题我们小学时在数学课本上见过类似的题目,我们是利用自己的逻辑跳过步骤直接得到的答案,如果我们使用数学模型该如何解答呢?测试分析:将对象看作“黑箱”,通过对量测数据的统计分析,找出与数据拟合最好的模型。而数学建模是指建立数学模型的全过程(包括表述问题、求解、解释、检验等)模型分析:误差分析、统计分析、模型对数据的稳定性分析等。
2024-01-15 22:24:01
1214
原创 博客开张及本博客内容简介
主要介绍如 ChatGPT的文字工具,Midjourney 和 Stable Diffusion 的图片工具,Runway 的视频工具,3D 和 音频还没有很好代表工具(持续观察和学习)以及这些工具组合起来完成一个商业作品。主要介绍和大语言模型(LLM)相关的开发经验。会比较侧重于大语言模型(LLM)的应用层开发、微调大语言模型(LLM)和部署大语言模型(LLM)方面的话题。观察了生成式 AI 一年的发展,我不再像以前只是作为一个消费者,期末考试进行中的时刻,我觉得把之前一年的学习和观察记录下来。
2023-12-02 20:00:52
40
原创 机器学习开营仪式
机器学习是人工智能领域中的一个重要分支,它旨在开发能够从数据中学习和改进的计算机算法。这种学习过程使计算机能够识别数据中的模式和规律,并通过这些经验来做出预测、做出决策或执行特定任务。与传统的编程方式不同,机器学习的算法能够自动从数据中学习,无需显式地编写具体规则。机器学习的应用范围非常广泛,涵盖了许多不同的领域。在监督学习中,算法从带有标签的数据样本中学习,并能对新的未标记数据进行分类或回归。而在无监督学习中,算法通过发现数据中的隐藏结构和模式,实现数据的聚类和降维等任务。
2023-07-23 18:50:50
63
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人