- 博客(371)
- 资源 (5)
- 收藏
- 关注
原创 熵增大与信息量的关系以及互信息最大化
熵 ( H(z_I) ) 是一个随机变量 ( z_I ) 的信息量的度量,定义为:直观理解熵 ( H(z_I) ) 衡量了随机变量 ( z_I ) 的不确定性或分布的多样性。当 ( z_I ) 的分布更均匀(例如每个可能值的概率都差不多)时,熵更大,表明该变量包含更多的潜在信息量。熵增大与信息量的关系熵增大表示随机变量的潜在信息量增加。但熵的增大必须是有意义的,不能仅仅是随机化的结果。互信息最大化的作用。
2025-03-05 10:04:56
551
原创 【AI论文】Visual Instruction Tuning
作者的目标是通过多模态指令微调(Visual Instruction Tuning)来训练一个通用的视觉助手,使其能够理解用户的语言指令并与视觉内容结合完成任务。例如,用户可以上传图片并提出问题,模型根据图片内容作出回答。现有的多模态指令执行模型大致可以分为以下两类:端到端训练的模型基于系统协调多个模型核心: 将图像的描述和边框输入给GPT,让GPT生成指令(对话、详细描述、推理性)。多模态数据的现状:解决方案:利用现有的图片-文本对:问题: 此类简单扩展数据虽然成本低,但缺乏多样性和深度推理。
2025-02-11 21:05:39
1080
原创 【AI基础知识】什么是指令调优?具体如何实现?
指令调优是一种通过引入大量自然语言任务指令对大型语言模型(LLMs)进行微调的方法,旨在提升模型理解和完成多样化任务的能力,尤其是在从未见过的新任务中的零样本表现。具体实现包括以下步骤:准备指令数据:构建包含指令、输入和输出的多样化任务数据,数据来源可以是人工构造、机器生成或已有数据集转换。训练模型:在指令数据上对模型进行监督学习,优化生成的输出以匹配预期结果。评估性能:通过零样本和少样本测试评估模型在新任务上的推理能力。指令调优通过教会模型根据任务描述调整输出,显著增强了其泛化能力和实用性,被广
2025-02-11 19:03:00
1090
原创 GAN(生成对抗网络)原理与目标函数
GAN 是一个博弈过程,生成器和判别器互相竞争。生成器通过学习真实数据分布 ( P_r ),从一个简单的潜在分布 ( P_z ) 中采样,然后生成接近 ( P_r ) 的数据。判别器的任务是区分真实数据和生成数据,而生成器的任务是尽量骗过判别器。GAN 的训练目标是让生成器生成的数据分布 ( P_g ) 无限接近于真实数据分布 ( P_r )。
2024-12-07 19:00:01
1297
1
原创 html+spring+服务器 部署一个项目 可用于安卓
三步都做完后,即可在html测试输入数据,在云服务器即可创建文件。需求:安卓项目的数据上传到云端,安卓的页面是用html写的。项目写好后,按照这个方法部署到云端。
2023-05-02 19:37:17
530
1
原创 如果实在解决不了 org.springframework.beans.factory.UnsatisfiedDependencyException,可能是因为……
解决问题
2022-08-16 17:20:33
339
原创 Matplotlib中的fill_between;np.argsort()函数
1.Matplotlib中的fill_between这个函数可以实现的图像折现附近有阴影的效果。如图:具体用法与参数参考下面链接。看这篇2.np.argsort()这个方法的功能:将矩阵a按照axis排序,并返回排序后的下标看这篇...
2022-03-27 15:03:53
651
原创 多项式回归(PolynomialFeatures)
学习于这篇文章 这里是链接大概意思是:一些比较复杂的模型如果用线性拟合会有较大误差,这时需要多项式的线性拟合,(比如x的平方、x的三次方等)。随着维度的增加,拟合度会变的较好,但需要注意可能会导致过拟合。...
2022-03-27 14:55:09
583
原创 sklearn中的pipeline机制
学习于此篇。 这篇文章大概是这样的意思:相当于把这三个步骤进行了封装,而且顺序一定要按照机器学习的流程顺序。
2022-03-27 11:47:28
514
原创 sklearn中的学习曲线learning_curve函数
一、运行原理学习曲线。确定交叉验证的针对不同训练集大小的训练和测试分数。交叉验证生成器将整个数据集拆分为训练和测试数据中的k次。 具有不同大小的训练集的子集将用于训练估计器,并为每个训练子集大小和测试集计算分数。 之后,对于每个训练子集大小,将对所有k次运行的得分进行平均。二、函数格式sklearn.model_selection.learning_curve(estimator, X, y, groups=None, train_sizes=array([0.1, 0.33, 0.55, 0.7
2022-03-24 10:22:13
538
原创 简单说Q-Q图;stats.probplot(QQ图)
检验样本数据概率分布(例如正态分布)的方法。使用方法如下:fig = plt.figure()res = stats.probplot(train[‘SalePrice’], plot=plt) #默认检测是正态分布plt.show()注意: 红色线条表示正态分布,蓝色线条表示样本数据,蓝色越接近红色参考线,说明越符合预期分布(这是是正态分布)q-q 图是通过比较数据和正态分布的分位数是否相等来判断数据是不是符合正态分布注:学习于这篇文章...
2022-03-10 16:35:28
3514
原创 彻底搞懂箱形图分析
学习于 这篇文章文章目录一、箱形图二、五大因“数”1、下四分位数Q12、中位数(第二个四分位数)Q23、上四分位数Q34、上限5、下限三、箱形图的价值1.直观明了地识别数据批中的异常值2.利用箱线图判断数据批的偏态和尾重3.利用箱线图比较几批数据的形状一、箱形图箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。箱形图最大的优点就是不受异常值的影响,能够准确稳定
2022-03-10 15:44:43
8522
2
原创 Jupyter Notebook安装库;ModuleNotFoundError: No module named ‘plotly‘解决方案。
这种问题一般都是因为要引用的库没提前装好,记录一下安装库的步骤。首先需要找到这个文件夹目录:寻找方法hhhh)不知道有没有跟我一样的总忘记在哪里安装的人。直接右键这个应用 打开文件位置。输出 conda list 查询一下有没有安装过如果没有装过的话 输入 pip install plotly...
2022-03-10 10:15:35
2631
原创 字典特征提取,文本特征提取。
文章目录1 定义2. 字典特征提取API3. 字典特征提取案例:1.实现效果:2.实现代码4. 文本特征提取1. 方法2. 英文案例1. 实现效果2.流程3. 中文案例使用到的包1 定义将任意数据(如文本或图像)转换为可用于机器学习的数字特征注:特征值化是为了计算机更好的去理解数据特征提取分类:字典特征提取(特征离散化)文本特征提取图像特征提取2. 字典特征提取APIsklearn.feature_extraction3. 字典特征提取案例:1.实现效果:2.实现代码
2022-03-09 10:47:59
1872
原创 决策树算法---简介、分类原理(熵、信息增益、信息增益率、基尼值和基尼指数)、决策树构建基本步骤
文章目录一、简介二、决策树分类原理1.熵2.决策树的划分依据一------信息增益3. 决策树的划分依据二----信息增益率4.决策树的划分依据三——基尼值和基尼指数5. 决策树构建的基本步骤如下:6.总结 常见决策树类型比较6.1 ID3 算法6.2 C4.5算法6.3 CART算法一、简介决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。二、决策树分类原理1.熵熵 是指混乱程度(虽
2022-03-09 10:16:31
1340
原创 逻辑回归---简介、API简介、案例:癌症分类预测、分类评估法以及ROC曲线和AUC指标
文章目录一、介绍1. 大白话~2.损失和优化二、API介绍三、案例:癌症分类预测一、介绍1. 大白话~虽然带有“回归”两个字,但是输出的结果是离散的。和线性回归的区别,多了一个激活函数(sigmoid函数),增加模型的非线性拟合能力。2.损失和优化逻辑回归的损失,称之为对数似然损失,公式如下:通过上面这个公式可以计算损失值。二、API介绍三、案例:癌症分类预测案例的重点就是运用了一下“逻辑回归”的这个训练器import pandas as pdimport numpy a
2022-03-08 15:06:45
1335
原创 线性回归02---波士顿房价预测
文章目录一、获取数据二、数据分析2.1描述性统计分析2.2 散点图分析1. 先绘制一个2. 把其余的也绘制出来三、数据处理四、特征工程 标准化五、机器学习 创建模型六、模型评估七、全部代码写在最前 :参考了一位博主的博客进行了学习,讲得很好,很细致。传送门点这儿哈这个案例是以线性回归为模型预测的,目的为求出一个线性函数,每个特征所占参数,最后并对这个所求的线性函数进行模型评估。一、获取数据二、数据分析2.1描述性统计分析 # 2.1描述性统计分析 # describe()是返
2022-03-08 09:53:07
2051
1
原创 线性回归简介01---API使用案例
文章目录一、API初步使用一、API初步使用API介绍案例给定一个数据集代码from sklearn.linear_model import LinearRegression# 1.获取数据x = [[80, 86],[82, 80],[85, 78],[90, 90],[86, 82],[82, 90],[78, 80],[92, 94]]y = [84.2, 80.6, 80.1, 90, 83.2, 87.6, 79.4, 93.4]# 2.数据基本处
2022-03-08 09:37:24
183
原创 【Android】用Fragment、Viewpage实现tab栏切换
文章目录一、完成情况1. 图片2. 文字介绍3. 代码目录结构二、代码1. xml2. java3. manifest.xml三、结尾彩蛋~一、完成情况1. 图片2. 文字介绍点击tab栏底部可以切换不同的页面:在切换时,被选中的颜色会变化左右滑动屏幕也会切换不同的页面。3. 代码目录结构二、代码1. xmltab2.xml<?xml version="1.0" encoding="utf-8"?><RelativeLayout xmlns:andro
2022-03-03 22:17:03
2904
1
原创 K近邻算法04---案例:预测Facebook签到位置
注: 这部分看博客注释与运行截图就差不多能理解啦,把代码复制到自己的编译器中分别运行,认真体会每一步。一、代码截图和运行截图二、全部代码import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsClassifierfrom s
2022-01-27 12:52:47
946
原创 K近邻算法03--交叉验证、网格搜索
文章目录一、交叉验证,网格搜索1.什么是交叉验证(cross validation)2. 为什么需要交叉验证3.什么是网格搜索(Grid Search)4.交叉验证,网格搜索(模型选择与调优)API:5.例子:鸢尾花案例增加K值调优一、交叉验证,网格搜索1.什么是交叉验证(cross validation)交叉验证:将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成4份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果。又称4折交
2022-01-27 11:10:43
346
原创 K近邻算法02---sklearn数据集获取(特征值、标签等)、查看数据分布(散点图)、数据集划分(测试和训练集)、特征工程(标准化和归一化)、鸢尾花种类预测的实现流程
文章目录1.sklearn数据集的获取(1)scikit-learn数据集API介绍(2) sklearn数据集返回值介绍(3)举例子2.查看数据分布3.数据集划分4.特征工程-特征预处理(标准化和归一化)(1)特征预处理定义(2)归一化(3)标准化(4)标准化和归一化的区别(5)标准化和归一化的例子5.大整合---鸢尾花种类预测(实现流程)1.sklearn数据集的获取(1)scikit-learn数据集API介绍(2) sklearn数据集返回值介绍(3)举例子小数据 获取数据
2022-01-26 22:22:08
3073
原创 K近邻算法01---K-近邻算法简介、K近邻算法API使用、KD树
文章目录一、K-近邻算法简介二、k近邻算法api初步使用1.K-近邻算法API2.一个案例(1)步骤分析(2)代码过程3.小结三、kd树1.问题导入2.kd树简介一、K-近邻算法简介K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对比较容易理解的算法定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。距离公式两个样本的距离可以通过如下公式计算,又叫
2022-01-26 21:47:21
227
原创 【Android】登录注册完整版~SQLite存储、记住密码
文章目录0.目前情况:1.实现功能2.实现后:(1)注册:(2)登录1.代码目录2.代码:1.manifests.xml2.User.java3.ToastUtil.java4.LoginActivity.java5.RegisterActivity.java6.MySQLiteOpenHelper.java7. btn_bg_selector.xml8.edit_text_bg.xml9.activity_register.xml10.login.xml11.theam.xml0.目前情况:1.实现功
2022-01-23 12:31:30
6621
7
原创 Android报错AUTOINCREMENT is only allowed on an INTEGER PRIMARY KEY 解决
我的解决方法:private static final String CREATE_TABLE_SQL = "create table " + TABLE_NAME_USER + "(id INTEGER PRIMARY KEY AUTOINCREMENT, account text, pass text)";把上面这行代码中的 INTEGER PRIMARY KEY AUTOINCREMENT 全部写成大写形式即可!...
2022-01-22 22:03:50
3243
原创 【Android】 实现一个登录注册(还没有连接数据库)
文章目录一、最终效果:二、代码部分1.登录部分1.LoginActivity.java2.login.xml3.themes.xml2.注册部分1.RegisterActivity.java2.activity_register.xml3.配置文件1.manifest 功能清单2.btn_bg_selector.xml3.edit_text_bg.xml一、最终效果:登录页面:注册页面: (可以对输入的内容进行校验:比如不为空 且密码和再次输入的密码必须一致,若不一致,则会弹框说明情况)代码
2022-01-22 16:48:05
4519
原创 Pandas 5--数据高级处理(缺失值处理、数据离散化、合并、交叉表和透视表、分组和聚合)
文章目录一、缺失值处理1.判断是否有缺失值2.处理缺失值1.删除 (把所有缺失的行删除)2.替换 (把缺失值替换为平均值or中位数等)3.有特殊标记3.小结二、数据离散化1.为什么要离散化2.什么是数据的离散化3.离散化分组1.pd.pcut()2.pd.cut(data, bins) (自定义区间分组)3.one-hot编码4.小结三、合并1.pd.concat实现数据合并2.pd.merge3.小结四、交叉表与透视表一、缺失值处理1.判断是否有缺失值pd.isnull(df)p
2022-01-18 16:19:13
1732
原创 pandas 4----文件读取与存储
文章目录一、CSV1. read_csv2.to_csv二、 HDF5三、json1.read_json2.to_json四、拓展一、CSV1. read_csvpandas.read_csv(filepath_or_buffer, sep =’,’ )filepath_or_buffer:文件路径usecols:指定读取的列名,列表形式例子:2.to_csv例子:二、 HDF5hdf5读取和存储的例子:三、json先举个例子:1.read_json2.
2022-01-18 15:30:57
451
原创 pandas 3----DataFrame运算
文章目录一、算术运算-add,sub,mul,div二、逻辑运算1. 例如筛选p_change > 2的日期数据2. 完成一个多个逻辑判断, 筛选p_change > 2并且open > 153. 用逻辑运算函数query(values)和isin(values)三、统计运算1. describe() 一下子全部求出来一、算术运算-add,sub,mul,div二、逻辑运算1. 例如筛选p_change > 2的日期数据data['p_change'] > 2
2022-01-17 21:42:54
796
原创 pandas 2----基本数据操作- pandas索引(获取某些值)、pandas赋值、pandas排序
文章目录一、索引操作二、赋值三、排序一、索引操作直接使用行列索引(先列后行)例子:data[‘open’][‘2018-02-27’] (先列后行)结合loc或者iloc使用索引二、赋值# 直接修改原来的值data['close'] = 1# 或者data.close = 1三、排序排序有两种形式,一种对于索引进行排序,一种对于内容进行排序。使用df.sort_values(by=, ascending=)单个键或者多个键进行排序,默认升序ascending=F
2022-01-17 17:42:21
303
全网最全安卓复习资料PPT+复习题
2020-11-24
中北大学安卓实验2-8
2020-11-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人