我很好请走开谢谢-优快云博客

原创熵增大与信息量的关系以及互信息最大化

熵 ( H(z_I) ) 是一个随机变量 ( z_I ) 的信息量的度量，定义为：直观理解熵 ( H(z_I) ) 衡量了随机变量 ( z_I ) 的不确定性或分布的多样性。当 ( z_I ) 的分布更均匀（例如每个可能值的概率都差不多）时，熵更大，表明该变量包含更多的潜在信息量。熵增大与信息量的关系熵增大表示随机变量的潜在信息量增加。但熵的增大必须是有意义的，不能仅仅是随机化的结果。互信息最大化的作用。

2025-03-05 10:04:56 551

原创【AI论文】Visual Instruction Tuning

作者的目标是通过多模态指令微调(Visual Instruction Tuning)来训练一个通用的视觉助手，使其能够理解用户的语言指令并与视觉内容结合完成任务。例如，用户可以上传图片并提出问题，模型根据图片内容作出回答。现有的多模态指令执行模型大致可以分为以下两类：端到端训练的模型基于系统协调多个模型核心：将图像的描述和边框输入给GPT，让GPT生成指令（对话、详细描述、推理性）。多模态数据的现状:解决方案:利用现有的图片-文本对：问题: 此类简单扩展数据虽然成本低，但缺乏多样性和深度推理。

2025-02-11 21:05:39 1080

原创【AI基础知识】什么是指令调优？具体如何实现？

指令调优是一种通过引入大量自然语言任务指令对大型语言模型（LLMs）进行微调的方法，旨在提升模型理解和完成多样化任务的能力，尤其是在从未见过的新任务中的零样本表现。具体实现包括以下步骤：准备指令数据：构建包含指令、输入和输出的多样化任务数据，数据来源可以是人工构造、机器生成或已有数据集转换。训练模型：在指令数据上对模型进行监督学习，优化生成的输出以匹配预期结果。评估性能：通过零样本和少样本测试评估模型在新任务上的推理能力。指令调优通过教会模型根据任务描述调整输出，显著增强了其泛化能力和实用性，被广

2025-02-11 19:03:00 1090

原创大语言模型prompt -Template

例如，在做Summarization时（表格倒数第二条），会加上这个prompt，意思是。

2025-02-08 16:17:21 740

原创 GAN（生成对抗网络）原理与目标函数

GAN 是一个博弈过程，生成器和判别器互相竞争。生成器通过学习真实数据分布 ( P_r )，从一个简单的潜在分布 ( P_z ) 中采样，然后生成接近 ( P_r ) 的数据。判别器的任务是区分真实数据和生成数据，而生成器的任务是尽量骗过判别器。GAN 的训练目标是让生成器生成的数据分布 ( P_g ) 无限接近于真实数据分布 ( P_r )。

2024-12-07 19:00:01 1297 1

原创分类与有序回归

有序回归与分类

2024-10-30 16:35:19 225

原创 html+spring+服务器部署一个项目可用于安卓

三步都做完后，即可在html测试输入数据，在云服务器即可创建文件。需求：安卓项目的数据上传到云端，安卓的页面是用html写的。项目写好后，按照这个方法部署到云端。

2023-05-02 19:37:17 530 1

原创 layui弹出“加载中”

layui

2023-02-04 15:03:59 1115

原创用python把json文件转excel

json转python

2023-02-04 15:02:16 1365

原创用python把json文件转excel

json转python

2022-10-28 21:26:57 1439

原创插值算法反向插值

插值算法

2022-10-14 21:31:53 664

原创如果实在解决不了 org.springframework.beans.factory.UnsatisfiedDependencyException，可能是因为……

解决问题

2022-08-16 17:20:33 339

原创 Java，线程里的数据被线程外获取到的方式。

new Thread里的数据被外部访问到

2022-08-13 20:24:22 480

原创安卓，图标插件、图标按钮。

安卓开发，图标插件，图标按钮

2022-08-03 16:45:17 598

原创安卓连接mysql数据库，使用okhttp

安卓开发连接mysql 数据库

2022-08-02 18:39:41 977

原创 Matplotlib中的fill_between；np.argsort()函数

1.Matplotlib中的fill_between这个函数可以实现的图像折现附近有阴影的效果。如图：具体用法与参数参考下面链接。看这篇2.np.argsort()这个方法的功能：将矩阵a按照axis排序，并返回排序后的下标看这篇...

2022-03-27 15:03:53 651

原创多项式回归（PolynomialFeatures）

学习于这篇文章这里是链接大概意思是：一些比较复杂的模型如果用线性拟合会有较大误差，这时需要多项式的线性拟合，（比如x的平方、x的三次方等）。随着维度的增加，拟合度会变的较好，但需要注意可能会导致过拟合。...

2022-03-27 14:55:09 583

原创 sklearn中的pipeline机制

学习于此篇。这篇文章大概是这样的意思：相当于把这三个步骤进行了封装，而且顺序一定要按照机器学习的流程顺序。

2022-03-27 11:47:28 514

原创 sklearn中的学习曲线learning_curve函数

一、运行原理学习曲线。确定交叉验证的针对不同训练集大小的训练和测试分数。交叉验证生成器将整个数据集拆分为训练和测试数据中的k次。具有不同大小的训练集的子集将用于训练估计器，并为每个训练子集大小和测试集计算分数。之后，对于每个训练子集大小，将对所有k次运行的得分进行平均。二、函数格式sklearn.model_selection.learning_curve(estimator, X, y, groups=None, train_sizes=array([0.1, 0.33, 0.55, 0.7

2022-03-24 10:22:13 538

原创 MySQL最左前缀原则【我看懂了hh】

学习于这篇文章，先占个坑，之后再完善笔记叭。这是链接哦

2022-03-19 10:17:29 708

原创简单说Q-Q图；stats.probplot(QQ图)

检验样本数据概率分布(例如正态分布)的方法。使用方法如下：fig = plt.figure()res = stats.probplot(train[‘SalePrice’], plot=plt) #默认检测是正态分布plt.show()注意: 红色线条表示正态分布，蓝色线条表示样本数据，蓝色越接近红色参考线，说明越符合预期分布（这是是正态分布）q-q 图是通过比较数据和正态分布的分位数是否相等来判断数据是不是符合正态分布注:学习于这篇文章...

2022-03-10 16:35:28 3514

原创彻底搞懂箱形图分析

学习于这篇文章文章目录一、箱形图二、五大因“数”1、下四分位数Q12、中位数（第二个四分位数）Q23、上四分位数Q34、上限5、下限三、箱形图的价值1.直观明了地识别数据批中的异常值2.利用箱线图判断数据批的偏态和尾重3.利用箱线图比较几批数据的形状一、箱形图箱形图（英文：Box plot），又称为盒须图、盒式图、盒状图或箱线图，是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用，常见于品质管理，快速识别异常值。箱形图最大的优点就是不受异常值的影响，能够准确稳定

2022-03-10 15:44:43 8522 2

原创 Jupyter Notebook安装库；ModuleNotFoundError: No module named ‘plotly‘解决方案。

这种问题一般都是因为要引用的库没提前装好，记录一下安装库的步骤。首先需要找到这个文件夹目录：寻找方法hhhh）不知道有没有跟我一样的总忘记在哪里安装的人。直接右键这个应用打开文件位置。输出 conda list 查询一下有没有安装过如果没有装过的话输入 pip install plotly...

2022-03-10 10:15:35 2631

原创字典特征提取，文本特征提取。

文章目录1 定义2. 字典特征提取API3. 字典特征提取案例：1.实现效果：2.实现代码4. 文本特征提取1. 方法2. 英文案例1. 实现效果2.流程3. 中文案例使用到的包1 定义将任意数据（如文本或图像）转换为可用于机器学习的数字特征注：特征值化是为了计算机更好的去理解数据特征提取分类:字典特征提取(特征离散化)文本特征提取图像特征提取2. 字典特征提取APIsklearn.feature_extraction3. 字典特征提取案例：1.实现效果：2.实现代码

2022-03-09 10:47:59 1872

原创决策树算法---简介、分类原理（熵、信息增益、信息增益率、基尼值和基尼指数）、决策树构建基本步骤

文章目录一、简介二、决策树分类原理1.熵2.决策树的划分依据一------信息增益3. 决策树的划分依据二----信息增益率4.决策树的划分依据三——基尼值和基尼指数5. 决策树构建的基本步骤如下：6.总结常见决策树类型比较6.1 ID3 算法6.2 C4.5算法6.3 CART算法一、简介决策树：是一种树形结构，其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每个叶节点代表一种分类结果，本质是一颗由多个判断节点组成的树。二、决策树分类原理1.熵熵是指混乱程度（虽

2022-03-09 10:16:31 1340

原创逻辑回归---简介、API简介、案例：癌症分类预测、分类评估法以及ROC曲线和AUC指标

文章目录一、介绍1. 大白话~2.损失和优化二、API介绍三、案例：癌症分类预测一、介绍1. 大白话~虽然带有“回归”两个字，但是输出的结果是离散的。和线性回归的区别，多了一个激活函数（sigmoid函数），增加模型的非线性拟合能力。2.损失和优化逻辑回归的损失，称之为对数似然损失，公式如下：通过上面这个公式可以计算损失值。二、API介绍三、案例：癌症分类预测案例的重点就是运用了一下“逻辑回归”的这个训练器import pandas as pdimport numpy a

2022-03-08 15:06:45 1335

原创线性回归02---波士顿房价预测

文章目录一、获取数据二、数据分析2.1描述性统计分析2.2 散点图分析1. 先绘制一个2. 把其余的也绘制出来三、数据处理四、特征工程标准化五、机器学习创建模型六、模型评估七、全部代码写在最前 :参考了一位博主的博客进行了学习，讲得很好，很细致。传送门点这儿哈这个案例是以线性回归为模型预测的，目的为求出一个线性函数，每个特征所占参数，最后并对这个所求的线性函数进行模型评估。一、获取数据二、数据分析2.1描述性统计分析 # 2.1描述性统计分析 # describe()是返

2022-03-08 09:53:07 2051 1

原创线性回归简介01---API使用案例

文章目录一、API初步使用一、API初步使用API介绍案例给定一个数据集代码from sklearn.linear_model import LinearRegression# 1.获取数据x = [[80, 86],[82, 80],[85, 78],[90, 90],[86, 82],[82, 90],[78, 80],[92, 94]]y = [84.2, 80.6, 80.1, 90, 83.2, 87.6, 79.4, 93.4]# 2.数据基本处

2022-03-08 09:37:24 183

原创【Android】用Fragment、Viewpage实现tab栏切换

文章目录一、完成情况1. 图片2. 文字介绍3. 代码目录结构二、代码1. xml2. java3. manifest.xml三、结尾彩蛋~一、完成情况1. 图片2. 文字介绍点击tab栏底部可以切换不同的页面：在切换时，被选中的颜色会变化左右滑动屏幕也会切换不同的页面。3. 代码目录结构二、代码1. xmltab2.xml<?xml version="1.0" encoding="utf-8"?><RelativeLayout xmlns:andro

2022-03-03 22:17:03 2904 1

原创 K近邻算法04---案例：预测Facebook签到位置

注：这部分看博客注释与运行截图就差不多能理解啦，把代码复制到自己的编译器中分别运行，认真体会每一步。一、代码截图和运行截图二、全部代码import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsClassifierfrom s

2022-01-27 12:52:47 946

原创 K近邻算法03--交叉验证、网格搜索

文章目录一、交叉验证，网格搜索1.什么是交叉验证(cross validation)2. 为什么需要交叉验证3.什么是网格搜索(Grid Search)4.交叉验证，网格搜索（模型选择与调优）API：5.例子：鸢尾花案例增加K值调优一、交叉验证，网格搜索1.什么是交叉验证(cross validation)交叉验证：将拿到的训练数据，分为训练和验证集。以下图为例：将数据分成4份，其中一份作为验证集。然后经过4次(组)的测试，每次都更换不同的验证集。即得到4组模型的结果，取平均值作为最终结果。又称4折交

2022-01-27 11:10:43 346

原创 K近邻算法02---sklearn数据集获取（特征值、标签等）、查看数据分布（散点图）、数据集划分（测试和训练集）、特征工程（标准化和归一化）、鸢尾花种类预测的实现流程

文章目录1.sklearn数据集的获取（1）scikit-learn数据集API介绍（2） sklearn数据集返回值介绍（3）举例子2.查看数据分布3.数据集划分4.特征工程-特征预处理（标准化和归一化）（1）特征预处理定义（2）归一化（3）标准化（4）标准化和归一化的区别（5）标准化和归一化的例子5.大整合---鸢尾花种类预测（实现流程）1.sklearn数据集的获取（1）scikit-learn数据集API介绍（2） sklearn数据集返回值介绍（3）举例子小数据获取数据

2022-01-26 22:22:08 3073

原创 K近邻算法01---K-近邻算法简介、K近邻算法API使用、KD树

文章目录一、K-近邻算法简介二、k近邻算法api初步使用1.K-近邻算法API2.一个案例（1）步骤分析（2）代码过程3.小结三、kd树1.问题导入2.kd树简介一、K-近邻算法简介K Nearest Neighbor算法又叫KNN算法，这个算法是机器学习里面一个比较经典的算法，总体来说KNN算法是相对比较容易理解的算法定义：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。距离公式两个样本的距离可以通过如下公式计算，又叫

2022-01-26 21:47:21 227

原创【Android】登录注册完整版~SQLite存储、记住密码

文章目录0.目前情况：1.实现功能2.实现后：（1）注册：（2）登录1.代码目录2.代码：1.manifests.xml2.User.java3.ToastUtil.java4.LoginActivity.java5.RegisterActivity.java6.MySQLiteOpenHelper.java7. btn_bg_selector.xml8.edit_text_bg.xml9.activity_register.xml10.login.xml11.theam.xml0.目前情况：1.实现功

2022-01-23 12:31:30 6621 7

一些面试题【Java后端】

【Android】用Fragment、Viewpage实现tab栏切换

UML试题及答案-(5).doc

全网最全安卓复习资料PPT+复习题

中北大学安卓实验2-8

空空如也