自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

昆兰.沃斯 的博客

贵有恒,何必三更起五更眠;最无益,只怕一日暴十寒

  • 博客(143)
  • 收藏
  • 关注

原创 (十三)关于InternVL2.5的模型训练效果——自定义数据集的训练效果InternVL2.5与InternVL2.0对比

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-12-25 10:16:34 358

原创 (十二)关于InternVL2.5的模型训练方法——InternVL2.5与InternVL2.0的训练区别以及步骤作用

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-12-25 10:14:49 515

原创 (十一)关于InternVL2的模型结构——源码解析InternVL2的网络结构(modeling_internvl_chat.py)

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-11-25 09:36:28 357

原创 (十)关于InternVL2的模型resume训练——如何断点恢复训练多模态大模型

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-11-19 15:37:14 233

原创 (九)关于InternVL2的调试方法——如何使用VSCode调试多模态大模型(deepspeed、torchrun)

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-11-11 14:33:08 199

原创 (八)关于InternVL2的优化加速——如何提高三倍的推理速度

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-11-05 08:30:00 269

原创 (七)关于InternVL2的精确率、召回率评估方法——多模态大模型的混淆矩阵

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-11-01 10:28:45 310

原创 (六)关于InternVL2的单卡、多卡推理

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-10-29 11:38:48 552 1

原创 (五)关于InternVL2的模型训练二(如何训练目标定位模型)

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-10-29 10:55:04 839

原创 (四)关于InternVL2的模型训练一(如何训练目标定位模型)

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-10-29 10:11:55 788

原创 (三)关于InternVL2的数据制作(如何制作YOLO类型的定位数据集)

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-10-29 10:00:28 671

原创 (二)关于InternVL2的环境安装

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-10-29 09:54:14 722

原创 (一)多模态大模型系列-InternVL2

以InternVL2作为基础,介绍多模态大模型的训练、推理以及其它相关知识

2024-10-29 09:43:47 1868

转载 VLC搭建简单的RTSP流媒体服务器

1、 再打开一个VLC,可以在本机打开,也可以在局域网内的其他电脑打开,我这里是在虚拟机中再打开一个VLC,打开网络播放,添加上上一步我们设置的SDP 路径rtsp://192.168.165.100:8554/test。(6)修改SDP路径,这里添加上本地IP地址,我电脑IP地址为:192.168.165.100。(4)添加路径,我们这里写/test,点击下一步。(2)点击播放按键旁边的倒三角符号,选择串流。(7) 点击流,服务端开始流传输。(3)选择RTSP 然后点击添加。

2024-02-23 10:42:33 1218

转载 解决GitHub网络波动严重

1:在 https://www.ipaddress.com/ 网站查询以下3个域名的 IP:github.com github.global.ssl.fastly.net codeload.github.com2:将域名和查到的 IP组装成以下格式添加到hosts文件中(修改 IP):# hosts地址:E:\Windows\System32\drivers\etc140.82.112.4 github.com199.232.5.194 github.global.ssl.fastly

2021-03-08 11:02:33 1770

转载 rtmp、rtsp公网测试地址

湖南卫视rtmp流:rtmp://58.200.131.2:1935/livetv/hunantv动画片rtsp流:rtsp://3.84.6.190/vod/mp4:BigBuckBunny_115k.mov转载地址:这里

2021-02-16 15:42:21 3172 1

转载 Ubuntu18.04安装Adobe flash player

刚装了双系统,Ubuntu 自带的 Firefox 不能播放视频,所以需要安装 Adobe flash player。1.启用Canonical Partners Repository存储库由于最新版本的flash位于Canonical Partners Repository储存库中,通常情况下该库处于禁用状态,那么我们必须要在安装前启用该库。sudo add-apt-repository "deb http://archive.canonical.com/ $(lsb_release -.

2021-02-12 13:51:34 1591

转载 开启Chrome多线程下载,下载速度提升10倍+

用谷歌浏览器下载速度慢,默认浏览器采用的是单线程下载,“一人难敌四手”的浏览器自然斗不过多线程了。所以说浏览器想要提高下载速度,就得采用多线程的下载方式,不过到目前为止,Chrome多线程下载已经支持了,只不过大家都不知道而已。Chrome默认还是单线程下载,如果想要谷歌多线程下载,就要手动开启。打开Chorme浏览器,国产Chrome内核的浏览器通通适用,包括前段时间推送的新版 Edge 也可以。执行以下步骤:一:在地址栏输入:chrome://flags/#enable-parallel-dow

2020-10-25 11:30:33 5342 1

转载 Pycharm无法自动补全新版本(1.6.0)Pytorch的nn模块

问题描述安装了pytorch最新版本1.6之后,在pycharm中编辑python代码时,输入torch.nn.看不到提示了,比如torch.nn.MSELoss()。而在1.4及以前的版本中,直接输入torch.nn.就会自动提示出很多torch.nn.modules中的API。该问题的讨论在前几年有过不少(https://www.zhihu.com/question/279645242/answer/520263986),但都是基于老版本,经过尝试,对于1.6版本是无效的。原因分析pyc

2020-10-06 14:29:34 2347

原创 eval创建Python类以及setattr、getattr、hasattr方法

近来在 Python 开发这块接触的比较多,所以遇到了很多很实用但之前没有接触的方法,这里先简单记录一点。一:Python 中类的实例化是十分常见的,最普通的方法就是直接实例化类名。例如:class Life(): animal = 'cat' food = 'banana' sport = 'run' language = 'python' def __init__(self): passlife = Life()二:将结构化字符串转换为字典,是 python 处理数据的一

2020-07-27 23:22:04 1147

原创 python时间戳转日期格式(保留毫秒级别)

时间戳是一种保存便捷,后续可用来在其它编程语言下快速转换为日期格式的一种时间形式。这里来说说如何通过 Python 将时间戳转换为日期格式。Python 拥有大量的库,其中不乏有对时间处理的库,这里介绍和使用到的是 Python 中最常见的两个时间库——time、datetime通过 time.time() 可以获得当下时刻的时间戳:1594907094.8940988时间戳在 time 下的返回值为 float 类型,如果后续你的时间戳为 str 类型,需要将其转换为数值类型再进行下一步的

2020-07-16 21:59:29 10778

原创 2018岗位招聘信息、薪资待遇详细分析——数据分析

开头简单介绍下:本文章主要内容为利用网络爬虫与数据分析对2018年的所有招聘岗位信息进行了统一清洗、合并、分析、可视化,而本篇文章重点介绍分析和可视化。获取数据的爬虫文章在前面有介绍。大三快要完了,马上就要面临实习的问题了,所以这里完成这个项目也是为后面的工作方向有一个比较清晰的认知。写成文章也是旨在希望有同样需要的朋友能获取到有帮助的信息,对目前2018年的行业人才需求有一个大概的了解,选择...

2019-06-14 14:48:17 20413 42

转载 数据挖掘——无量纲化

在进行特征选择之前,一般会先进行数据无量纲化处理,这样,表征不同属性(单位不同)的各特征之间才有可比性,如1cm 与 0.1kg 你怎么比?无量纲处理方法很多,使用不同的方法,对最终的机器学习模型会产生不同的影响。本文将对常用的无量纲化技术进行总结,试图指出他们的适用场景,并给出在Python中的相应调用方式。正文中每列代表一个 属性/特征,每行表示一个/条 样本。1.min-max归一化...

2019-03-25 20:13:23 9334

转载 偏度(skewness)和峰度(kurtosis)

偏度偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。定义上偏度是样本的三阶标准化矩。偏度定义中包括正态分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0),左偏分布(也叫负偏分布,其偏度<0)。Python代码实现方法:pandas的Series 数据结构可以直接调用skew()方法来查看df.iloc[...

2019-03-19 20:32:55 146109 3

原创 自然语言处理库TfidfVectorizer(CountVectorizer与TfidfTransformer的结合)

这里简单介绍下scikit-learn自然语言文本处理的一个开源方法——TfidfVectorizer,该方法分别是由两种方法 CountVectorizer 与 TfidfTransformer 的结合,下面进行说明,说明之前给出三个文档链接(本文基本翻译自官方文档):(文档在手天下我有,有问题看文档)方法一:TfidfVectorizer方法二:CountVectorizer、T...

2018-12-13 14:32:43 12600 4

原创 json以及它的方法load、dump、loads、dumps

稍微详细点介绍下json及四个函数作用「load、dump、loads、dumps」如下:JSON:JSON是一种轻量级的数据交换语言,易于阅读,用来传输由属性值或者序列的值组成的数据对象。JSON 是 JS 对象的字符串表示法,它使用文本表示一个 JS 对象的信息,本质是一个字符串。很多时候我们见到的是形如字典(键值对)一样的数据格式,如下:{ "a": "hello wo...

2018-12-01 23:57:48 4082

原创 Windows下Python3.6安装 fbprophet库

近来,Facebook开源了基于 Python 和 R 语言的 时间序列数据预测工具——“Prophet”。官方号称“让普通人也能像数据分析师一样得出专业的结论”。我觉得可能有点悬,因为很多人都被卡在了第一步——安装借用一句话:Windows用户们请相信我,只要你按照官方的步骤来:你会发现啥都装不上!有点夸张,但通常官方的安装方式确实都很麻烦又解决不了问题。这里我也遇到了一...

2018-11-13 22:53:36 5975 10

原创 利用mlxtend进行数据关联分析

今天本该是个剁手的日子,只可惜余额不足高攀不起那台i7-8565,只有再写一篇文章聊以慰籍~~前言:之前很少做关于数据关联分析的题,而当初学关联分析时也是自己写代码来实现底层转换与运算,粗略一点的整体代码量也达到150行左右,所以没有高级的开源工具使用是很费时间的,由此阻碍了一颗想学习的心。后来遇到相关问题便Google了一些解决办法,其中有一个集成很优秀,使用也很方便的GitHub开源项目,...

2018-11-11 21:57:02 23626 6

原创 模型评估方法(混淆矩阵)

在数据挖掘或机器学习建模后往往会面临一个问题,就是该模型是否可靠?可靠性如何?也就是说模型的性能如何我们暂时不得而知。如果模型不加验证就使用,那后续出现的问题将会是不可估计的。所以通常建模后我们都会使用模型评估方法进行验证,当验证结果处于我们的可控范围之内或者效果更佳,那该模型便可以进行后续的进一步操作。这里又将面临一个新的问题——如何选择评估方法,其实通常很多人都会使用比较简单的错误率来...

2018-11-11 12:38:00 12109

转载 pandas中的stack与unstack简单描述

  在用pandas进行数据重排时,经常用到stack和unstack两个函数。stack简单理解可以是堆叠,堆积,unstack即“不要堆叠”。下面为较为浅显的讲述该方法,并未涉及到多标签的问题。  常见的数据的层次化结构有两种,一种是表格,一种是“花括号”,即下面这样的l两种形式:   表格在行列方向上均有索引(类似于DataFrame),花括号结构只有“列方向”上的索引(类似于层...

2018-11-07 22:39:16 1864

原创 逻辑回归中如何应用梯度下降算法与损失函数

前面一篇博客介绍了关于梯度下降算法来由以及说明了为什么梯度的负方向就是梯度下降最快方向,本文将会在上文的知识下简述在逻辑回归(Logistic Regression)中为什么可以使用以及如何使用梯度下降算法。梯度下降算法是个比较简单容易理解的算法,就像吴老师或很多资料上记载的一样:每次从新起点寻找一个到达目的地最快的方向并移动一定距离,以此重复直到终点。对于目标函数是凸函数,则可以到达全局最优...

2018-11-01 22:54:05 8032 2

原创 如何理解图片RGB通道在python(numpy)中的数据构成

今天是个特殊的日子1024,出于本能强行写下一篇文章。伟大而又平凡的程序猿祝你节日快乐。该文将尽可能简短的描述基于numpy,在python中使用skimage的io或PIL或其他方法读取图片后GRB数据的结构与呈现方式。我们肉眼看到的图片无非两种(灰色和彩色),而通过编程语言转换为电脑能认识的模样也就是数字了。这些数字决定了在电脑中它是彩色还是灰色,对于彩色图片决定的方式就是——颜色...

2018-10-24 22:37:02 18926 3

原创 梯度下降算法简明教程

最早接触梯度下降算法是在学习逻辑回归(Logistic Regression),对于权重的迭代更新。当然运用梯度算法的地方远不止逻辑回归,该方法思路简单但适用范围很广,简单的线性回归(Linear Regression),以及最近在看的神经网络(Neural Network)都有涉及梯度算法,所以掌握该方法还是很有必要的,下面来看看吧。梯度算法适用于求极值的问题,极值包括两种(极大值、极小值)...

2018-10-21 20:03:52 3848

原创 岭回归、LASSO回归(包括公式推导)

前面的两篇文章比较清楚浅显的介绍了线性回归、多项式回归,并了解到其实多项式回归也可以看作是一种特殊的线性回归形式,也就是说回归的核心就是线性回归。其原理都是最小二乘法,这是一种很简单、很方便的算法,但也有它的局限性,所以本文讲述另外的回归方式岭回归、LASSO回归,作为一个补充,解决最小二乘法的一些缺点。最小二乘法的局限性:                                 ...

2018-10-03 16:09:32 26293 6

原创 多项式回归

多项式回归多项式回归,回归函数是回归变量多项式的回归。多项式回归模型是线性回归模型的一种,此时回归函数关于回归系数是线性的。由于任一函数都可以用多项式逼近,因此多项式回归有着广泛应用。直线回归研究的是一个因变量与一个自变量之间的回归问题,但在实际情况中,影响因变量的自变量往往不止一个,例如:羊毛的产量受到绵羊体重、体长、胸围等影响,因此需要进行一个因变量与多个自变量间的回归分析,即多元回归...

2018-10-02 23:08:37 38410 4

原创 线性回归

线性回归:简单描述就是通过线性方程(1次函数)去拟合数据点:但是如何使用该线性方程去拟合数据点呢?我们能得到拟合的整体误差,即图中蓝色线段的长度总和。如果某一条直线对应的误差值最小,就代表这条直线最能反映数据点的分布趋势:误差如何表示?在线性回归中,使用残差的平方和来表示所有样本点的误差(专业名称:平方损失函数):如何求解上面的平方损失函数?使用最小二乘法即代数求解,最小二...

2018-10-02 11:10:29 903

原创 标准化、归一化、中心化

标准化、归一化、中心化数据分析及挖掘中常提到的几个概念(数据的 标准化、归一化、中心化),虽然经常在用,但可能还是有一些比较生僻的知识容易搞混淆,所以在十月国庆大家都出门上高速堵车的时候抽了点时间对这些概念以我的能力和理解做一个相对系统和浅显的总结。本篇文章通过个人以前对这些知识的一个先验理解,然后主要查阅和参考了数篇相关知识文档的介绍后,做了如下的总结。(注:尤其是标准化、归一化极容易混...

2018-10-01 23:22:52 11563 3

原创 TF-IDF及相关知识(余弦相似性)

自然语言的处理是一个神奇的领域,它涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,由于复习相关知识,所以这里对该方向的部分知识做一个简单的介绍和记录。该文主要记录的是一个很简单却很经典有效的算法——TF-IDF。从它的概念到运算可能花不了10分钟就能了解,并且用到的运算知识都不涉及高等数学,但往往能返回我们一个满意的答案。当我们输入一段检索信息时,可以利用TF-IDF算法,给我们返...

2018-09-15 15:42:15 2998 3

转载 PCA(explained_variance_ratio_与explained_variance_)

之前有写过关于PCA的原理和代码实现,但是对于sklearn中的PCA没有做过多的描述,所以这里转载一篇文章作为补充:这里提一点:pca的方法explained_variance_ratio_计算了每个特征方差贡献率,所有总和为1,explained_variance_为方差值,通过合理使用这两个参数可以画出方差贡献率图或者方差值图,便于观察PCA降维最佳值。再提醒一点:pca中的参数选项...

2018-09-09 15:21:12 35250 14

原创 绘制学习曲线——plot_learning_curve

学习曲线:一种用来判断训练模型的一种方法,通过观察绘制出来的学习曲线图,我们可以比较直观的了解到我们的模型处于一个什么样的状态,如:过拟合(overfitting)或欠拟合(underfitting)先来看看如何解析学习曲线图:要看深刻了解上面的图形意义,你需要了解偏差(bias)、方差(variance)对于训练模型的意义,可以参考这里,当你了解后,我们来看看上面的图形代表的意义:(...

2018-09-09 12:50:35 46108 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除