
Python
文章平均质量分 72
飞龙在天max
这个作者很懒,什么都没留下…
展开
-
InternVL 2.5 介绍
在InternVL 2.5中,我们系统地探索了MLLM中的各种因素,包括视觉编码器、语言模型、数据集大小和推理时间的变化如何影响模型的整体性能,展示了多模态模型中扩展与性能之间的关系。大视觉编码器减少数据依赖:在扩展MLLM时,大型视觉编码器显著降低了对训练数据的依赖。如表3所示,与配备6亿参数视觉编码器的Qwen2-VL - 72B相比,我们拥有60亿参数视觉编码器的InternVL2.5 - 78B仅使用1/10的训练标记就能实现更好的性能。这在扩展MLLM时大大降低了探索成本。数据质量至关重要。原创 2024-12-12 19:08:12 · 1499 阅读 · 0 评论 -
Huggingface 模型修改
Huggingface里面的模型封装的很好,想要直接修改代码并非容易的事,但是如果看文档,它有很多参数,能把你想到的大部分结果取出来,下面我就以一次经历来讲讲我如何在T5模型上面加一个featurefusion层。复制下来查看,发现可以直接用T5.encoder对input_ids进行编码,然后把encoder_outputs直接输入T5ForConditionalGeneration,就可以了。查看文档,可以直接把模型的输入参数输入generate函数里面。...原创 2022-07-25 11:02:56 · 4410 阅读 · 2 评论 -
PyLucene 安装
PyLucenepyLucene 是搜索引擎 Lucene 的 python 版本,官网 https://lucene.apache.org/pyluceneInstallOne by one install安装 g++sudo apt autoremovesudo apt-get install build-essential安装 jdkLinux之Ubuntu18.04安装Java JDK8的三种方式_软测小生-优快云博客_ubuntu安装jdk8# Openjdk 安装 JDK原创 2022-03-02 17:35:26 · 1667 阅读 · 1 评论 -
matplotlib 绘图
figure, ax基础plt.***和ax.***的区别我认为所有不先讲清楚plt.和ax. 两种画图方式的区别的教程都是耍流氓。一上来就告诉你,plt.figure(), plt.plot(), plt.show(),这么画就对了的,都是不负责任的表现!在matplotlib中,有两种画图方式:plt.figure(): plt.***系列。通过http://plt.xxx来画图,其实是取了一个捷径。这是通过matplotlib提供的一个api,这个plt提供了很多基本的function可原创 2021-12-19 15:33:17 · 1619 阅读 · 0 评论 -
pytorch函数详解
pytorch函数详解在typora这里写之后复制到简书上1. torchvision1.1 transforms.Compose(transforms)把几个转换组合example:from PIL import Imaget_tran = []t_tran.append(transforms.Resize(image_size)) # 64t_tran.append(transforms.CenterCrop(image_size))img = Image.open(dat原创 2021-05-19 09:09:00 · 1976 阅读 · 1 评论 -
py 编码
5.编码这里主要针对 py2 来说。关于编码的问题我很早就注意到了,当时处理一段文本,发现这里面有很多这样的字符:\\xe5\\xb0\\x8f\\xe7\\xb1\\xb3\\xe6\\x89\\x8b\\xe6\\x9c\\xba \x91\xb8这是什么莫名其妙的东西,当时了解到这是非英文文本被 ascii (py2 默认编码) 编码处理后的结果,没错就是乱码,但是没有深入了解它,今天终于知道这是 十六进制字节码,这种字节码用 \ 进行转义,但是从 txt 读取之后就自动变成了 \\ 取消转原创 2021-02-10 19:50:29 · 872 阅读 · 0 评论 -
pytorch Kfold数据集划分
今天想使用K折方法进行训练,发现 pytorch dataloader 中没有需要的一键操作的代码,我自己写了一个。首先得到数据量,然后使用 sklearn.model_selection 的 KFold 方法划分数据索引,最后使用 torch.utils.data.dataset.Subset 方法得到划分后的子数据集。代码思路如下。import torchfrom sklearn.model_selection import KFolddata_induce = np.arange(0, da原创 2021-01-29 16:01:47 · 3956 阅读 · 2 评论 -
PyCharm技巧
快捷键ctrl + Q: 查看函数帮助文档pycharm中 plt.imshow不显示图像在plt.imshow语句之后加 plt.show命令。弹出独立的显示窗口官方说明链接:https://intellij-support.jetbrains.com/hc/en-us/community/posts/115000736584-SciView-in-PyCharm-2017-3-reduces-functionality-of-Matplotlibpycharm从2017.3版之后,将ma原创 2020-11-10 09:58:25 · 531 阅读 · 0 评论 -
matplotlib 在无 GUI 的服务器上画图
在无GUI的 shell 上画图直接画图会报错qt.qpa.screen: QXcbConnection: Could not connect to display localhost:11.0Could not connect to any X display.只需要加入下面这行代码:plt.switch_backend("agg")然后画图之后使用plt.savefig("result.png")保存图片即可...原创 2020-10-19 14:28:15 · 187 阅读 · 0 评论 -
xpath语法
选取节点XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。 下面列出了最有用的路径表达式:表达式描述nodename选取此节点的所有子节点。/从根节点选取。//从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。.选取当前节点。…选取当前节点的父节点。@选取属性。感觉 // 用的最多,选择节点不用考虑位置。有时其中一个属性会随之时间变化,我们可以选择其他属性。这个是选择 tbo翻译 2020-09-25 15:49:42 · 180 阅读 · 0 评论 -
爬取课程慢满不满
爬取课程慢满不满Requirementsselenium==3.141.0webdriver_manager==3.2.2主要思想这个项目主要是使用自动化方法,在选课网站查找某个课程能不能选。主要是首先自己登录,记录cookie。然后使用selenium进行爬取,找到是否满课,如果未满就给我发邮件。需要修改的地方主要是get_course.py文件中的check_course函数。里面的东西需要自己根据网页修改!还有get_cookie.py中的网址需要更改代码取得cookie并且存原创 2020-09-25 10:50:24 · 188 阅读 · 0 评论 -
Python之生成requirements.txt (2020)
Python之生成requirements.txt (2020)我们在平时写Python工程项目的时候,常常需要生成第三方模块依赖包文件requirements.txt,用于声明该项目所需要的Python的第三方模块,同时也方便别人阅读。为了能够方便快速地生成requirements.txt文件,我们可以借助Python的第三方模块:pipreqs,其官方网址为:https://github.com/bndr/pipreqs 。有了这个模块,我们就不需要人工生成requirments.txt,因为该模块原创 2020-09-25 10:33:27 · 212 阅读 · 0 评论 -
爬取某一个网页所有某类型文件
爬取某一个网页所有某类型文件项目地址:https://github.com/fly-dragon211/spider爬取某一个网页所有某类型文件,使用requests库,可以添加代理,文件头等。spider.py给出的示例是爬取李宏毅2017年机器学习的课件。爬取github一个网页的pdf文件以爬取下面网址pdf文件示例https://github.com/zhanwen/MathModel/tree/master/%E5%9B%BD%E8%B5%9B%E8%AE%BA%E6%96%87/2原创 2020-09-16 18:00:17 · 1587 阅读 · 0 评论 -
Regular Expression 正则
Regular Expression举例re.findall可以找到所有的匹配字符,re.search只能找到第一个匹配字符。平时使用 (.*?) 即可以找到大多数内容。# 举例import rep1 = re.compile(r'-?\d\.\d{9}')# 这里打包成SRE_Pattern对象r = p1.findall('-0.008804422 0.024896538 0.000000000')print(r)p2 = re.compile(r'=(.+?)A.原创 2020-09-16 17:56:23 · 161 阅读 · 0 评论 -
matplotlib文字格式
matplotlib中的函数只要继承了matplotlib.text.Text类,就可以调节字体格式。fontsize设置字体大小,默认12,可选参数 [‘xx-small’, ‘x-small’, ‘small’, ‘medium’, ‘large’,‘x-large’, ‘xx-large’]fontweight设置字体粗细,可选参数 [‘light’, ‘normal’, ‘medium...翻译 2020-04-11 10:07:32 · 514 阅读 · 0 评论 -
Python excel操作(io)
pandas将numpy数组导出生成excel# -*- coding: utf-8 -*-"""Created on Sun Jun 18 20:57:34 2017@author: Bruce Lau"""import numpy as npimport pandas as pd# prepare for datadata = np.arange(1,101).res...翻译 2020-04-09 10:41:54 · 605 阅读 · 0 评论 -
Gaussian 7 过渡态搜索
b站视频 Gaussian入门教程(七) 搜索方法用QST2对diels-Alder反应进行过渡态预测原创 2020-02-05 16:22:42 · 1587 阅读 · 0 评论 -
@CS 一起来接雨水
昨天陈松的游戏思路每滴雨水分别往左往右看,能不能流下去value[i,j]=min{Maxleft,Maxright}value[i, j] = min\{Max_{left}, Max_{right}\}value[i,j]=min{Maxleft,Maxright}代码#!/usr/bin/env python# -*- coding: utf-8 -*-# @File...翻译 2020-01-21 13:11:01 · 204 阅读 · 2 评论 -
python中np.multiply()、np.dot()和星号(*)三种乘法运算的区别
这里只对数组array进行讨论A = np.arange(1,5).reshape(2,2)B = np.arange(3,7).reshape(2,2)print(A, 2*'\n', B)“”“[[1 2] [3 4]] [[3 4] [5 6]]”“”print(np.dot(A,B)) # 叉乘print()print(np.multiply(A,B)) ...原创 2020-01-17 18:32:11 · 168 阅读 · 0 评论 -
PyQt tutorial 5-Dialogs in PyQt5
对话框Dialog windows or dialogs are an indispensable(不可或缺) part of most modern GUI applications. A dialog is defined as a conversation between two or more persons. In a computer application a dialog is ...翻译 2019-12-17 19:33:31 · 180 阅读 · 0 评论 -
LLM 推理加速
一个很好的 github 仓库:https://github.com/Xnhyacinth/Awesome-LLM-Long-Context-Modeling。原创 2019-12-16 22:51:49 · 177 阅读 · 1 评论 -
PyQt5 tutorial 3-Layout management in PyQt5
Layout(布局) management in PyQt5Layout management is the way how we place the widgets on the application window. We can place our widgets(小工具) using absolute positioning or with layout classes. Managin...翻译 2019-12-15 20:14:29 · 117 阅读 · 0 评论 -
PyQt5 tutorial 2-Menus and toolbars
菜单和工具栏In this part of the PyQt5 tutorial, we create a statusbar, menubar and a toolbar. A menu is a group of commands located in a menubar. A toolbar has buttons with some common commands in the appl...翻译 2019-12-11 10:50:26 · 204 阅读 · 1 评论 -
PyQt5 tutorial 1-First programs in PyQt5
In this part of the PyQt5 tutorial we learn some basic functionality. The examples show a tooltip and an icon, close a window, show a message box and center a window on the desktop.1. Simple example...翻译 2019-12-08 15:29:59 · 283 阅读 · 0 评论 -
python中np.multiply()、np.dot()和星号(*)三种乘法运算的区别
np.array and np.matNumpy mat必须是2维的,但是 numpy arrays (ndarrays) 可以是多维的(1D,2D,3D····ND). Matrix是Array的一个小的分支,包含于Array。所以matrix 拥有array的所有特性。在numpy中matrix的主要优势是:相对简单的乘法运算符号。例如,a和b是两个matrices,那么a*b,就是矩阵积...转载 2019-12-03 16:38:40 · 243 阅读 · 0 评论 -
np.nditer、flags=['multi_index'] 用法
官方文档查了查np.nditer原来是numpy array自带的迭代器。这里简单写个demo解释一下np.nditer的用法。arr1 = np.arange(0, 30, 5).reshape(2, 3)it = np.nditer(arr1, flags=['multi_index'], op_flags=['readwrite'])while not it.finished: ...原创 2019-12-02 16:46:48 · 674 阅读 · 0 评论 -
python matplotlib
1. 读入图像并画矩形import matplotlib.pyplot as pltimport matplotlib.patches as patchesfrom PIL import Imageimg = Image.open(img_path).convert("RGB")plt.imshow(dataset[0][0])currentAxis=plt.gca()# (x,...原创 2019-11-21 16:53:47 · 104 阅读 · 0 评论 -
Linux设置anaconda的环境变量
进入虚拟环境1.修改~/.bashrc2.添加export PATH=/home/hufan/anaconda3/bin:$PATH3.source ~/.bashrc然后输入python得到显示注意这里有两点需要注意的1.在步骤2中,$PATH之前的是冒号 ,而不是分号,这个是初学者挺容易犯的错误。如果换成分号的话就会出现我这样的错误。。。。。点击打开链接2.在步骤2中不能写成ex...转载 2019-11-14 20:27:54 · 1195 阅读 · 0 评论 -
Pytorch两层神经网络
文章目录Pytorch: optimPytorch: 自定义 nn ModulesPytorch: optim这一次我们不用手动更新model的weights,而是使用optim这个包来帮助我们更新参数。optim这个package提供了各种不同的model优化方法,包括SGD+momentum,RMSProp,Adamimport torchN, D_in, H, D_out = 6...原创 2019-10-31 20:08:44 · 542 阅读 · 0 评论 -
python3 sorted
sort 与 sorted 区别:sort 是应用在 list 上的方法,sorted 可以对所有可迭代的对象进行排序操作。list 的 sort 方法返回的是对已经存在的列表进行操作,而内建函数 sorted 方法返回的是一个新的 list,而不是在原来的基础上进行的操作。sorted 语法:sorted(iterable, key=None, reverse=False)参数说明:...翻译 2019-10-29 11:31:11 · 281 阅读 · 0 评论 -
py3 lambda
我们常常看到一个这样的表达式 A=lambda x:x+1可能会一头雾水不知道怎么计算 最基本的理解就是def A(x):return x+1但是理解程序不会将一个表达式在转为函数的,因为lambda函数设计出来就是简化def的。其实很简单 我们可以这样分析通过冒号就能知道这句话什么意思冒号左边→想要传递的参数冒号右边→想要得到的数(可能带表达式)这样在遇到lambd...转载 2019-10-29 11:26:44 · 76 阅读 · 0 评论 -
Scrapy
使用Scrapy抓取网站需要四个步骤:创建Scrapy项目定义Item容器编写爬虫存储内容1.创建项目C:\Users\fly_dragon\Desktop>scrapy startproject DmozNew Scrapy project 'Dmoz', using template directory 'c:\d_disk\anaconda3\lib\site-pac...原创 2019-09-28 22:32:33 · 229 阅读 · 0 评论