
python学习之路
炽天使YRLT
这个作者很懒,什么都没留下…
展开
-
使用LLaMA Factory微调时出现ValueError: Failed to convert pandas DataFrame to Arrow Table from file的解决方案
【代码】使用LLaMA Factory微调时出现ValueError: Failed to convert pandas DataFrame to Arrow Table from file的解决方案。原创 2025-02-10 16:46:04 · 286 阅读 · 0 评论 -
大模型蒸馏技术
一篇题为《The Mamba in the Llama: Distilling and Accelerating Hybrid Models》的论文证明:通过重用注意力层的权重,大型 transformer 可以被蒸馏成大型混合线性 RNN,只需最少的额外计算,同时可保留其大部分生成质量。先来说说大模型的缺点,要想实现轻量化的部署,必须对体量巨大的大模型进行压缩,大模型功能虽然强大,但是存在过多的数据冗余,实际上有一些模型副本的权重参数是可以省去的,同样可以实现相应的能力,因此便有了模型压缩的研究。原创 2024-09-19 21:53:29 · 1166 阅读 · 0 评论 -
pycharm中无法使用anaconda虚拟环境
里面有一个选项“use conda package manager”,这个默认是勾选的,但是勾选了的话,就看不到conda虚拟环境中安装的新的包,只有一些创建环境时已有的包,所以把它取消掉就有了你安装在环境中所有的包。anaconda里创建了虚拟环境,然后在虚拟环境中明明安装了TensorFlow1.12,但是到pycharm中使用anaconda的虚拟环境时,就是没有TensorFlow1.12,注意下面这幅图。原创 2024-01-22 12:22:19 · 1911 阅读 · 0 评论 -
gym原来是这样用的
总是报没有该环境,思想半天,然后发现这是自己写的环境,需要到gym中去注册才能使用。构建gym环境可以参考。今天down了一个深度强化学习的程序,但是试来试去总是跑不成功,第一句就出问题了。这位大佬写的非常详细,我按着流程操作了一遍就完成了。原创 2023-10-16 14:03:30 · 1303 阅读 · 0 评论 -
TensorFlow与pytorch特定版本虚拟环境的安装
TensorFlow与Python的版本对应,注意,一定要选择对应的版本,否则会让你非常痛苦,折腾很久搞不清楚原因。建议使用国内镜像源安装没有GPU后缀的就表示是CPU版本的,不加版本就是最新还可以指定版本GPU版本完成虚拟环境配置以及包的安装就可以运行程序啦如下,成功了pytorch也是一样,但是要注意去pytorch官网上进行版本的匹配和选择这里有不同模块的版本对应,一定要看清楚了再安装下载,不然很容易失败。torchvision是专门做视觉的,如果不需要可以不下。原创 2023-09-11 10:38:25 · 2468 阅读 · 1 评论 -
conda常用命令及问题解决-创建虚拟环境
TensorFlow与Python的版本对应,注意,一定要选择对应的版本,否则会让你非常痛苦,折腾很久搞不清楚原因。pytorch也是一样,但是要注意去pytorch官网上进行版本的匹配和选择。通过创建虚拟环境,就可以运行任何不同版本的程序了,再也不担心版本问题啦。注意,以上语法均是临时使用清华源加速,若想默认,则使用以下语句设置。没有GPU后缀的就表示是CPU版本的,不加版本就是最新。激活环境,这也是从base环境进入新创建环境的命令。conda包清理,许多无用的包是很占用空间的。原创 2023-09-11 09:36:56 · 515 阅读 · 0 评论 -
pycharm,anaconda,tensorflow,pytorch安装及环境配置教程
本文系总结之作,只是自己在使用过程中发现的一些方法汇总1,pycharm和anaconda的安装部署pycharm中使用anaconda部署python环境Python:开发环境搭建:Pycharm和Anaconda3的安装教程及环境配置这两篇文章写的很详细接下来是安装tensorflow,需要先创建环境conda create --name tensorflow python=3.5 ##版本自行选择pip install --ignore-installed --upgrade http原创 2021-02-02 15:42:27 · 290 阅读 · 0 评论 -
数据清洗,Python读取txt数据,txt数据分隔符处理
今天在处理txt文件时遇到了一些问题,它不是格式化的数据,行前行末都有空格,而且每个元素的分隔符不一致,没法进行分割处理,如果用read_csv或者read_table函数是无法直接处理的,得到的只有一个数据块,txt数据如下所以我想给它先转换成格式化的数据,再利用函数进行处理。先用原生Python对空格分隔符进行处理# 读取inputfile = open('_data_1lognorm_nh42so4_ 5_12.out_new.txt', 'r')a = []# 将数据进行格式化处理,获原创 2022-03-07 10:19:23 · 7327 阅读 · 0 评论 -
pandas dataframe类型数据通过元素的值获取其所在的行号
今天在处理数据时,要获得某一列的最大值,并且返回该最大值所在的行号获取某一列的最大值很简单,可以通过import pandas as pd# 添加表头names = ['x1', 'x2', 'x3', 'x4', 'x5', 'x6', 'x7', 'x8', 'x9', ]#新建dataframe类型数据,a表示数据,是列表类型df = pd.DataFrame(columns=names, data=a)# 选择x4列最大的值x4_max = df['x4'].max()这样就可以原创 2022-03-05 17:58:03 · 5126 阅读 · 0 评论 -
AttributeError: ‘property‘ object has no attribute ‘append‘
在练习使用Python将MySQL数据库表数据导入excel中时,程序以及编写好如下了import pymysqlimport openpyxl# 创建工作簿对象workbook = openpyxl.Workbook# 获得默认的工作表sheet = workbook.active# 修改工作表的标题sheet.title = '学生表'# 给工作表添加表头sheet.append(('学号', '姓名', '头衔', '学院'))# 创建链接conn = pymysql.con原创 2022-02-26 15:41:02 · 3017 阅读 · 0 评论