
数据统计
LRJ-jonas
药物设计
展开
-
python的collections库自带的Counter()函数
【代码】python的collections库自带的Counter()函数。原创 2022-09-14 22:13:39 · 380 阅读 · 0 评论 -
python特征选择——两个连续变量的线性相关系数
F检验:统计量F和 r x y 2 r_{xy}^2 rxy2变化方向一致,即与相关系数绝对值的变化保持一致,本质上和相关系数一样,也是衡量了两个变量之间的相关性,并且是一种线性相关关系,并且数值越大、线性相关关系越强,反之则越弱。import pandas as pdimport numpy as npimport random# 构建数据random.seed(6)df = pd.DataFrame({'Y':[random.uniform(1,200) for _ in r原创 2022-05-30 23:22:14 · 1399 阅读 · 0 评论 -
pandas中min()函数的应用
Pandas dataframe.min()函数返回给定对象中的最小值。如果输入是一个序列,则该方法将返回一个标量,该数量将是该序列中的最小值。如果输入是一个 DataFrame ,则该方法将返回一个在 DataFrame 的指定轴上具有最小值的序列。默认情况下,该轴是索引轴(axis=0)。用法:DataFrame.min(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)axis: axis=0代表从上到下的索引轴;原创 2022-04-26 00:24:33 · 3867 阅读 · 0 评论 -
python——求 MSE\RMSE\MAE 误差的方法
python原创 2022-02-28 15:55:32 · 1930 阅读 · 0 评论 -
pandas打开csv表格文件,并指定index,并重新排序
上述代码可以将pandas 指定“”属性“”列为"index"列之后用reindex函数将其变为想要的顺序如果想要取消索引,可以用.reset_index原创 2022-02-27 22:18:37 · 1325 阅读 · 0 评论 -
Pandas对Series的元素进行排序
s = pd.Series([4.5, 2.7, 8.9, -0.4], index = ['d', 'b', 'a', 'c'])s.reindex(['a', 'b', 'c', 'd', 'e']) #是的,哪怕s中没有e这样就能把原本的dbac顺序排列为abcd了原创 2022-02-27 16:30:18 · 919 阅读 · 0 评论 -
Pandas表格——从列表中指定单元格进行赋值
赋值指定的单元原创 2021-11-16 21:31:53 · 1287 阅读 · 0 评论 -
Python 制作散点图 scatter plot
使用Python 制作散点图原创 2021-12-15 01:08:53 · 3710 阅读 · 0 评论 -
二维表格切取指定的行(pandas、loc函数)
首先,我们拿到一个csv表格 (如果是excel表格也可以另存为csv)如果我们想要得到它的第二行和第三行的数据,就可以直接“切片”,操作如下:注意:a.index函数 得到的并不是列表文件,而是一个range。或者直接用 iloc()、loc()函数:...原创 2021-11-30 00:47:46 · 1020 阅读 · 0 评论 -
python pandas库 —— loc函数的应用
本实例中,首先我们从文献里得到了4000多个蛋白质之间的相似性的矩阵(data.csv),该矩阵为“对称矩阵”(行和列的元素相同)然而我们只想知道其中1000多种蛋白质之间的相似性(data2.csv),于是需要从上述矩阵中筛选具体步骤:首先导入两个csv表格(data、data2) # header、index_col是列标题、行标题#header = 0 代表第一行是列索引,程序会忽略列索引接下来是在data中筛出data2包含的蛋白质。首先将data2的行(100...原创 2021-11-24 01:30:19 · 2669 阅读 · 2 评论