自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 TXT报告批量转化归纳为excel

#必要包 import numpy as np import pandas as pd import os #txt目录文档路径 path = 'C:/Users/Administrator/Desktop/2' #遍历txt目录文档,找到目录文档里每个txt的名字 os.listdir(path) #批量获得每个txt的路径 filelist = [path + '/' +i for i in os.listdir(path)] #导入单个txt文件教程 with open("C:/Users/.

2021-11-09 11:09:41 322

原创 周报脚本1.0

import numpy as np import pandas as pd #导入大盘数据 ori = pd.read_excel('weekly_meeting/all_organization.xlsx',sheet_name='sheet2') #导入台账并改列名 paramter = pd.read_excel('weekly_meeting/parameter.xlsx',sheet_name='机构明细') paramter = paramter[['机构名称','归属项目']].renam.

2021-08-20 16:30:26 176

原创 ROC曲线与KS曲线

1.定义 二分类问题中,若两个类别一个为阴性一个为阳性,则真实值与预测值可以对应出一个矩阵,成为混淆矩阵(Confusion Matrix) 准确度:(真阴数+真阳数)/总数 错误率:1-精确度 精度:表示真阳性在所有预测为阳性例子中的比例 真阳数/ (真阳数+假阳数) 召回:表示真阳性在所有阳性例子中的比例 真阳数 / (真阳数+假阴数) 灵敏度:表示阳性样本被正确分类的比例 真阳数 / (真阳数+假...

2021-07-23 11:32:05 459

原创 阈值脚本2-自动更新

import numpy as np import pandas as pd print(df.isnull().any())#查询是否有na值 #df2 = df1.fillna('无') 若有则做填充 df = pd.read_excel('C:/Users/Administrator/Desktop/模型数据(CTD-topk)改5.xlsx',sheet_name = '99913') k = pd.DataFrame(columns=['模型阈值','AI数','真阳数','假阳数','真阴数'.

2021-07-21 15:38:27 142

原创 【自用 防丢失】测试用ROC曲线-plot简易版

# 读入数据 import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn import svm, datasets from sklearn.metrics import roc_curve, auc from sklearn.model_selection import train_test_split from sklearn.preprocessing import label_binari.

2021-07-15 18:27:20 112

原创 【自用,防丢失】阈值脚本

import numpy as np import pandas as pd df1=pd.read_excel('C:/Users/Administrator/Desktop/南京系统医生审核数据汇总(75314+4599)年龄.xlsx',sheet_name="75314") df2 = df1.fillna('无')#空值会影响字符串计数 k = pd.DataFrame(columns=['年龄阈值','样本数','阳性数','真阳数','真阴数','假阴数','假阳数','假阴率','假阳率'.

2021-07-13 10:05:04 162

原创 多表拆分整理

import pandas as pd import numpy as np #读取整表数据 data = pd.read_excel('C:/Users/cory511/Desktop/放射科病例一览表0101-0430.xls',encoding='gbk') #创建一个空表 df = data[0:1].isnull() df = df.drop([0]) data.shape #将整表按行切割成分表且导出csv文件 for i in range(1,30430): j = [] P.

2021-05-30 23:56:24 95

原创 根据空行拆分excel表并输出

import pandas as pd data = pd.read_excel('C:/Users/cory511/Desktop/.xls',encoding='gbk') df = data[0:1].isnull() df = df.drop([0]) for i in range(1,100): j = [] P = data[i:i+1].isnull() P['Col_sum'] = P.apply(lambda x: x.sum(), axis=1) if .

2021-05-21 21:36:11 501

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除