- 博客(40)
- 收藏
- 关注
原创 Pycharm中安装pytorch
查看已经创建的虚拟环境列表加载虚拟环境但是在pycharm中配置好 环境出现的是 :No module named ‘Torch’两种可能:1、未安装pytorch。(没有安装)2、未将Anaconda的环境导入到pycharm(已经导入)
2022-09-29 19:56:27
16984
原创 创建materialized view
1.labs-- This query pivots lab values taken in the first 24 hours of a patient's stay-- Have already confirmed that the unit of measurement is always the same: null or the correct unitSET SEARCH_PATH TO mimiciii;DROP MATERIALIZED VIEW IF EXISTS labsf
2022-05-14 00:01:18
568
原创 5.13日文献
加载函数-- Functions TODO:-- FROM table CROSS JOIN UNNEST(table.column) AS col -> ???? (see icustay-hours)-- ???(column) -> PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY column) (not sure how to do median in BQ)SET search_path TO mimiciii;CREA
2022-05-13 21:55:49
286
原创 7.创建计数字段
什么是计数字段?如何创建计数字段?如何从应用程序中使用别名引用它们?不就是连接两个表吗?字段(field)首先,计算字段实际上不存在数据库表中7.创建计算字段计算字段的另一常见用途是对检索出的数据进行算术计算计算字段拼接字段执行算术计算(列1*列2)SELECT prod_id,quantity,item_price,quantity*item_price AS expanded_priceFROM OrderItemsWHERE order_num = 20008;8
2022-05-05 16:56:50
454
原创 Python中常见bug汇总
1.关于“xxx”object is not callable的异常主要原因是因为series不是可以callable的对象(index(索引)、range、list)DataFrame:表格Series:序列List:列表2.“DataFrame” object has no attribute “dtype”也就是说整个表格的数据类型不能够直接查询,可以看单独的列,但是可以使用dtypes来解决该问题.........
2022-04-28 10:56:53
187
原创 AKI病人筛选
复现论文:Interpretable and continuous AKI prediction in the intensive care主要内容:这是一个可解释和连续的长短期记忆 (LSTM) 网络的实现,用于 ICU 环境中的急性肾损伤 (AKI) 预测任务。EXTRACT THE DATA使用了 MIMIC III 数据集。预期的数据文件是:kdigo_stages_measured.csv 包含肌酐的时间序列测量值、过去 6 小时、12 小时和 24 小时的尿量以及相应的标签。(tim
2022-04-27 11:31:40
472
原创 MIMIC中AKI病人的分析
KDD MIMIC-IV与MIMIC-III的区别MIMIC-III数据集介绍背景:包含2001年至2012年之间进入重症监护病房的成年患者的53423例不同的医院入院数据和2001年至2008年之间收治的7870名新生儿数据CKD与AKI的对比生成CKD病人(ICD-9)--生成CKD病人SET SEARCH_PATH TO mimiciii;create table if not exists ckd_patients asSELECT distinct subject_id,icd
2022-04-25 17:24:22
785
原创 Pg处理MIMIC数据
1.sql和psql中的区别估计语句不兼容2.mock数据这个不是youtube上的推荐码?3.排序和去重排序SELECT * FROM patientsORDER BY subject_id ASC(DESC)去重(首先需要有重复的呀)SELECT distinct subject_id from patients4.分组python中的也是groupby,groupby().count()SELECT gender FROM patientsGROUP BY gender
2022-04-25 16:25:31
463
2
转载 Air Passengers(time series)
数据集介绍:数据集名称:AirPassengers.csv;大小:1.75kBdf.shape:144*3144行:从1949,January 到1960,December3列:year,month,passengersdf.head()df.tail()简单绘制一下数据的图像(1) 绘制月份图import matplotlib.pyplot as plt%matplotlib inlineplt.plot(df['month'])(2)绘制乘客列的图像plt.fig
2022-04-23 16:36:19
3105
原创 生成kdigo_stages表格
准备1.kdigo_creatinine:肌酐定义需要的表格:cr(从icustay获取),在PgAdmin中生成表格,当然Python中也可以获取1.kidgo_creatinine生成crcreate table if not exists cr as--psql对icustays和labevents中的数据处理select ie.icustay_id , ie.intime, ie.outtime , le.valuenum as creat , le.char
2022-04-21 17:48:55
461
原创 Postgres安装
准备工作1.查看自己的电脑是多少位?cmd界面中输入“systeminfo”按回车主要是看一下系统类型:系统类型 64 位操作系统, 基于 x64 的处理器版本 Windows 10 专业版版本号 20H2安装日期 2021/10/3操作系统内部版本 19042.1586体验 Windows Feature Experience Pack 120.2212.4170.02.下载经EDB认证的安装程序,用于所有支持的PostgreSQL版本。下载链接:https://www.ente
2022-04-21 14:34:41
1109
原创 AKI主要知识点
AKI的诊断是基于RIFIE标准(但是目前流行的是KDIGO标准:与 RIFLE 标准相比,KDIGO 诊断标准敏感度更高,对短期预后的预测性能更佳,更能准确预测住院死亡率),导致的后果就是可能出现漏诊。评价:适合简单的初步数据处理和建模,但是模型和操作过于简单,很明显不符合Python的求解。1.标题基于 MIMIC-III 数据库的重症患者 AKI 预警系统的建立2.研究终点患者出院,而且出院的时候诊断为急性肾衰竭3.ICD-9(国际疾病分类)根据ICD-9代码筛选MIMIC-III数据
2022-04-20 11:19:30
1843
1
原创 糖尿病预测
数据集介绍age:年龄BMI:身体健康指数,衡量人胖瘦程度以及是否健康的标准Glucose:葡萄糖Insulin:胰岛素HOMA:HOMA指数是医学研究人员经过大量的临床研究和基础研究设计出来的HOMA指数,用它来进行胰岛功能,包括胰岛素抵抗以及胰岛β细胞功能的测定,也经过了临床的验证。Lepin:重组蛋白Adiponectin:脂肪连接蛋白Resistin:抵抗素MCP.1:高活性细胞因子Classification:1代表没患糖尿病;2代表患糖尿病EDA(数据探索性分析)生成
2022-04-19 21:25:57
427
原创 为jupyter添加目录
为jupyter_notebook增加目录1.配置目录环境(1)打开Anaconda Prom(或者直接Win+R)打开命令窗口(2)输入安装命令pip install jupyter_contrib_nbextensions(3)等待程序运行,中途会出来y/n的选项,输入y,然后回车,直到出现Successfully installed标志。但是我安装的时候没有出现这一步提示,出现Successfully就行(4)用户配置(base) C:\Users\dell>jupyter c
2022-04-19 19:30:16
3325
原创 第17课 创建和操纵表
创建表的方法:1.多数DBMS都具有交互式创建和管理数据库表的工具;2.表也可以直接用SQL语句操纵。tips:对具体的DBMS支持何种语法,需要不同情况不同分析。17.1.1表创建基础利用CREATE TABLE创建表时,必须给出下列信息(1)新表的名字,在关键字CREATE TABLE之后给出;(2)表列的名字和定义,用逗号分隔;(3)有的DBMS还要求指定表的位置。创建的表:相应的语法:表列的名字,表列数据的类型,NULL or Not NULL1.每个表列要么是NULL列,要
2022-04-18 19:58:42
254
原创 第2课 检索数据
1.限制结果LIMIT 5 OFFSET 2:从第2行开始,检索5行第一个数字:检索的行数;第二个数字:从哪里开始检索。举例:看一下customers表的cust_name列,总共只有5行数据从第一行开始检索4行:LIMIT 4 OFFSET 12.查找带有缺失值的行WHERE column_name is NULLWHERE column_name is not NULL...
2022-04-18 19:48:20
142
原创 第1课 了解SQL
1.1 数据库基础理解数据库概念是掌握SQL的重要前提1.1.1 数据库(database)保存有组织的数据的容器(通常是一个文件或一组文件)数据库是以某种有组织的方式存储的数据集合。数据库软件应该称为数据库管理系统(DBMS)。数据库是通过DBMS创建和操作的容器,而具体它究竟是什么,形式如何,各种数据库都不一样。1.1.2表(table)某种特定类型数据的结构化清单1.1.3列(column)和数据类型(datatype)数据类型指允许什么类型的数据,它限制该列中存储的数据。数值型;
2022-04-18 19:26:51
504
原创 SQL必知必会阅读笔记
参考:SQL必知必会(第5版) [美]本.福达(Ben Forta) 2020.8Sams Teach Yourself SQL in 10 Minutes(Fifth Edition)Ben Forta:Adobe公司教育计划高级总监,世界知名的技术作家,撰写了SQL、正则表达式、JSP、WAP和Windows开发等方面的40余部技术图书。DBMS:数据库管理系统内容提要(overview)SQL是使用最广泛的数据库语言,绝大多数重要的DBMS支持SQL。本书由浅入深地讲解了SQL的基本概念
2022-04-18 14:50:56
296
原创 psql中日期数据
由于安装的是postgres简称psql,虽然和sql共用基本语法,但是和sql的基本语言还是有略微的不同,所以这篇主要是介绍psql对于日期数据的调取和处理问题。PostgreSQL时间格式及相关函数实践1.获取系统时间NOW()CURRENT_TIMESTAMP(精确值,和datetime相似,即date和time的结合)CURRENT_DATE(yyyy-mm-dd)CURRENT_TIME(hh-mm-ss)2.时间日期的增减主要是使用+,-和INTERVAL原始数据:
2022-04-17 10:22:58
707
原创 列表(lists)
Lists and the things you can do with them.Includes indexing(索引),slicing (切片)and mutating(变异).1.Python 中的列表表示有序的值序列。以下是如何创建它们的示例:primes = [2,3,5,7]#我们可以将其他类型的东西放在列表中:planets = ['Mercury','Venus','Earth','Mars','Jupiter','Saturn','Uranus','Neptune']#我
2022-04-14 09:48:40
775
原创 时间序列学习2:趋势
trend:模型随着移动平均值和time dummy的变化1.什么是趋势?时间序列的趋势分量代表序列均值的持续(presistent)、长期变化(long-term change)。趋势是一系列中移动最慢的部分,代表了最大时间尺度的重要性。在产品销售的时间序列中,随着越来越多的人逐年意识到该产品,市场扩张的影响可能是增加趋势。更一般地说,一个序列中任何持续且缓慢移动的变化都可能构成一种趋势——例如,时间序列通常在其变化中具有趋势。2.移动平均线图(moving average plots)slid
2022-04-13 09:13:46
9091
原创 函数和帮助函数的使用
help():当记住如何使用help()的时候,就掌握了理解大多数其他函数的关键docstrings:文档字符串是一个三引号字符串(triple_quoted string)(可能跨越多行),紧跟在函数的头部之后。当我们在函数上调用 help() 时,它会显示文档字符串。在 [8] 中:1.理解help()函数help(round)help(print)2.定义函数Python虽然自带内置函数(builtin function)#定义一个查找三个数字中最小差值的函数def leas.
2022-04-10 11:02:51
893
原创 语法、变量和数字
Syntax,Variables and Numberstuples:元组(直接交换顺序:a,b = b,a)=:赋值运算符(assignment operator)print():显示传递给他的值;加括号来调用函数,并将函数的输入(或参数)放在括号中。if 行末尾的冒号 (😃 表示新的代码块正在开始。缩进的后续行是该代码块的一部分。*operator:可以表示两个数字想乘,当用字符串相乘的时候,表示重复多次1.Python 语法(Python syntax)2.变量赋值(variable
2022-04-10 09:43:19
94
原创 MIMIC-III数据库的介绍
MIMIC-III(Medical Information Mart for Intensive Care III)是一个由MIT负责管理的基于重症监护室病人监测情况的医学开源数据集。MIMIC-III包含了2001年至2012年期间入住ICU的成年患者(16岁或以上)的53423例不同住院患者的数据,还包含2001至2008年期间接纳的7870例新生儿的数据。26张数据表摘录自论文《基于机器学习的重症监护病患死亡率预测》...
2022-04-09 11:17:26
4327
原创 MIMIC-III分析资源
mimic-code主要包含内容:该存储库由许多结构化查询语言 (SQL) 脚本组成,这些脚本在许多系统中构建 MIMIC-III 数据库并从原始数据中提取有用的概念。还提供了 Jupyter 笔记本,其中详细分析了 MIMIC-III。The repository is organized as follows:(存储库结构如下):1.benchmark - Various speed tests for indices(各种指数速度测试)2.buildmimic - Scripts to b
2022-04-09 10:58:58
675
原创 重命名和合并(renaming and combining)
通常情况下,数据会带有列名、索引名或其他我们不满意的命名约定。在这种情况下,您将学习如何使用 pandas 函数将违规条目的名称更改为更好的名称。您还将探索如何组合来自多个 DataFrame 和/或 Series 的数据。rename()set_index()rename_axis()concat():最简单的组合方法,给定一个元素列表,将此函数沿轴将这些元素混合join()merge()lsuffix1.renamingrename() 允许您通过分别指定索引(index)或列关键
2022-04-08 22:03:32
834
原创 数据类型和缺失值
dtype:是指DataFrame或Series中列的数据类类型;dtype:用来获取特定列的类型;astype():进行数据转换,int变floatpd.isnull():查看缺失值pd.notnull()fillna():替换缺失值replace():替换非空值1.Dtypes数据类型主要是说明pandas如何在内部存储数据的一些信息。特殊性:完全由字符串组成的列没有得到自己的类型,主要是因为他们是给出数据类型。例如:float64是说使用64位浮点数;int64是64位的整数。r
2022-04-08 11:43:29
500
原创 pandas:分组和排序
grouping and sortinglambda是匿名函数,即不再使用def的形式,可以简化脚本,使结构不冗余何简洁groupby()value_counts()agg():可以同时运行一堆不同的函数(max()、min())reset_index():转回常规索引的方法sort_values()sort_index():按照索引值排序1.分组分析(groupwise analysis)reviews.groupby("points").points.count()review
2022-04-08 10:30:44
6555
原创 汇总函数和maps
然而,数据并不总是以我们想要的格式从内存中出来。有时我们必须自己做更多的工作来重新格式化它以完成手头的任务。本教程将介绍我们可以对数据应用的不同操作,以使输入“恰到好处”。Summary functionsdescribe()mean()unique():使用 unique 函数获取列中唯一条目的列表。value_counts():要查看唯一值列表以及它们在系列中出现的频率,请使用 value_counts 方法。mapsmap()apply()请注意,map() 和 apply() 分
2022-04-07 20:13:23
217
原创 练习:索引(indexing)、选择(selecting)和分配(assigning)
Pandas教程选择要处理的 pandas DataFrame 或 Series 的特定值是您将要运行的几乎所有数据操作中的一个隐含步骤,因此在 Python 中处理数据时您需要学习的第一件事就是如何快速有效地与选择与你研究的数据相关的要点。数据介绍:主要是通过wine-reviews数据集进行分析:129971*131.从reviews中筛选出列:description,同时把它assign到变量desc中一般来说,当我们从 DataFrame 中选择一列时,我们会得到一个 Series。查
2022-04-07 18:49:29
1558
原创 Pandas创建数组和表格
Kaggle中Pandas教程主要是记录学习中遇到的一些问题DataFrame1.创建下图所示的数据表格方法1:fruit = pd.DataFrame([[30,21]],columns=["Apples","Bananas"])方法2:fruit = pd.DataFrame(np.array([[30,21]]),columns=["Apples","Bananas"])2.创建2*2表格,带有行标和列标3.使用如下所示的系列创建一个可变成分(ingredients(
2022-04-07 10:58:00
2264
原创 事件序列的处理方法
1.点过程2.Hawkes process3.Poisson process(1) Harvkes Process(霍克斯过程)的局限性4.改进Hawkes Process的方法为什么使用隐藏层?
2022-04-05 20:04:42
499
原创 MIMIC-III入门级安装
之前发布过一篇关于mimic-iii demo的安装,实际上和上次安装步骤完全相同(可以看看上次demo安装的细节),只不过MIMIC-III数据集过于大,导致最后的安装过程会耗时耗空间。demo安装链接准备工作:获取MIMIC-III数据的位置:C:\mimic-iii-clinical-database-1.4获取code的位置:D:\mimic-code-main\mimic-iii\buildmimic\postgres(之后的对于创建空白表、建立索引、测试架构都是来源于此code)安装
2022-04-01 09:00:22
1199
原创 MIMIC-III的安装
参考文章:MIMIC III(windows安装MIMIC III数据库)准备工作1.获取MIMIC中数据由于MIMIC-III数据有申请限制,所以本文主要是以MIMIC-III的demo来解释。数据位置:D:\PhysioNetData\mimic-iii-clinical-database-demo-1.4注意:在后面的sql加载中要改为左斜线。2.下载Git-Hub中的code,链接 该链接下载速度很慢。code位置:D:\mimic-code-main\mimic-iii\buil
2022-03-29 19:00:54
2765
原创 变量和简单的数据类型
1.变量每个变量都储存了一个值——与变量相关联的信息。变量的命名和使用(1)变量名只能包含字母、数字和下划线。变量名可以字母或下划线打头,但不能以数字打头.(2)变量名不能包含空格,但可使用下划线来分隔其中的单词.(3)不要将Python关键字和函数名用作变量名,即不要使用Python保留用于特殊用途的单词.(4)变量名应既简短又具有描述性.(5)慎用小写字母l和大写字母O,因为它们可能被人错看成数字1和0。2.字符串字符串就是一系列字符。print("Hello Python Wo
2022-03-23 10:50:47
1029
原创 操作系统简单介绍
1.操作系统(operating system,简称OS)操作系统是管理计算机硬件与软件资源的计算机程序。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入设备与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。2.常见的操作系统Windows操作系统:Windows操作系统,是由美国微软公司(Microsoft)研发的操作系统,问世于1985年。起初是MS-DOS模拟环境,后续由于微软对其进行不断更新升级,提升易用性,使Windows成为
2022-03-23 09:59:02
4945
原创 机器学习模型评价指标分析
背景:近期主要是在ROC曲线上的问题,数据集是titanic、heart disease 以及python自带的数据集iris参考链接1:混淆矩阵(https://blog.youkuaiyun.com/seagal890/article/details/105059498)参考链接2:如何画ROC曲线参考链接3:Sklearn.metrics评估方法参考链接4:用Python绘制ROC曲线混淆矩阵(confusion matrix)基本上所有的模型评价指标最后都是从cm这一块延伸出来的。模型评价指标
2022-03-19 21:17:49
1420
原创 tensorflow的安装测试和版本、路径查询
背景:已经安装好tensorflow,接下来主要是进行测试。测试tensorflow导入包import tensorflow as tfsess = tf.compat.v1.Session()2.在jupyter中查看tf的安装版本和路径tf.__path__tf.__version__3查看python的版本import sysprint(sys.version)print(sys.executable)4,tf安装测试sess = tf.compat.v1.Sess
2022-03-18 10:16:24
2270
原创 Numpy学习1:dtype、ndim、astype和shape
1.ndim的使用list1 = [[1,2,3,4],[13,2,3,4]]array1 = np.array(list1)list2 = [[1,2,3,4],[1,23,4,2],[23,3,3,2],[2,3,5,3]]array2 = np.array(list2)list3 =[[[1,2,3],[4,5,3]],[[7,8,9],[10,11,12]]]array3 = np.array(list3)list4 =[[[1,2,3,4],[1,2,3,4]],[[1,3,2,3]
2022-03-17 19:55:00
703
原创 tenserflow的安装
学习目标:使用jupyter完成tensorflow的安装背景:在之前使用Anaconda安装了TensorFlow,但是不怎么明白为什么安装成功,但是在Jupyter上一直显示没有安装。参考链接:https://beyondyanyu.blog.youkuaiyun.com/article/details/120594409解决方案:上述文章中给出的检测方案:注意的是退出环境所处的状态:在jupyter中安装:同时关于keras也安装成功:conda和pip安装的区别:参考链接:htt
2022-03-17 16:25:09
1726
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人