
数据挖掘
文章平均质量分 71
天狼啸月1990
舟遥遥以轻飏,风飘飘而吹衣。
展开
-
医学数据挖掘流程(五):数据统计
于鹏-提取上下四分位代码。原创 2021-11-15 09:51:18 · 1149 阅读 · 0 评论 -
医学数据挖掘流程(六):写报告+模型集成
纳排发现问题,要准确描述问题、统计分析相关数据。研究方向:研究对象与目标变量是直接相关的。最基础的理论基石错了,后面一切都是枉然。方向思路:与team同事探讨。并提出自己立场的解决方案。原创 2021-11-11 21:17:13 · 731 阅读 · 0 评论 -
医学数据挖掘流程(四):建模调参画图
建模数据集不包含patient_id或case_no,但我们需要保存一版带id的数据集,自己看!二分类模型多分类模型回归模型。原创 2021-11-11 21:16:42 · 2252 阅读 · 0 评论 -
医学数据挖掘流程(三):特征工程
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征工程流程:这些过程不是必须全部要有,需要根据业务需求和数据格式特点,适宜调整!原创 2021-11-11 21:16:10 · 2399 阅读 · 0 评论 -
医学数据挖掘流程(二):数据预处理
医学数据挖掘基本素养:每一步都要校对数据!!!!!!!!!!!!!!!!!看数据量、特征数据缺失情况、离散情况、差异情况、特征包含情况(频次、dosage和日剂量)、运行结果。要不然建模数据不好,得重新返工。代码没思路,多看原始数据。逻辑顺,才能写代码顺。深刻理解原始数据,才能理清逻辑。才能决定手工操作方便还是代码方便,在用药数据重复和交叉的情况需要百度药物药效属性,才能决定该合并还是删除。不看数据,没有发言权!!!!!!数据处理注意事项:Medical DM数据处理流程:参考丙戊酸和甲氨蝶呤项目因为特定用原创 2021-11-11 21:15:31 · 3343 阅读 · 0 评论 -
医学数据挖掘流程(一): 需求分析-数据梳理
明确需求:先描述想研究啥,用一句话描述,拆成X和Y,然后结合X和Y的数据类型,选择对应的分析方法。(业务、临床)指导算法人员要做什么,而不是算法指导业务,比如明确其他检测指标和联合用药,不同的药不一样。因为算法不懂业务啊。工作流程:业务指导,制定流程。算法根据业务需求搞数据、方法、模型效果。==>形成算法报告。明确目标 有效性分析:需要有tdm检测。因为在医学上他们通常认为10-20mg的tdm检测水平为有效! 高低剂量组对比统计分析:明确分组标注。需要分析高低剂量用药对疾病治疗或预防原创 2021-11-11 21:14:00 · 1305 阅读 · 0 评论 -
jupyter notebook使用技巧
jupyter跑不动?一个循环一个cell,别太多一起跑,它和pycharm不一样。 删除temp_list等临时变量,他们占用缓存太高。原创 2021-11-11 09:44:56 · 1721 阅读 · 0 评论 -
医学数据挖掘学习项目:他克莫司
目录1. 报告2. 代码1:从数据库中提取数据lambda,匿名函数,快速定义单行函数,可以用在任何需要函数的地方。pandas判断是否是空值NaN,isnull(),notnull()pandas.reset_index()pandas.astype()pandas.Excel_Writer()输出到excelmysqlpandas merge()方法pandas rename()方法pandas.drop_duplicates()方法pandas Da原创 2021-10-06 22:44:30 · 1765 阅读 · 0 评论