
Python
文章平均质量分 68
LRaby35646
这个作者很懒,什么都没留下…
展开
-
Python : ArgumentParser对象及使用
argparse模块的使用转载 2024-11-07 20:18:36 · 74 阅读 · 0 评论 -
Spearman、Pearson、Euclidean、Cosine、Jaccard,用来衡量不同数据之间的相似性或差异性
排序关系-1到1。原创 2024-10-23 17:05:06 · 1611 阅读 · 0 评论 -
DataFrame 列选择,返回的是DataFrame还是Series?
DataFrame 列选择,返回的是DataFrame还是Series?原创 2024-09-05 10:50:14 · 288 阅读 · 0 评论 -
计算样本之间的相似度
计算样本之间的相似度通常可以通过计算样本之间的距离来实现,尽管这不是唯一的方法。距离度量和相似度度量是两个相关但不同的概念。距离度量通常用于表示样本之间的不相似程度,而相似度度量则用于表示样本之间的相似程度。在距离度量的五种方法中,欧几里得距离(Euclidean Distance)、曼哈顿距离(Manhattan Distance)、余弦距离 是最常用的三种。欧几里得距离:适用于低维和中维数据,广泛用于各种机器学习算法。(低维通常在1-10维之间,中维在10—100之间)原创 2024-07-07 22:21:03 · 826 阅读 · 0 评论 -
给csv或txt文件加上一列id
从这样变成这样。原创 2024-07-06 15:04:15 · 405 阅读 · 0 评论 -
synergy_bliss,synergy_hsa,synergy_loewe,synergy_zip的用法
Synergy 是指多种药物联合使用时所产生的协同作用效果。常见的 Synergy 计算方法包括 Bliss、HSA、Loewe 和 ZIP。Bliss 模型基于独立作用原理,假设两个药物在无交互的情况下独立起作用HSA 模型假设联合用药效果不超过最强单药效果。Loewe 模型基于剂量加成原理,假设联合用药效果等同于等效剂量单药效果。ZIP 模型结合 Bliss 和 Loewe 模型,通过零交互效应假设来评估协同作用。原创 2024-07-02 22:29:47 · 2736 阅读 · 0 评论 -
enumerate函数
enumerate(iteration, start)函数默认包含两个参数,其中iteration参数为需要遍历的参数,比如字典、列表、元组等,start参数为开始的参数,默认为0(不写start那就是从0开始)。enumerate函数有两个返回值,第一个返回值为从start参数开始的数,第二个参数为iteration参数中的值。提示:以下是本篇文章正文内容,下面案例可供参考。原创 2024-06-24 10:46:55 · 401 阅读 · 0 评论 -
random.choices()和random.sample()函数的区别
在Python编程语言中,sample函数是一个用于随机抽样的实用工具,它属于random模块的一部分。通过使用sample函数,我们可以从给定的数据序列中随机选取一定数量的不重复元素。原创 2024-06-24 10:28:25 · 1562 阅读 · 0 评论 -
isin() 以及.loc[ ]的使用
解释:drug_disease_pd[‘drug’].isin(embeddingf_matrix.keys()) 生成一个。drug_disease_pd[‘disease’].isin(embeddingf_matrix.keys()) 生成一个。isin()方法用于过滤数据框(DataFrame)或序列(Series)中的值,仅保留在给定列表中出现的值。,标示每个 disease 是否在 embeddingf_matrix 的键中。这是一种常用的方法来基于条件选择 DataFrame 中的数据行。原创 2024-06-22 22:43:30 · 445 阅读 · 0 评论 -
分隔符的使用
制表符分隔值 (TSV) 文件格式表示用纯文本格式的制表符分隔的数据。该文件格式类似于 CSV,用于以结构化方式组织数据,以便在不同应用程序之间导入和导出。该格式主要用于电子表格应用程序和数据库中的数据导入/导出和交换。TSV 文件中的每条记录都包含在单行文本文件中,其中每个字段值由制表符分隔。TSV 文件格式的媒体类型是文本/制表符分隔值。原创 2024-06-22 21:55:15 · 1272 阅读 · 0 评论 -
python. pickle的用法
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档。原创 2024-06-22 19:39:32 · 935 阅读 · 0 评论 -
csv.reader与pd.read_csv的区别与应用
csv.reader():适合简单的CSV文件读取任务,轻量但需要手动处理数据。csv.reader()返回一个reader对象,该对象将遍历csv文件中的行。从csv文件中读取的每一行都作为字符串列表返回。pandas.read_csv():适合复杂的数据分析和处理任务,提供强大的数据操作功能和便捷接口。pandas.read_csv()返回一个dataframesepPandas用来指定字段分隔符(如空格、制表符、逗号等)。delimitercsv.reader用来指定字段分隔符。原创 2024-05-31 10:25:45 · 585 阅读 · 0 评论 -
保留txt文件中的双引号
在txt文件中有双引号,但是read_csv之后,双引号消失,是什么原因?原创 2024-05-30 22:26:00 · 283 阅读 · 0 评论 -
try...except...的使用
异常是我们常说的==“报错”,宏观上分为两类==,一类是语法错误(SyntaxError),另一类是程序异常(Exception)。无论是语法错误还是程序异常,只要触发,程序就会立刻停止运行。KeyError(键错误):当试图访问字典中不存在的键时引发的异常。ValueError(值错误):当传递给函数的参数类型正确但值不合法时引发的异常。TypeError(类型错误):当使用不兼容的类型进行操作或函数调用时引发的异常。FileNotFoundError(文件未找到错误)原创 2024-05-22 18:15:33 · 2113 阅读 · 1 评论 -
sort_values()
用法:参数用法by指定列名或索引值,即:根据哪列进行排序axis若axis=0或’index’,则按照指定列中数据大小排序;若axis=1或’columns’,则按照指定索引中数据大小排序,默认axis=0ascendingTrue:升序;False:降序,默认为Trueinplace是否用排序后的数据集替换原来的数据,默认为False,即不替换{‘first’,‘last’},设定缺失值的显示位置。原创 2024-05-22 15:23:32 · 1983 阅读 · 0 评论 -
对文件中某一行根据包含的数量进行筛选
针对上面两种方法,第二种要求数据格式是规范的且没有额外的复杂情况,所以第一种较为灵活,且生成的数据格式规范。原创 2024-05-21 17:30:16 · 269 阅读 · 0 评论 -
os.path的用法
即:只创建clf_cutoff_negative目录,而如果之前的目录不存在并且也需要创建的话,就会报错。os.makedirs()创建。原创 2024-05-20 10:53:01 · 390 阅读 · 0 评论 -
字典的相关操作
字典的各种操作原创 2024-04-23 17:18:34 · 749 阅读 · 0 评论 -
字典转变成DataFrame
生成DataFrame的几种方式原创 2024-04-22 20:49:42 · 2768 阅读 · 0 评论 -
Python 分组的方法
本文为自己自学内容的记录,其中多有借鉴别人博客的地方,一并在参考文献中给出链接。其中内容有理解不到位的地方,请各位大佬在评论区给出修改意见,感恩🌹。原创 2024-04-22 19:31:53 · 1452 阅读 · 1 评论 -
python 的append与extend ; join与” + “;map(function, iterable)与for循环的用法比较
这就是append()和extend()的区别:append()将整个列表作为一个单独的元素添加到另一个列表中,而extend()将列表中的元素逐个添加到另一个列表中。中用于将字符串序列(如列表、元组等)中的元素连接成一个字符串的方法。是一个可迭代对象,如列表、元组等,其中的元素都是字符串。经过上面两种方法的比较,显然join()的方法更简短。是连接的分隔符,它将用于连接序列中的各个元素。分隔符连接起来,并返回连接后的字符串。原创 2024-04-15 21:56:14 · 478 阅读 · 2 评论