
Python
Python
DrugAI
Fight Disease With Code ! Fight Disease With Data Technology !
药学、医学、化学和生物与计算机和AI交叉的爱好者从业者。
展开
-
conda 和 pip 安装本地包
pip 安装本地包pip install pymol-1.8.6.1-cp36-cp36m-win_amd64.whlconda 安装本地包conda install --use-local rdkit-2020.03.1.0-py37h3d1ada6_1.tar.bz2原创 2020-04-11 21:18:47 · 2012 阅读 · 0 评论 -
Python | 查看已安装各种第三方库版本
NumPyimport numpynumpy.__version__1.17.3PandasTensorFlowimport tensorflow as tf#版本tf.__version__#路径tf.__path__Kerasimport kerasprint(keras.__versio...原创 2020-04-03 13:39:33 · 4102 阅读 · 0 评论 -
深入理解Python闭包概念
闭包并不只是一个Python中的概念,在函数式编程语言中应用较为广泛。理解python中的闭包一方面是能够正确的使用闭包,另一方面可以好好体会和思考闭包的设计思想。1.概念介绍首先看一下维基上对闭包的解释:在计算机科学中,闭包(英语:Closure),又称词法闭包(Lexical Closure)或函数闭包(function closures),是引用了自由变量的函数。这个被引用的自...原创 2020-02-21 21:20:51 · 1703 阅读 · 1 评论 -
Anaconda | conda常用命令
# 查看当前环境下已安装的包conda list # 查看某个指定环境的已安装包conda list -n python36 # 查找package信息conda search numpy # 安装packageconda install -n python36 numpy# 如果不用-n指定环境名称,则被安装在当前活跃环境# 也可以通过-c指定通过某个channel安装...原创 2020-02-19 20:00:01 · 1069 阅读 · 0 评论 -
Pymol & BioPython | PDB文件中氨基酸序列的提取
1. Pymol当前目录下有一个PDB文件,利用pymol的命令模式:pymol receptor.pdb -c -d "save receptor.fasta"2.BioPythonfrom Bio import PDBparser = PDB.PDBParser()structure = parser.get_structure('2FH7', '2FH7.p...原创 2019-11-01 12:56:28 · 14326 阅读 · 0 评论 -
Anaconda | CentOS7 -解决 Python2和Python3共存
设置Python3软连接ln -s /usr/anaconda3/bin/python3 /usr/bin/python3设置Python3的ipython 使用软链接ln -s /usr/anaconda3/bin/ipython /usr/bin/ipython设置Python3的conda使用软链接ln -s /usr/anaconda3/bin/con...原创 2020-02-19 20:14:55 · 1315 阅读 · 0 评论 -
Jupyter notebook与Spyder集成
Spyder notebook pluginSpyder插件在Spyder中使用Jupyter notebook。目前,它支持基本功能,例如创建新笔记本,在文件系统中打开任何笔记本以及在任何位置保存笔记本。还可以使用Spyder的文件切换器轻松地在笔记本之间切换,并打开连接到笔记本内核的IPython控制台,以在Variable Explorer中检查其变量。安装#condaco...原创 2019-03-17 12:53:29 · 7151 阅读 · 3 评论 -
Python用turtle画爱心丘比特之剑
**程序员的爱情,在Python中运用调用turtle库来根据函数画出爱心。**from turtle import*setup(750,500)penup()pensize(25)pencolor("pink")fd(-230)seth(90)pendown()circle(-50,180)circle(50,-180)circle(75,-50)circle(-...转载 2019-03-21 11:38:15 · 7041 阅读 · 0 评论 -
Python生物信息学①将RNA序列翻译成蛋白质序列。
环境OS version : Win10 x64python_version : Python 3.6.5 实例代码codon_table = { 'GCU':'A', 'GCC':'A', 'GCA':'A', 'GCG':'A', 'CGU':'R', 'CGC':'R', 'CGA':'R', 'CGG':'R', 'AGA':'R', '...原创 2019-03-24 21:48:07 · 7914 阅读 · 4 评论 -
Python生物信息学②从PDB文件中提取蛋白序列
环境OS version : Win10 x64python_version : Python 3.6.5实例代码aa_codes = { 'ALA':'A', 'CYS':'C', 'ASP':'D', 'GLU':'E', 'PHE':'F', 'GLY':'G', 'HIS':'H', 'LYS':'K', 'ILE':'I', '...原创 2019-03-24 23:23:05 · 8822 阅读 · 0 评论 -
心脏病预测模型(基于Python的数据挖据)
作者:Abdullah Alrhmoun该项目的目标是建立一个模型,该模型可以根据描述疾病的特征组合预测心脏病发生的概率。为了实现这一目标,作者使用了瑞士Cleveland Clinic Foundation收集的数据集。该项目中使用的数据集包含针对心脏病的14个特征。数据集显示不同水平的心脏病存在从1到4和0没有疾病。我们有303行人数据,13个连续观察不同的症状。此项目研究了不同的经典...原创 2019-04-13 21:20:00 · 17454 阅读 · 2 评论 -
Python+pandas计算数据相关系数(person、Kendall、spearman)
pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数、Kendall Tau相关系数和spearman秩相关)。pandas相关系数-DataFrame.corr()参数详解DataFrame.corr(method='pearson',min_periods=1)参数说明:...原创 2019-03-12 15:48:09 · 91407 阅读 · 6 评论 -
Python常见数据框操作①
import numpy as npimport pandas as pdfrom pandas import Sereis, DataFrameser = Series(np.arange(3.))data = DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))data['w'] ...转载 2019-03-15 13:43:27 · 4396 阅读 · 0 评论 -
Python—pandas中DataFrame类型数据操作函数
python数据分析工具pandas中DataFrame和Series作为主要的数据结构.本文主要是介绍如何对DataFrame数据进行操作并结合一个实例测试操作函数。1)查看DataFrame数据及属性df_obj = DataFrame() #创建DataFrame对象df_obj.dtypes #查看各行的数据格式df_obj['列名'].astype(int)#转换某列的数...转载 2019-03-09 13:09:54 · 1470 阅读 · 0 评论 -
Python 3 —— 使用 PyMySQL 操作 MySQL8
PyMySQL 是一个纯 Python 实现的 MySQL 客户端操作库,支持事务、存储过程、批量执行等。PyMySQL 遵循 Python 数据库 API v2.0 规范,并包含了 pure-Python MySQL 客户端库。pip install PyMySQL创建数据库连接import pymysqlconnection = pymysql.connect(h...原创 2019-01-01 05:01:27 · 2098 阅读 · 0 评论 -
Python生物信息学④计算DNA核苷酸A、C、G、T出现次数
计算DNA核苷酸A、C、G、T出现次数with open("rosalind_dna.txt") as f: fragment_of_dna = f.read()fragment_of_dna.rsplit()print(fragment_of_dna.count("A"), fragment_of_dna.count("C"), fragment_...原创 2019-03-30 18:44:56 · 3659 阅读 · 1 评论 -
Python生物信息学⑤DNA转录RNA
Python实现DNA转录RNAwith open("rosalind_rna.txt") as f: dna_fragment = f.read().rsplit()rna_fragment = ''.join("U" if x=="T" else x for x in dna_fragment[0])rna_fragment原创 2019-03-30 18:47:39 · 2581 阅读 · 0 评论 -
Python生物信息学⑥绘制热图及火山图
Python生物信息学⑥绘制热图及火山图Python生物信息学③提取差异基因通过上Python生物信息学③提取差异基因得到了该数据集的差异分析的两个关键参数,1.差异倍数(foldchange)以及2.差异的P值。本篇目的是得到满足差异倍数和差异P值的基因,同时进行可视化(包括差异分析常见的火山图和热图)。绘制火山图(1)第一步制作差异分析结果数据框genearray = n...原创 2019-03-30 22:42:31 · 14758 阅读 · 4 评论 -
Open Drug Discovery Toolkit
Open Drug Discovery Toolkit (ODDT) is modular and comprehensive toolkit for use in cheminformatics, molecular modeling etc. ODDT is written in Python, and make extensive use of Numpy/Scipy原创 2017-12-29 19:17:34 · 1325 阅读 · 0 评论 -
Machine Learning | 基于逻辑回归做二分类进行癌症预测
导入包import pandas as pdimport numpy as npfrom sklearn.datasets import load_bostonfrom sklearn.linear_model import LinearRegression, SGDRegressor, Ridge, LogisticRegressionfrom sklearn.model_sel...原创 2019-10-03 16:34:59 · 1409 阅读 · 0 评论 -
[数据科学] 通过基因表达监测进行肿瘤预测
简介通过基因表达监测(DNA微阵列)对新的癌症病例进行分类,从而为鉴定新的癌症类别和将肿瘤分配到已知类别提供了一般方法。这些数据用于对患有急性髓性白血病(AML)和急性淋巴细胞白血病(ALL)的患者进行分类。代码实例导入依赖库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%mat...原创 2019-08-16 13:53:36 · 2337 阅读 · 7 评论 -
蛋白序列 | 基于深度学习的蛋白质序列家族分类
背景简介蛋白质数据集来自于结构生物信息学研究协作组织(RCSB)的蛋白质数据库(PDB)。RCSB : Research Collaboratory for Structural BioinformaticsPDB : Protein Data BankPDB是原子坐标和描述蛋白质和其他重要生物大分子的信息储存库。结构生物学家使用诸如X射线晶体学、NMR和低温电子显微术的方法来...原创 2019-09-10 11:29:22 · 6739 阅读 · 8 评论 -
Jupyter notebook运行指定的conda虚拟环境
安装nb_conda_kernelsconda install nb_conda_kernels重新启动notebook,在kernel -> change kernel中即可切换到指定的虚拟环境参考资料:https://github.com/Anaconda-Platform/nb_conda_kernels...原创 2019-08-17 17:55:10 · 1957 阅读 · 0 评论 -
Windows10远程访问Jupyter notebook
服务器Ubuntu 16.04.1 LTS首先安装Anaconda3默认情况下,安装好 Anaconda 后打开 jupyter notebook或者命令端输入 jupyter notebook, 访问本地localhost:8888 即可。如果要访问另一台机器,比如远端服务器上的 notebook, 即默认是不支持 ip:8888 这样的访问,需要额外配置。———————...原创 2019-08-17 14:59:50 · 2281 阅读 · 0 评论 -
NGLView 安装与配置-交互式分子结构和轨迹查看
NGLViewNGLview 是Jupyter Notebook的小插件, 可用于交互地可视化分子结构, 可以查看分子动力学轨迹数据. 支持读取文件数据。程序的源代码可以在网上Github里查看, 同时也可以在PyPI和bioconda内获取. NGLview在服务器端采用python, 而在客户端则采用JS来实现, 与Jupyter的整合则通过ipywidgets包实现. 客户端采用N...原创 2019-10-16 18:29:50 · 5620 阅读 · 3 评论 -
Jupyter Notebook中显示图像和数学公式
1.可以使用LaTeX表示数学公式# 可以使用LaTeX表示数学公式from IPython.display import LatexLatex(r"$\sqrt{x^2+y^2}$")2.SymPy的表达式也可以显示为LaTex%load_ext sympyprintingfrom sympy import *x, y = symbols("x,y")sqrt(x*...转载 2019-05-12 14:05:12 · 4966 阅读 · 0 评论 -
Python生物信息学③提取差异基因
python做生信分析的流程使用的数据集是GSE5583,来自于2006年的基因芯片结果,该芯片目的是提取野生型和HDAC1小鼠胚胎干细胞用于Affymetrix微阵列上的差异RNA。#导入包import matplotlib.pyplot as pltimport osimport numpy as npimport pandas as pdfrom scipy import...原创 2019-03-28 20:49:07 · 10826 阅读 · 2 评论 -
Python笔记:将字典存储为csv格式文件
import pandas as pdpd.DataFrame(col_count,index=[0]).to_csv('col_count.csv')DrugAI原创 2019-03-27 10:21:05 · 11168 阅读 · 0 评论 -
Windows10+Python3.6(Anaconda3)+OpenCV3.4安装配置
环境win10(64bit)+Anaconda3(python3.6.5)下载opencv_python执行下面命令安装opencv3.4.3:pip install opencv_python-3.4.3-cp36-cp36m-win_amd64.whl测试#!/usr/bin/python3import numpy as npimport cv2im...原创 2018-11-11 20:34:52 · 2389 阅读 · 0 评论 -
Windows10下Python3做OpenGL的编程
OpenGL的Python3.6环境配置下载:PyOpenGL‑3.1.3b2‑cp36‑cp36m‑win_amd64.whl PyOpenGL_accelerate‑3.1.3b2‑cp36‑cp36m‑win_amd64.whl安装:#pip install whl文件pip install PyOpenGL‑3.1.3b2‑cp36‑cp36m‑win_am...原创 2018-11-11 19:21:50 · 3377 阅读 · 0 评论 -
Python之%s%d%f
%s 字符串string="hello" #%s打印时结果是hello print ("string=%s" % string) # output: string=hello #%2s意思是字符串长度为2,当原字符串的长度超过2时,按原长度打印,所以%2s的打印结果还是hello print ("string=%2s" % string...原创 2018-05-28 15:26:39 · 7194 阅读 · 0 评论 -
Python3学习笔记(一):基础语法
Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。Python 是交互式语言: 这意味着,您可以在一个Python提示符,直接互动执行写你的程序。Python 是面向对象语言: 这意味着Python支持面向对象的风格或代码封装在对象的编程技术。Python 是初学者的语言...原创 2018-05-28 15:05:51 · 1204 阅读 · 0 评论 -
Python & 机器学习之项目实践
机器学习是一项经验技能,经验越多越好。在项目建立的过程中,实践是掌握机器学习的最佳手段。在实践过程中,通过实际操作加深对分类和回归问题的每一个步骤的理解,达到学习机器学习的目的。预测模型项目模板不能只通过阅读来掌握机器学习的技能,需要进行大量的练习。本文将介绍一个通用的机器学习的项目模板,创建这个模板总共有六个步骤。通过本文将学到:端到端地预测(分类与回归)模型的项目结构。如何将前面学到的内容引入...转载 2018-05-28 13:26:51 · 1403 阅读 · 0 评论 -
创建独立的Python化学信息学环境
一、安装AnacondaWin或者Linux系统下Anaconda或Miniconda安装,不赘述,网上很多教程。二、创建Python3.x虚拟环境conda create -n pydd36 python=3.6 conda三、测试环境#激活虚拟环境source activate pydd36#使用openbabel和RDKitimport openbabel, pybelfrom rdkit...原创 2018-05-23 14:49:56 · 2899 阅读 · 2 评论 -
Error: /usr/lib64/libstdc++.so.6: version `CXXABI_1.3.8‘ not found (required by /usr/anaconda3/bin/)
###Error: /usr/lib64/libstdc++.so.6: version `CXXABI_1.3.8' not found (required by /usr/anaconda3/bin/../lib/./libicui18n.so.58)###strings /usr/lib64/libstdc++.so.6|grep CXXABIstrings /usr/anaconda3/l...原创 2018-05-22 19:51:53 · 5331 阅读 · 2 评论 -
Win或Linux系统下用conda安装Open Babel
一、安装Anaconda或Miniconda二、利用conda安装openbabelconda install -c openbabel openbabel原创 2018-05-17 22:54:02 · 7070 阅读 · 9 评论 -
RMSD:通过旋转计算两个分子间的最小rmsd
使用旋转计算两个分子的均方根偏差(RMSD)使用Kabsch算法(1976)或Quaternion算法(1991)进行旋转,在两个笛卡尔坐标之间.xyz或者.pdb格式中计算均方根偏差(RMSD),从而得到最小的RMSD。一、安装AnacondaWin或者Linux系统下Anaconda安装,不赘述,网上很多教程。二、通过conda安装rmsdpip install rmsd或python -...原创 2018-05-17 13:17:14 · 5060 阅读 · 2 评论 -
RDKit:计算不同小分子构象之间的RMSD
计算两个小分子之间的RMSD,可以用来判断两个构象的接近程度。第一步:安装AnacondaWin或者Linux系统下Anaconda安装,不赘述,网上很多教程。第二步:安装RDKit通过conda安装RDKitconda install -c rdkit rdkit第三步:使用方法python isoRMSD.py mol1.pdb mol2.pdb rmsd.txt***************...原创 2018-05-17 11:48:52 · 5164 阅读 · 4 评论 -
CentOS7(64位)下运行IPython3出错解决办法
不知道什么原因,运行ipython3的时候报错了,搜索了很久,找到的解决办法,虽然解决的不彻底。unset PYTHONPATHipython3原创 2017-08-30 23:26:44 · 1367 阅读 · 0 评论 -
Python创建Excel表格并写入数据之xlwt
#!python3#coding:utf-8import xlwtf = xlwt.Workbook()sheet1 = f.add_sheet(r'sheet1', cell_overwrite_ok=True)sheet1.write(0,0,"Name")sheet1.write(0,1,"Conf")sheet1.write(0,2,"Grid score")sh...原创 2019-10-24 15:18:08 · 4399 阅读 · 0 评论