
Deepchem
文章平均质量分 80
药研猿
分享分子动力学模拟、CADD等相关内容
展开
-
Deepchem-几种机器学习模型搭建
在开始前第一步需要导入deepchem模块。以下都默认dataset已经准备好,并成功拆分成了train_dataset、 valid_dataset、 test_dataset。import deepchem as dc数值连续型机器学习模型1.随机森林from sklearn.ensemble import RandomForestRegressor#将随机森林训练模型简写为rfrf = RandomForestRegressor() #deepchem只是提供了深度学习.原创 2022-05-18 12:05:24 · 989 阅读 · 0 评论 -
Deepchem-介绍几种Featurizer
几种Featurizer解读Deepchem的Featurizer我倾向于翻译成‘特征提取器’。我们都知道化学分子本身不能直接作为机器学习的读入数据,这就需要我们将其结构转变为数字形式。而featurizer可以很方便做到这一点,它可以将化学分子(SMILE格式)转变为长度一致的向量或维度一致的矩阵形式。为了方便说明,我们需要提前准备好需要进行特征提取的小分子:import deepchem as dcsmiles = [ 'O=Cc1ccc(O)c(OC)c1', 'CN1CCC[C原创 2022-05-18 12:03:44 · 2222 阅读 · 0 评论 -
Deepchem-构建个人Dataset
个人Dataset构建Numpy构建Datasetimport deepchem as dcimport numpy as npsmiles = [ 'O=Cc1ccc(O)c(OC)c1', 'CN1CCC[C@H]1c2cccnc2', 'C1CCCCC1', 'c1ccccc1', 'CC(=O)O',]properties = [0.4, -1.5, 3.2, -0.2, 1.7]#初始化特征生成器(自定义生成的特征向量长度为1024)featuriz原创 2022-05-16 14:42:43 · 618 阅读 · 0 评论 -
Deepchem-Dataset数据结构理解
写在前面DeepChem是一个用于科研的机器学习库。DeepChem最初专注于化学分子的研究,但随着版本更迭,现在其已能更广泛地支持所有类型的科学应用。我觉得这个模块做的比较好的几点在于:能够方便地将化学分子用统一长度的向量或矩阵表示,便于机器学习数据输入;提供方便使用的机器学习接口,你可以不必专门学习机器学习库(如Tensorflow 、Pytorch等);封装化程度高,上手容易。但对于需要个性化参数调整的需求就不是很方便了,这个时候就需要查阅源码,在理解的基础上进行调整。从本期开始,原创 2022-05-16 14:37:43 · 655 阅读 · 0 评论