自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(68)
  • 资源 (9)
  • 收藏
  • 关注

原创 基于RDKit的分子描述符分析与特征选择:以溶解度预测为例

然而,要建立有效的QSAR模型,首先需要通过合适的分子描述符(如分子指纹、拓扑特征、电子特征等)来表征分子结构。我们首先加载一个包含溶解度数据的CSV文件,并通过RDKit的SMILES标准化功能确保每个分子都有唯一的、标准化的SMILES表示。除了相关性高的描述符,某些特征的方差可能非常低,这意味着这些特征对数据的区分度较差,因此没有什么用处。这些冗余的描述符不会为模型提供新的信息,反而可能影响模型的性能。在本例中,我们使用了。会尝试不同的回归算法,如线性回归、随机森林回归等,并输出每个模型的性能指标。

2024-11-26 20:36:58 1403

原创 RDKit|虚拟筛选与分子对接

通过 RDKit 的分子预处理、指纹计算、与 AutoDock Vina 等对接软件集成,研究人员可以高效地进行虚拟筛选与分子对接分析,从而加速新药发现进程,降低实验成本。虚拟筛选和分子对接是药物发现过程中至关重要的计算方法,用于预测小分子与生物靶点之间的相互作用。这些方法可以有效缩小候选化合物的范围,从而提高实验筛选的效率。分子对接是通过模拟小分子(如药物分子)与蛋白质靶点的结合方式,预测其结合位点和结合模式。在药物发现过程中,虚拟筛选和分子对接常用于缩小化合物库的筛选范围,并预测候选分子的生物活性。

2024-11-06 18:07:39 296 1

原创 使用Conda环境为Jupyter添加内核

在Jupyter Notebook中添加新的内核可以让你在不同的Python环境(如不同的Conda环境或virtualenv环境)中运行代码。

2024-11-03 14:19:39 620

原创 RDKit|特征提取与机器学习模型的构建

在化学信息学和药物设计中,特征提取和机器学习模型的构建是预测分子性质、筛选活性化合物、以及优化化学结构的关键步骤。在药物设计中,机器学习模型可以用于预测候选分子的药效、毒性或其他性质,从而筛选出具有潜力的化合物。在提取特征后,可以使用这些特征构建机器学习模型,以预测分子性质、活性或其他感兴趣的指标。Scikit-learn 是一个流行的机器学习库,提供了多种回归和分类算法,可以与 RDKit 提取的特征结合使用。拓扑指数是用于描述分子结构的拓扑性质的数值指标,常用于反映分子的形状、大小和复杂性。

2024-10-30 19:38:18 516

原创 RDKit|分子数据的聚类分析

分子数据的聚类分析是化学信息学中的重要工具,能够帮助研究人员对大规模分子库进行结构分组、识别多样性、选择代表性化合物并优化先导化合物。结合 RDKit 的分子特征提取工具和 Scikit-learn 的聚类算法,研究人员可以高效地对分子数据进行聚类分析,在药物设计、材料科学和化学研究中发挥关键作用。聚类分析可以帮助研究人员识别分子库中的结构相似性,进行分子多样性分析,并筛选出具有代表性的化合物。通过聚类分析,可以在分子库中寻找与先导化合物相似的分子,帮助优化先导化合物的结构。

2024-10-30 19:31:31 255

原创 RDKit|化学信息学基础操作——子结构搜索与匹配

本节介绍了 RDKit 中子结构搜索与匹配的基本原理和高级应用,包括如何定义子结构、执行匹配、获取匹配的位置信息,以及在实际化学和药物设计中的应用。在子结构搜索中,我们通常定义一个子结构模板(例如一个分子片段),然后在数据库中的分子上搜索是否存在与该模板匹配的部分。RDKit 支持更复杂的子结构匹配,包括环结构的匹配、官能团的搜索、以及SMARTS模式中的逻辑运算和原子属性限定。在实际应用中,子结构搜索可以用于化合物库的筛选、药物分子设计中的先导化合物识别、以及化学反应中的反应物或产物的识别。

2024-10-18 09:02:45 354

原创 RDKit|分子可视化,定制你的分子图

在化学信息学和分子设计中,能够以定制化的方式展示分子结构图对于科学研究和数据呈现至关重要。RDKit 提供了多种方法来调整分子图的样式和标签,使得用户可以根据具体需求对分子图进行美化和标注。本节将介绍如何使用 RDKit 自定义分子图的外观,包括修改原子和键的样式、添加注释、调整颜色以及设置其他视觉元素。1 自定义原子和键的颜色通过自定义原子和键的颜色,可以突出显示分子中特定的结构特征或化学性质,这在分析分子结构或展示关键化学基团时特别有用。1.1 自定义原子颜色可以通过。

2024-09-21 23:59:08 513

原创 什么时候用render_template,什么时候用Ajax?

选择使用还是Ajax主要取决于你的应用需求和用户体验目标。如果你的应用需要用户频繁地在不同页面之间跳转,或者页面内容需要完全重新加载,那么使用可能更合适。而如果你的应用需要实现更丰富的交互效果,或者需要在不重新加载页面的情况下更新页面内容,那么Ajax可能是一个更好的选择。在实际开发中,这两种方法经常结合使用,以提供最佳的用户体验。

2024-08-22 22:59:44 539

原创 RDKit在数据科学中的应用|药物筛选中的数据清理与标准化

在化学信息学和药物研发的过程中,分子数据的质量至关重要。数据清理与标准化是确保分子库数据一致性、可靠性和可比较性的关键步骤。RDKit 提供了丰富的工具,帮助用户清理和标准化分子数据,从而提高下游分析和建模的准确性。

2024-08-19 22:48:05 172

原创 Python进阶之3D图形

3D图形能够提供额外的维度和视角,帮助更全面地理解数据。在Python中,Matplotlib和Plotly提供了丰富的工具来创建和展示3D图形。希望本文的示例和技巧能够帮助你在数据可视化中更好地利用3D图形。如果你有更多的3D图形需求或问题,欢迎在评论区交流和讨论!试着使用上述方法创建自己的3D图形,并分享你的成果和心得。你也可以尝试将不同的3D图形结合起来,探索它们在数据分析中的应用。完成后,欢迎在评论区留言,我们可以一起讨论如何进一步优化和改进!

2024-08-15 20:51:06 993

原创 RDKit|分子基本信息的提取(原子、键、环、芳香性等)

本节详细介绍了如何使用 RDKit 提取分子的基本信息,包括原子、键、环和芳香性等。RDKit 提供了丰富的工具,用于从分子对象中提取原子、键、环、芳香性等各种信息。芳香性是分子的一种特殊性质,具有芳香性的分子通常具有稳定的电子结构。在 RDKit 中,可以轻松提取分子中的原子信息,如原子数量、原子类型、原子序号等。在 RDKit 中,可以提取分子中的键信息,如键的数量、类型、键的键级等。可以遍历分子中的每个键,提取其类型(单键、双键等)和键级(1、2、3)。方法获取分子中的环信息,并计算环的数量。

2024-08-15 17:43:41 339

原创 RDKit|分子输入输出格式解析(如 SMILES、Mol、SDF)

本节介绍了 RDKit 中常用的分子输入输出格式及其解析方法,包括 SMILES、Mol 文件和 SDF 文件的创建与操作。通过这些示例,你可以掌握如何在 RDKit 中处理不同格式的分子数据,为化学信息学的进一步研究和应用奠定坚实基础。在化学信息学中,分子的表示方式有很多种,常见的包括 SMILES、Mol 文件、SDF 文件等。SMILES 用字符串来描述分子的结构,能够简单、直观地表示分子信息。RDKit 提供了读取 Mol 文件的功能,可以轻松将文件中的分子结构读取为 RDKit 的分子对象。

2024-08-15 17:40:56 628

原创 墙推!斯坦福大学中文版的机器学习速查表!

斯坦福大学的机器学习课程近日在GitHub上发布了一系列中文版的机器学习速查表,这些速查表涵盖了监督学习、无监督学习、深度学习等多个主题,为学习者提供了一站式的学习资源。这些速查表的发布,无疑为广大机器学习学习者提供了极大的便利。无论你是初学者,还是已经有一定基础的学习者,都可以从这些速查表中找到适合自己的学习资料。

2024-08-14 18:53:41 151

原创 Python 绘图进阶之词云图:文本数据的可视化艺术

词云图的形状是可以自定义的,我们可以通过使用掩模(mask)图像来创建不同形状的词云图。

2024-08-14 11:29:10 1713

原创 Python 绘图进阶之小提琴图:探索数据分布与多样性

在数据分析和可视化中,了解数据的分布是至关重要的。除了常用的箱线图外,小提琴图(Violin Plot)提供了一种更具信息量的可视化方法,它结合了箱线图和核密度估计图的优点,能够展示数据分布的形状、集中趋势以及数据的多样性。本文将带你深入探索如何使用 Python 绘制小提琴图,并通过实例理解它在数据分析中的独特价值。

2024-08-13 14:00:00 2493

原创 Python 绘图进阶之核密度估计图:掌握数据分布的秘密

通过调整带宽和选择不同的核函数,可以控制 KDE 图的平滑程度和形状。

2024-08-13 09:44:20 1105

原创 Python 绘图进阶之箱线图:揭示数据的分布和异常值

箱线图是数据分析中强大的工具,能够帮助我们快速理解数据的分布特征和识别异常值。在 Python 中,使用 Matplotlib 和 Seaborn 绘制箱线图非常简单,且可以通过多种方式进行定制。通过本文的介绍,你现在应该能够熟练地创建和定制箱线图,以更好地呈现和解释你的数据。箱线图不仅仅是简单的图表,它为数据科学家提供了深入理解数据的重要工具。在数据分析项目中,掌握并应用箱线图,将使你的分析工作更加全面和准确。如果你有数据集,并希望更深入地分析数据分布,欢迎在评论区分享你的数据和问题。

2024-08-12 19:40:39 1375

原创 Python 数据可视化,怎么选出合适数据的图表

掌握数据可视化的最佳实践有助于创建既美观又有效的图表。通过选择合适的图表类型,遵循简洁明了的设计原则,并避免常见错误,你可以显著提高数据可视化的质量。希望本文提供的建议和示例能帮助你在数据可视化的过程中做出更好的决策,提升图表的表现力和清晰度。如果你对数据可视化有更多的兴趣,欢迎持续关注我们的 Python 绘图专栏。1. 使用Matplotlib绘制柱状图2. 使用 Matplotlib 绘制折线图3. Python 绘图入门4. Python绘图入门:使用Matplotlib绘制饼状图。

2024-08-12 16:17:21 1038

原创 Python 绘图入门:使用Matplotlib绘制气泡图

通过适当的设计和优化,气泡图不仅能够有效传达复杂的信息,还能让数据分析的结果更加直观和生动。在实际应用中,我们可以结合具体的业务场景,利用气泡图来展示和分析数据,从而做出更好的决策。气泡图是散点图的一种扩展,通过气泡的大小来表示第三个维度的数据。每个气泡的 x 轴和 y 轴位置表示两个维度的数据,气泡的大小则表示第三个维度。我们可以使用气泡图来可视化这些数据,分析产品的表现。绘制气泡图时,除了基本的 x、y 轴和气泡大小之外,还可以通过调整颜色、标签和注释等,使图表更加美观和信息丰富。可以通过调整透明度(

2024-08-12 14:22:27 1265

原创 RDKit|广义子结构搜索

在这篇文章中,我将展示如何将所有这些结合起来使用 RDKit 进行“广义子结构搜索”。在文章的底部,有几个 Python 函数可以在其他脚本中使用,以使这个过程更容易。我还将尝试找出一种将其纳入未来 RDKit 版本的好方法。3. 链接节点 + 变量附件 + 互变异构体枚举查询。3. 链接节点 + 变量附件 + 互变异构体枚举查询。1. 导入相应包和数据。1. 导入相应包和数据。2. 定义查询目标。

2024-08-12 10:42:04 129

原创 RDKit的基本数据结构:分子对象

RDKit 是一个强大的化学信息学库,其中的核心数据结构是分子对象。分子对象在 RDKit 中用于表示化学分子结构,是所有分子操作和分析的基础。下面我们将详细介绍分子对象的创建、操作和应用。

2024-08-11 16:41:23 159

原创 Python绘图入门:使用Matplotlib绘制热力图

热力图的自定义选项非常丰富,你可以调整颜色映射表、添加刻度标签、以及设置插值方式等。# 自定义颜色映射表和插值方式# 添加刻度标签# 添加颜色条plt.colorbar(label='分数')# 添加标题plt.title('学生考试成绩热力图')# 显示图表plt.show()在这个示例中,我们使用了来指定颜色映射表,并通过设置了插值方式,使得图像过渡更加平滑。此外,和函数用于添加刻度标签,使得图表更加清晰和易读。

2024-08-11 14:40:38 2822

原创 Python绘图入门:使用Matplotlib绘制雷达图

雷达图的自定义功能非常强大。我们可以调整颜色、线条样式、填充透明度等,以更好地展示数据。# 绘制雷达图# 设置标签# 设置雷达图的圆形网格# 显示图表plt.title('择偶标准雷达图')plt.show()在这个示例中,我们自定义了雷达图的颜色、线条样式和填充透明度,还调整了标签的字体颜色和大小。通过这样的调整,你可以让图表更符合你的需求或审美标准。通过这篇博客,你已经学习了如何使用Matplotlib绘制雷达图,并对其进行自定义。

2024-08-11 09:46:50 1669

原创 Python绘图入门:使用Matplotlib绘制饼状图

为了让饼状图更加美观和信息丰富,我们可以对图表进行一些自定义。例如,添加阴影、突出显示某个部分、改变颜色等。# 数据explode = (0.1, 0, 0, 0, 0) # 突出显示第一个部分# 自定义饼状图# 绘制饼图plt.pie(x = edu, # 绘图数据labels=labels, # 添加教育水平标签autopct='%.1f%%', # 设置百分比的格式,这里保留一位小数startangle=140,#起始角度从140开始逆时针转# 添加图标题。

2024-08-10 21:18:56 1439

原创 Python绘图入门:使用Matplotlib绘制柱状图

为了让图表更加美观和信息丰富,我们可以对柱状图进行自定义。例如,可以改变柱子的颜色、添加网格、显示数值标签等。# 自定义颜色和网格# 显示数值标签plt.show()在这个例子中,我们将柱子颜色设为浅蓝色,并在y轴方向添加虚线网格。同时,使用plt.text()函数在每个柱子上方显示具体数值。这里需要注意的是,添加无指向型注释文本有两种,text()和figtext()方法。x, y:表示注释文本的位置。s:表示注释文本的内容。

2024-08-10 15:43:58 1532

原创 Python绘图入门:使用 Matplotlib 绘制折线图

为了让图表更具可读性和美观性,我们可以对图表进行一些自定义设置,比如改变线条的颜色、样式以及添加数据点标记。

2024-08-09 17:18:33 1217

原创 Python 绘图入门

ggplot是基于matplotlib并旨在以简单方式提高matplotlib可视化感染力的库,它采用叠加图层的形式绘制图形,例如先绘制坐标轴所在的图层,再绘制点所在的图层,最后绘制线所在的图层,但其并不适用于个性化定制图形。seaborn是基于matplotlib进行高级封装的可视化库,它支持交互式界面,使得绘制图表的功能变得愈加容易,且图表的色彩更具吸引力,可以画出丰富多样的统计图表。的过程,它可以简单地理解为将一个不易描述的事物形成一个可感知画面的过程,也就是从数据空间到图形空间的。

2024-08-08 18:59:15 926 1

原创 文本领域分类中的词嵌入方法-BOW

接下来以第一句话" I love cats."为例,该句话中词典中的单词分别为"I", "love", "cats",所以我们可以用一个向量表示这句话为[1, 1, 1, 0, 0, 0, 0, 0],向量的每个维度对应词典中的一个单词,如果该维度对应的单词在句子中出现,则值为1,否则为0。在这个例子中,词典可能包含的单词有:I, love, cats, dogs, too, and, are, cute. 接下来,我们将每个句子转换为一个向量,向量的长度等于词典中单词的数量。

2023-07-22 19:22:56 185

原创 数据科学中使用的17 种相似性和相异性度量之欧氏距离

在数据科学中,相似性度量是一种衡量数据样本如何相互关联或相互接近的方法。另一方面,相异性度量是告诉数据对象有多少是不同的。此外,当相似的数据样本被分组到一个集群中时,这些术语通常用于聚类。所有其他数据样本被分组到不同的样本中。它还用于分类(例如 KNN),其中根据特征的相似性标记数据对象。另一个例子是当我们谈论与其他数据样本相比不同的异常值时(例如,异常检测)。相似性度量通常表示为一个数值:当数据样本越相似时它就越高。它通常通过转换表示为零和一之间的数字:零表示相似度低(数据对象不相似)。

2023-05-14 21:38:24 776

原创 一种新的、更好的生成相识度图的方法

本文会比较用经典的方法和新的方法分别得到的相似度图,看看两者的区别。这里使用阿托伐他汀(立普妥)和罗苏伐他汀(Crestor)这两种药物的摩根指纹为例。

2022-09-27 10:08:12 389

原创 Open Babel下载安装

OpenBabel是一个促进化学数据从一种格式到另一种格式的相互转换的项目——包括各种类型的文件格式。简而言之,OpenBabel是Babel化学文件翻译程序的免费开源版本。OpenBabel是一个旨在从Babel中断的地方接手的项目,它是一个跨平台程序和库,旨在在分子建模、计算化学和许多相关领域中使用的许多文件格式之间进行相互转换。OpenBabel包括两个组件,一个命令行实用程序和一个C++库。...

2022-07-18 23:35:13 5065

原创 MIT博士论文《用于临床实验和精准医学的机器学习》

标题:Machine learning for clinical trials and precision medicine创作者/贡献者:Author/CreatorLiu, Ruishan, author.ContributorZou, James, degree supervisor.Soh, H. Tom, degree committee member.Tse, David, degree committee member.Stanford University. Department

2022-07-09 17:56:18 783

原创 RDKit|突出分子差异

目录1. 导入相关包2. 两种高亮方式方法一:通过子结构匹配进行高亮方法二:直接高亮指定的原子编号3. 高亮分子的不同子结构 如果出现导入失败,请先安装RDKit,'pip install RdKit’即可。输出:图1 高亮分子子结构图根据方法一打印出来的原子编号,在方法二中使用该原子编号。​​​​​​​图2 方法二高亮分子子结构图图1和图2,标记出的分子子结构是一样的,可想而知,两种方法都能够达到同样的效果。但是方法一更简单直观。定义两种分子并可视化:​​​​​​​图3

2022-07-09 16:30:59 839

原创 RDKit|广义子结构搜索

在这篇文章中,我将展示如何将所有这些结合起来使用 RDKit 进行“广义子结构搜索”。在文章的底部,有几个 Python 函数可以在其他脚本中使用,以使这个过程更容易。我还将尝试找出一种将其纳入未来 RDKit 版本的好方法。举个例子,这里有一个查询:这里有四个使用该查询返回的 ChEMBL 分子:目录:1. 导入相应包和数据2. 定义查询目标3. 链接节点 + 变量附件 + 互变异构体枚举查询示例:加载数据:​​​​​​​2. 定义查询目标​​​​​​​

2022-07-08 09:55:13 606

原创 RDKit分子的3D结构

RDKit MCS代码的功能之一是在生成MCS时将原子坐标考虑在内,这一点可能不太为人所知。这里的想法是找到一组3D分子之间的MCS,其中考虑了潜在匹配原子之间的距离。2、读取小分子的SDF格式并可视化获取更多关于“RDKit”知识,请关注AIDD Learning,微信公众号同名。AIDD learning 便捷查看...

2022-07-07 08:00:00 699

原创 RDKit新手入门

RDKit介绍、安装、简单可视化和相似性搜索

2022-07-06 18:04:54 2397

原创 Win10无线网络图标不见了,看这一条就行。

Win10无线网络图标不见了怎么办?我把网上所有的方法都试了一遍,还是没有用!这个时候该怎么办? 在“设置”—“恢复”—“立即重新启动”,这个时候电脑会立即启动。启动的时候会有两个选项,“保留我的文件”OR“删除所有内容”,这个时候要选择“保留我的文件”,这样的话大部分应用不会消失掉。 电脑重新启动之后,WIFI标识就出现啦,这时候就能正常联网啦! 电脑开启后,有个不良反应就是,Office的那些软件不见了,这个时候你只要重装就好啦。本教程建议你在使用其它教程无果时使用。...

2022-07-06 11:43:02 3032 1

原创 MIT博士论文《用于药物发现的分子图表示学习和生成》

探索了一种用于分子表示的变压器式架构,远离传统的图神经网络范式,提供了将这些模型应用于图形结构对象的新工具。

2022-06-29 15:18:06 709

原创 机器学习——回归

2021-07-15 09:37:09 128

原创 机器学习技术介绍

2021-07-12 22:35:51 1326

python少儿编程PPT

python少儿编程PPT

2024-10-30

PPT 清新文艺森系叶子PPT模板2

清新文艺森系叶子PPT模板2

2020-12-17

基于MATLAB插值算法仿真的犯罪率研究.pdf

基于MATLAB插值算法仿真的犯罪率研究,有关于插值算法方面的研究资料。

2019-09-04

国赛论文资料.txt

13年国赛优秀论文赏析,用于数学建模后期,观摩优秀论文,以便比赛时借鉴。

2019-09-04

数学建模的论文

数学建模的论文。校内停车问题、BP神经网络等论文

2019-06-17

CentOS-6.5-i386-bin-DVD1.iso

这个是Linux系统,CentOS-6.5-i386-bin-DVD1.iso。 这个是Linux系统,CentOS-6.5-i386-bin-DVD1.iso。 这个是Linux系统,CentOS-6.5-i386-bin-DVD1.iso。

2019-06-17

清华数模讲义(姜启源)PPT

清华数模讲义(姜启源)PPT,我这里还有其它的一些关于数模和统计的一些资源,有需要的可以找我。

2018-08-11

sql developer 64 位(PLSQL Developer 12.exe)

欢迎大家下载(PLSQL Developer 12.exe)

2017-10-18

数学建模国赛论文

数学建模国赛论文

2017-08-18

数学建模模型与算法

数学建模各类算法以及模型

2017-08-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除