- 博客(60)
- 收藏
- 关注
原创 Tavily Search: 大模型联网搜索智能体
是一款针对大型语言模型(LLM)和智能体(Agent)设计的智能搜索引擎,通过实时数据检索和检索增强生成(RAG)技术,为 AI 应用提供精准、高效的信息支持。其核心功能包括:单次 API 调用聚合多源数据(支持 20+ 权威来源)、定制化搜索(如领域限制、时间范围筛选)、结构化结果输出(含引用溯源),并深度集成 LangChain 等框架,适用于实时数据增强、企业研究、内容生成等场景。
2025-04-01 13:34:24
1016
原创 基于Amber的“小分子-蛋白”复合体MMPBSA计算
当进行完小分子和蛋白复合物体系的分子动力学模拟后,为了深入了解分子间的相互作用和结合能,我们需要继续开展分子力学泊松-玻尔兹曼表面积(MMPBSA)分析。MMPBSA是一种广泛应用的计算方法,可以帮助我们评估配体与受体之间的结合自由能。以下将详细介绍如何对小分子和蛋白复合物进行MMPBSA计算,包括具体的操作步骤和所需的参数设置。
2025-03-21 15:28:27
381
原创 Amber续跑
在初始阶段,我们已经完成了20纳秒的分子动力学模拟,并成功生成了complex_ions_md.nc轨迹文件。通过对轨迹文件进行均方根偏差(RMSD)分析,发现体系尚未达到完全的平衡态。为了确保模拟结果的可靠性和体系的充分采样,我们决定继续延长模拟时间80纳秒,以达到总计100纳秒的模拟时长。这个延长的模拟时间将有助于我们获得更加稳定和可靠的构象采样。
2025-03-20 16:02:37
238
原创 Amber分子动力学作图Frame与Time换算
经过Amber模拟后,再使用CPPTRAJ软件处理坐标轨迹和数据文件并作图后,得到的结果。但我们为了更直观地展示数据,需要将横坐标轴从frame转换为time。
2025-03-17 16:57:34
1007
原创 基于Open Babel将SDF转为MOL2格式
SDF转为MOL2的格式转化步骤很简单,但是需要安装Openbabel软件,因为常用Python,索性Openbabel也支持Python,因此通过conda安装。总共包含了两个 Python 模块和,可用于访问工具包的功能。
2025-02-17 17:11:58
650
原创 ImportError: /lib64/libstdc++.so.6: version `CXXABI_1.3.9‘ not found when loading Pandas
我们可以看到CXXABI_1.3.9是存在的,但是程序运行时找不到,只需要将该路径加入环境变量$LD_LIBRARY_PATH即可。查看/libstdc++.so.6: version `CXXABI_1.3.9’是否存在?
2025-02-08 15:50:11
398
原创 大模型可调用的在线搜索工具
在线搜索工具通过集成大模型(LLMs)和检索增强生成(RAG)技术,使得用户在查询信息时不仅能获检索由大模型本身和外部知识库所包含的知识,还能体通过调用在线搜索工具获取互联网检索信息,最终由大模型整合多方知识智能生成的丰富、相关的内容,从而极大地提升了搜索效率和用户体验。以下是13款主流的搜索工具,包含4款免费软件、部分免费软件和主流的商业软件。
2025-01-06 11:20:56
1033
2
原创 Conda更新报错:ProxyError: Conda cannot proceed due to an error in your proxy configuration.
看报错是信息是代理的问题,上网查了一通,都不管用(尽管都写这【已解决】😂😂😂😂)emmm,在英文网站上找到了下面的方法,亲测有效。页面中,关掉代理服务器。
2024-10-18 15:12:47
1462
2
原创 ModelScope1.15下载模型时报错
在ModelScope下载Meta-Llama-3-8B-Instruct模型时报错:1.15版本存在问题 #894。参考github的issue,应该当前版本modelscope 1.15有bug,降级为1.14后,可正常下载模型。
2024-07-04 10:47:20
3049
1
原创 RAG:本地部署Langchain-Ollma(Windows)
RAG,即“Retrieval Augmented Generation”(检索增强生成),是一种结合了检索和生成技术的自然语言处理模型。它主要用于文本生成任务,能够利用外部知识源来增强生成的文本,从而提高生成质量。相较于微调技术,RAG能够更加短平快的吸纳本地知识并整合大模型进行问答。因此本地部署了一个基于Langchain🦜🔗 + Ollma🐫的RAG应用,以检索本地知识库生成回答。
2024-07-01 14:45:26
2318
1
原创 Jupyter无法导入库,但能在终端导入的问题
激活某个Conda的环境后,尽管已经通过conda或者pip在这个环境中安装了一些🐍Python的库,但无法在Jupyter中导入,却能在终端成功导入。
2024-07-01 10:46:56
957
原创 解决Unsloth遇到NotImplementedError: No operator found for memory_efficient_attention_forward with inputs
【代码】解决Unsloth遇到NotImplementedError: No operator found for memory_efficient_attention_forward with inputs。
2024-06-25 16:52:46
3655
原创 解决“TypeError: prepare_inputs_for_inference() got an unexpected keyword argument ‘cache_position‘”问题
Nougat安装成功之后,没有报错,但在使用的时候报出:TypeError: prepare_inputs_for_inference() got an unexpected keyword argument 'cache_position’的问题。
2024-06-13 17:23:18
1260
原创 解决conda中“requests.exceptions.HTTPError: 404 Client Error”问题
最简单粗暴的方式就是删除原来乱七八糟的channels,恢复出厂默认设置。再次使用conda时运行成功。出现该错误的原因是因为。
2024-06-12 13:46:41
1649
1
原创 基于python的PDF文件解析器汇总
大多数已发表的科学文献目前以 PDF 格式存在,这是一种轻量级、普遍的文件格式,能够保持一致的文本布局和格式。对于人类读者而言, PDF格式的文件内容展示整洁且一致的布局有助于阅读,可以很容易地浏览一篇论文并识别标题和图表。但是对于计算机而言,PDF 格式是一个非常嘈杂的 ASCII 文件,并不包含任何结构化文本的信息。因此,我们期望从这些已经发表的PDF格式科学文献中重新提取文字、图片、表格、注释、目录等数据来构建格式化的信息用于机器学习。
2024-06-11 15:11:20
3341
1
原创 pandas读CSV错误:ParserError: Error tokenizing data. C error: Expected 2 fields in line **
用pandas读取CSV文件时报错,因为读取的是CSV文件,分隔默认采用的是逗号,该错误的可能原因为读取的数据中某一项包含两个字段,即值内可能包含两个逗号。
2024-06-06 14:51:16
745
原创 Error: listen tcp 127.0.0.1:11434: bind: Only one usage of each socket address
Windows中默认安装Ollama会开机启动。查看该进程运行的软件,发现ollama已经启动。
2024-05-16 16:41:05
35337
原创 FlashAttention(flash-attn)安装
Flash Attention是一种注意力算法,更有效地缩放基于transformer的模型,从而实现更快的训练和推理。由于很多llm模型运行的时候都需要安装flash_attn,比如Llama3,趟了不少坑,最后建议按照已有环境中Python、PyTorch和CUDA的版本精确下载特定的whl文件安装是最佳方式。
2024-05-08 15:24:21
34686
10
原创 深度学习在药物研发方面的进展
深度学习算法已被应用于药物发现和开发,为药物科学的计算决策打开了一扇新的大门。基于药物研发的深度学习模型的成功得益于深度学习算法在计算机视觉(Computer Vision, CV)和自然语言处理(Natural Language Processing, NLP)等领域的快速发展、高性能算力的进步以及生物医药数据库中信息的爆炸式增长。
2024-02-01 16:47:46
1797
1
原创 AlphaFold2预测结构能否直接用于虚拟筛选?
虽然AlphaFold2能够预测出较为精确的蛋白骨架结构,但将其直接作为蛋白受体结构进行分子对接结果并不十分理想。但是,通过去除AlphaFold2预测结构中的低置信区域或使用柔性对接方法针对关键侧链添加柔性等,有助于改善对接结果。AlphaFold2预测结构相较于 apo 结构做对接更准确。
2024-01-18 16:40:34
1524
原创 AlphaFold更新了!AlphaFold-latest
🔈:号外号外!联合在2023年10月31日发布了新一代的AlphaFold(显着提高了准确性和覆盖范围,主要包括了抗体结合结构预测、蛋白质-核酸复合物结构预测、小分子-蛋白结构预测和蛋白质残基的修饰结构预测等方面的重大更新,为加速生物医药研究开辟了全新的可能性。
2023-11-02 10:48:41
417
1
原创 AlphaFold-multimer 复合物结构预测
是DeepMind开发的AlphaFold项目的一个扩展,旨在预测蛋白质多聚体的三维结构。蛋白质多聚体是由多个蛋白质亚单位相互组装而成的结构,如酶、膜蛋白复合物和病毒颗粒。理解多聚体的结构对于揭示蛋白质的功能和相互作用非常重要。
2023-10-17 16:54:52
3108
2
原创 共价对接(Covalent Docking)
共价对接的关键思想是模拟潜在药物分子与蛋白质目标之间的共价键形成,通过计算得出最有可能形成共价结合的分子构象。这通常涉及到特定的功能基团,如亲核基团(Nucleophiles)和电子亲合基团(Electrophiles),它们能够参与共价键的形成。共价对接方法需要考虑这些功能基团的相互作用,并通过优化分子构象来实现共价键的形成。共价对接的应用领域包括药物发现和生物活性分子的设计。它可以用于研究一些药物的作用机制,开发具有共价作用的药物,或者设计特定的生物活性分子。
2023-10-16 16:54:47
3301
1
原创 RDKit计算分子属性
分子属性的计算在化学、药物研发和生物信息学等领域中具有重要意义。这些属性包括分子的物理化学性质、生物活性、构象信息和其他关键特征,它们对于药物筛选、分子设计、毒理学评估以及生物分子研究等任务至关重要。RDKit,作为一款强大的开源工具包,被广泛应用于计算和分析分子属性。本文将探讨如何使用RDKit来计算和分析分子属性。
2023-10-16 14:50:39
1214
原创 机器学习的打分方程汇总
受到(Machine Learning)和(Deep Learning)等算法模型的创新性冲击,其应用范围涵盖了自然语言处理(Natural Language Processing)、自动驾驶(Autopilot)、金融分析(Financial analysis)和(Biopharmaceutical R&D)等多个领域。其中,应用深度学习算法在预测小分子药物与疾病靶点蛋白之间的结合亲和力方面的设计和应用变得日益重要。
2023-10-16 14:26:28
511
原创 诺贝尔奖(Nobel Prize)2023——生理/医学奖
2023年10月2日颁布了诺贝尔生理学/医学奖(Nobel Prize in Physiology or Medicine),Katalin Karikó(卡塔琳·考里科)和Drew Weissman(德鲁·韦斯曼)获得了该奖项,以表彰他们在核苷碱基修饰方面的发现,这些发现使得开发针对 COVID-19 的有效 mRNA 疫苗成为可能。
2023-10-08 15:34:30
798
原创 诺贝尔奖那些事儿
1901 年至 2023 年间,诺贝尔奖和经济学奖共颁发了 621次,共有 999 名个人和组织获得。诺贝尔奖是由瑞典斯德哥尔摩诺贝尔基金会管理的国际奖项,以瑞典发明家和企业家阿尔弗雷德·诺贝尔的财富为基础。1968年,瑞典央行设立了瑞典央行经济科学奖,以纪念诺贝尔奖创始人阿尔弗雷德·诺贝尔。每个奖项包括一枚奖牌、一张个人证书和一份现金奖励。
2023-10-07 16:53:15
211
原创 拉斯克奖(Lasker Award)2023
Lasker-DeBakey Clinical Medical Research Award(Lasker Award)是美国著名的医学科学奖项之一,也是世界上最重要的医学奖项之一,以表彰对临床医学研究做出杰出贡献的科学家和医学专家。
2023-09-22 11:32:03
488
原创 分子对接软件简介-2023
分子对接(Molecular Docking)是分子模拟的重要方法之一,其本质是两个或多个分子之间的识别过程,其过程涉及分子之间的空间匹配和能量匹配。这项技术在药物研发、生物医学研究和药物设计中具有广泛的应用,可以帮助科学家理解分子如何相互作用,从而更好地设计和优化药物分子,以提高药物的疗效和选择性。
2023-09-18 17:01:18
7093
1
原创 AutoDock Vina多配体对接 (Simultaneous Multiple Ligand Docking)
多配体分子对接(Simultaneous Multiple Ligand Docking, SMLD)或(Multiple Ligand Simultaneous Docking, MLSD)是一种分子对接技术,用于将多个配体(小分子药物候选物)同时对接到一个蛋白质分子的结合位点。与传统的分子对接技术不同,传统方法通常只考虑一个配体与一个蛋白质的相互作用。SMLD的目标是更高效地研究多个配体如何与同一个蛋白质相互作用,以寻找潜在的药物候选物。
2023-09-06 14:44:01
4447
10
原创 AutoDock Vina 对接计算(大批量)
AutoDock Vina是一种用于计算生物分子之间相互作用的计算工具,主要用于蛋白质和小分子(通常是潜在药物分子)之间的对接研究。它可以用于虚拟筛选、药物设计和生物分子结合位点的预测等多个应用领域。
2023-09-05 10:24:41
9930
21
原创 拆分PDBQT文件并将其转换为PDB格式
假设你用AutoDock Vina做了对接,那么所有预测的结合构象都被放入一个多构象 PDBQT 文件中,如果需要拆分后进行可视化分析,那么Vina官方自带了vina_split来进行拆分,可以用Open Babel进行格式转换。
2023-08-07 16:15:08
4060
原创 PyMol选择配体周围的氨基酸残基
经常使用做蛋白质和小分子的可视化,可以直接生成用于文章发表的高质量图片,图片生成可参考等教程。但是,用了这么久一直没发现。考虑到目前很多深度学习算法用口袋周围的氨基酸来计算预测亲和力、并在一些场景下我们想聚焦只关注配体周围局部范围内的氨基酸与其相互作用,因此需要在pymol中达到这一功能。在预设的Action中并不存在这种可扩展的选项,但pymol的命令行可以实现这一功能,很简单,只需一行即可。
2023-08-04 15:40:46
7178
1
原创 KEGG信号通路富集分析
当我们手头有转录组测序后的差异分析数据后,想更进一步的去分析这些差异基因在信号通路富集情况,其中一种办法是使用KEGG网站进行信号通路富集分析。
2022-11-16 16:47:54
20875
1. Notebook:在Jupyter-lab中使用RDKit画分子2D图 2. 4个该教程所需的SDF格式的分子文件
2024-03-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人