- 博客(1190)
- 资源 (10)
- 收藏
- 关注
原创 如何批量下载Pubmed 几千篇文章呢 ,以肺癌诊断/治疗为例子 . Python 自动化脚本 Zotero + 插件 NoteExpress EndNote
针对肺癌诊断和治疗的综述批处理下载,核心流程与前列腺癌类似,但需调整和以精准定位目标文献。
2025-11-24 00:28:12
697
原创 GoOA平台的具体信息以及它与PubMed的重合度数据,医学论文期刊下载和查询
它只收录采用OA模式的期刊和论文,与PubMed(混合收录OA和非OA期刊)形成定位差异。GoOA(中国科学院开放获取平台)的使命就是系统发现、整理和保存全球优质的。:GoOA的医学类OA期刊(数量最多)中,大部分应被PubMed收录。若您关注特定学科或期刊,建议直接进行个案查询。在线获取学术文献的出版模式。,是近年来推动知识共享的重要出版改革运动。基于平台特性和搜索结果,两者交集主要集中在。在学术出版领域,OA指。
2025-11-23 16:56:52
231
原创 aigc 从2d 到 3d的形式转变,李飞飞在介绍WorldLabs的Marble平台,会围绕“空间智能“的核心理念,自动驾驶就是2d形式
核心定位:从"语言智能"到"空间智能"的范式跃迁李飞飞往往会开门见山地强调Marble的历史意义——这是世界模型首次以"可用产品"形式出现在公众面前,标志着空间智能时代的正式开场。她多次引用自己在长文《从语言到世界:空间智能是AI的下一个前沿》中的核心观点:“空间智能是所有认知能力的脚手架”。在她看来,Marble不仅是让3D创作更方便的工具,更是实现真正空间智能的第一步,未来可能帮助机器人理解现实环境、在科学研究中做虚拟实验预测结果。技术能力:三大核心突破多模态生成。
2025-11-23 15:18:56
679
原创 igma不仅能制作PPT,而且凭借其强大的设计功能,非常适合打造视觉效果出众的演示文稿
Figma不仅能做PPT,而且凭借其设计基因和Figma Slides功能,在制作"酷炫"视觉效果方面比传统工具更具优势,尤其适合追求高品质设计和交互体验的场景。Figma不仅能制作PPT,而且凭借其强大的设计功能,非常适合打造视觉效果出众的演示文稿。Figma已推出专门的演示文稿工具。
2025-11-23 15:12:02
189
原创 南非的医疗水平和现状、挑战 在非洲大陆处于领先地位,拥有世界一流的私立医疗体系,但公共医疗系统面临严峻挑战,整体可及性和公平性存在显著问题
南非政府正在推进**国家健康保险(NHI)**改革,试图建立全民医保制度,通过征收医保税统一支付公私医院费用。同时,政府承诺未来五年将医疗投入增加50%,并推动医疗数字化转型。的特征:在非洲大陆处于领先地位,拥有世界一流的私立医疗体系,但公共医疗系统面临严峻挑战,整体可及性和公平性存在显著问题。私立医疗代表非洲顶尖水平,但公共医疗的困境导致大多数国民无法享受高质量服务。这种分化导致资源分配极度不均:约49.7%的医院和69%的病床属于公立系统,却需服务近85%的人口。南非的医疗水平呈现出。
2025-11-21 02:13:03
857
原创 采用Bootstrap法 还需要 分训练集和测试集吗 还是说 重复抽样 后 再分训练集和测试集
首先,基于全部数据构建多因素Logistic回归模型,随后通过Bootstrap验证计算模型性能指标(如AUC)的优化校正值,并据此绘制校正后的校准曲线。在训练集内部,采用Bootstrap法(1000次重复抽样)进行内部验证,以评估模型性能的稳定性和乐观度,并对模型进行校正。所以,对于您文中的描述,存在一个逻辑上的小矛盾:您既用了预留验证集法,又提到了Bootstrap法。通常,二者择一即可。• 测试: 用构建好的模型在从未接触过的测试集上进行一次性的性能评估(计算AUC、绘制校准曲线等)。
2025-11-18 22:11:56
452
原创 stata 能同时打开 两个 csv吗或者excel 面板数据吗 会相互干扰怎么办
Stata 允许在内存中同时保留多个数据集(通过“数据集名称”区分),导入时为每个 CSV 指定不同的名称即可。如果需要对两个 CSV 的数据进行关联分析(如合并、匹配),可以先分别导入,再通过。通过以上方法,即可实现同时“打开”并处理多个 CSV 文件。
2025-11-18 18:08:20
364
原创 医学生统计软件选择指南 推荐(2025版) 医学方面的数据分析的软件推荐
描述性统计、t检验、卡方检验、单因素方差分析等常规统计。:比SPSS灵活,比R易学,是医学研究的"黄金中间选择":菜单式操作,界面直观,输出结果规范,适合论文投稿。:完全免费,结果与SPSS高度一致,支持贝叶斯分析。:FDA认证标准,处理TB级数据稳定,宏编程自动化。:多因素回归、面板数据、生存分析、Meta分析。:免费开源,界面类似SPSS,支持R语法扩展。:预测模型、机器学习、高级可视化、自定义算法。:开源免费,方法更新最快,顶刊认可度高。:命令简洁透明,可重复性强,社区活跃。
2025-11-17 13:35:09
588
原创 什么是思维链与缩放法则scale law 。人工智能的基本概念
它不再仅仅依赖于增加模型的“静态”规模(参数和数据),而是在模型完成训练后,通过控制其在推理过程中的“思考”量(如思维链的长度或并行思考的路径数量)来动态地提升其能力。“思维链缩放法”是当前AI领域一个非常前沿且重要的研究方向,其核心思想是通过动态调整模型“思考”的深度和广度,来优化复杂问题的解决能力与计算效率之间的平衡。• 边缘设备部署:像ParScale这样的方法,能以极小的内存开销大幅提升现有模型的性能,这使得将强大AI模型部署到手机、汽车、机器人等资源受限的边缘设备成为可能。
2025-11-15 01:25:44
326
原创 学习文本大模型的学习路径,各种大模型对比和分类以及各个大模型对硬件的要求,开源大模型有哪些
(8B版本)入手,在消费级显卡上实践全流程,再逐步扩展到多模态和新型架构。,而非开发者自主掌控的技术实践。学习大模型微调应聚焦于。,这才是技术布道和工程落地的核心。结论:GPT-4的"微调"更像是。为主流,学习应聚焦于此。:当前(2025年)工业界以。如果您想学习大模型微调,
2025-11-13 00:57:24
1018
原创 新出土的古陶瓷碎片的图片并根据碎口尝试进行拼接用什么模型算法比较合适?古陶瓷碎片拼接算法选型
这个问题切得很准,古陶瓷碎片拼接的核心是,优先选用“深度学习特征提取+图优化匹配”的组合算法方案。
2025-11-12 20:04:12
826
原创 如何签署 韩国的PhysioNet 的 Data Use Agreement(DUA,数据使用协议)并成为认证用户,如何成为VitalDB认证用户,加州大学MOVER 数据集认证用户
一、核心前提:完成 CITI 伦理培训(必须步骤)PhysioNet 要求所有认证用户先通过 “人类受试者保护” 相关培训,核心是完成 CITI Program 的「Data or Specimens Only Research」课程(带 HIPAA 模块),具体步骤:1. 注册 CITI 账号。
2025-11-10 19:14:04
733
4
原创 手术相关公开数据集收集报告
这些数据集涵盖了 2011-2024 年的时间范围,包含了从几百例到几十万例不等的样本量,提供了丰富的术前、术中和术后数据。一项发表在《British Journal of Anaesthesia》的研究纳入了 100 例急诊剖腹手术患者,收集了术前血液免疫参数,包括 C 反应蛋白(CRP)、白细胞介素 - 6(IL-6)、白细胞介素 - 10(IL-10)、干扰素 -γ 诱导蛋白 10 kDa(IP-10)、肿瘤坏死因子 α(TNF-α)和可溶性尿激酶型纤溶酶原激活物受体(suPAR)(60)。
2025-11-10 18:56:46
858
原创 生信工作流框架搭建 | 01-nextflow、snakemake、wdl 对比测试
医疗智能体(eiHealth) 3.4.0 使用指南(for 华为云Stack 8.5.0) 02 是基于nextflow本篇为《生信工作流框架搭建》系列的技术选型分析,基于多来源实测数据与社区反馈,对三大主流框架进行全面对比。
2025-11-07 13:11:22
774
原创 医疗智能体(eiHealth) 3.4.0 使用指南(for 华为云Stack 8.5.0) 0. 华为除了这个 还有医疗 和生信方面的 产品
根据搜索结果,我已找到的官方使用指南及相关信息,同时发现EIHealth本身就是华为在医疗和生信领域的核心产品平台。
2025-11-07 12:48:20
401
原创 DrugGPT chatgpt druggen 之间的关系 ,DrugGPT是基于gpt2基础上开发的
核心结论官方 GPT-4 未开源,其代码、权重、训练细节仍完全保密;市场上的“开源 GPT-4”要么是社区开发的替代模型(功能相似、非同源),要么是 OpenAI 新推出的 GPT-OSS(开源但非 GPT-4)。选择建议若需“完全匹配 GPT-4 性能”:只能通过 OpenAI 官方 API 调用,无开源选项。若需“低成本开源方案”:可选择 ColossalChat、GPT4All 等社区模型,适合研究、本地部署或非商业场景。
2025-11-04 21:11:56
1570
原创 生存分析的七个方法
异基因造血干细胞移植(allo-HSCT)的生存分析是评估移植后患者长期预后(如总生存率、无病生存率、复发率和非复发死亡率)的核心方法。
2025-11-03 17:46:16
352
原创 亲测有效的mem 流行病预测,时间序列预测,r语言做移动流行区间法,MEM流行病阈值设置指南
summer_season <- subset(data_2014_2019, week >= 6 & week <= 46) # 夏季流行季(第6-46周)winter_season <- subset(data_2014_2019, week >= 47 | week <= 6) # 冬季流行季(第47周-次年6周)
2025-11-01 00:15:12
1110
原创 移动流行区间法(MEM)的原理和与LSTM、ARIMA等时间序列方法的区别
其中, P_M 是预测误差滤波器的输出功率, a_m 是模型参数,由已知的自相关函数值决定。◦ 强度阈值(中、高、极高):取每个历史流行季的“流行期”内发病率最高的若干周次的数据,计算其几何平均值的特定百分位数(如40%、90%、97.5%)置信区间上限,分别作为中等、高和极高流行强度的阈值。在MEM的语境下,可以理解为:在已知历史流行季的基线数据(约束条件)下,我们选择的流行阈值模型,应该是对“非流行期”数据最无偏、最不确定(熵最大)的模型,从而确保只有真正显著的升高才会触发预警。
2025-10-31 11:00:44
849
原创 【无标题】
菌群分析(Microbiome Analysis)是指通过高通量测序技术对特定环境(如人体肠道、土壤、水体等)中的微生物群落进行研究的方法。这项技术可以帮助我们了解微生物群落的组成结构、功能特征及其与环境或宿主的相互关系。
2025-10-30 20:28:49
583
原创 外周血 CD8-T 细胞单细胞测序免疫功能分析
等方法也被广泛应用于单细胞轨迹分析。在 CD8-T 细胞的轨迹分析中,可以构建从初始 T 细胞到效应 T 细胞再到记忆或耗竭 T 细胞的分化轨迹。研究发现,这一过程并非简单的线性分化,而是存在多个分支点和可塑性。例如,在急性感染中,初始 T 细胞主要分化为短寿命的效应 T 细胞和长寿命的记忆前体细胞;而在慢性感染中,T 细胞更容易进入耗竭程序。关键的分化调控节点包括:从初始到效应 T 细胞的转变,主要由 T-bet 和 IL-2 信号调控;
2025-10-30 18:16:44
777
原创 炎症性肠病疾病的QCI GBD数据库GBD(全球疾病负担)数据库 ,已广泛用于分析炎症性肠病(IBD)的全球流行趋势与负担 “QCI(护理质量指数)”与IBD在GBD
根据已有信息,GBD(全球疾病负担)数据库已广泛用于分析炎症性肠病(IBD)的全球流行趋势与负担,但。以下是现有相关研究的总结:根据已有信息,GBD(全球疾病负担)数据库已广泛用于分析炎症性肠病(IBD)的全球流行趋势与负担,但。
2025-10-30 18:12:13
571
原创 ukb 数据库的关联性加多组学,基因组学做完了需要解读思路,论文辅导
下面结合 UKB 数据库的“关联性+多组学”特点,把“基因组学做完了如何往下做”拆成 4 步 12 模块,并给出每一步常用方法、关键文献与写作要点。- 用 UKB 脑-心-眼影像 IDP + 蛋白计算 organ-age-gap(已发表模板 ), Cox 验证与多病共存 HR=1.21 (P<0.001),拔高“机制-临床”意义。B. 若已做完共定位但故事平淡,可立即加“药物靶点 MR”与“器官年龄”模块,两周内补充新图。把主要结果或困惑点发给我,我帮你定下一步分析 + 写作提纲。四、机器学习与故事升华。
2025-10-30 12:39:21
973
原创 win7 VSCode 1.70设置R语言的版本,电脑上有两个版本
作者的环境是 win7 VSCode 1.70 版本相对较旧(2022年发布),R4.3.2 R4.4.0可能与当前的 R 扩展或配置逻辑存在兼容性问题,导致按常规步骤设置后不生效。旧版本 VSCode 对路径的解析更严格,哪怕一个字符错误都会导致配置失效。Rterm.exe打开文件资源管理器,导航到 R 3.6.3 的安装目录(例如),注意区分x64(64位)和i386(32位)子目录(绝大多数情况是x64右键Rterm.exe→「属性」→「安全」→「对象名称」,复制完整路径(例如。
2025-10-27 07:13:43
779
原创 ncbi.nlm.nih.gov 这些缩写分别表示什么
NCBI 是美国国家生物技术信息中心(National Center for Biotechnology Information)的缩写,隶属于美国国立卫生研究院(NIH)下属的国家医学图书馆(NLM)。nih.gov:顶级域名,表明该机构隶属于美国国立卫生研究院(National Institutes of Health)。.nlm:表示其上级机构为美国国立医学图书馆(National Library of Medicine)。ncbi.nlm.nih.gov 这些缩写分别表示什么。
2025-10-26 09:36:40
224
原创 python 3.7下面 GEOparse 下载 数据老是失败的解决办法
python 3.7下面 GEOparse 下载 数据老是失败的解决办法,其他版本也差不多。
2025-10-25 16:25:07
603
原创 lncRNA ↔ 差异RBP的CLIP-seq 什么意思 名词解释
简单来说,它的核心目标是:寻找在特定条件下(如疾病 vs 健康)发生变化的RNA结合蛋白,并精确鉴定它们与长链非编码RNA的结合位点,从而解释这些相互作用如何影响细胞功能。识别“嫌疑人”(差异RBP):首先,通过比较不同状态下的细胞(例如,肝癌组织 vs 正常肝组织)的转录组数据,找出哪些RBP的表达水平存在显著差异。这些“差异RBP”就是潜在的、与该状态相关的关键调控因子。◦ 结合的具体效应:这个RBP的结合是影响了lncRNA的稳定性、在细胞内的定位,还是影响了它与其它分子的相互作用?
2025-10-25 09:57:51
497
原创 mamba 是一款高性能的 Python 包管理和环境管理工具,你可以把它理解为广受欢迎的 conda 工具的“加速版”
• 何时选择 mamba:当你需要频繁创建新环境、安装像 PyTorch、TensorFlow 这样依赖关系复杂的大型科学计算包,或者在自动化流程(如 CI/CD)中希望快速构建测试环境时,mamba 是绝佳选择,能为你节省大量等待时间。另外,对于要求绝对稳定的生产环境,一些保守的建议会倾向于优先使用经过更长时间考验的 conda。mamba 是一款高性能的 Python 包管理和环境管理工具,你可以把它理解为广受欢迎的 conda 工具的“加速版”。mamba 最大的优点之一就是它的完全兼容性。
2025-10-25 09:21:03
293
原创 R和python 哪个更适合生物信息分析,或者更擅长做什么工作
让Python负责“跑得快”(工程效率与规模),让R负责“说得清”(统计严谨与可视化),二者结合,才是现代生物信息学分析的“完全体”。• 如果你需要处理超大规模的数据(如全基因组测序原始数据)、构建自动化的分析流程、进行机器学习/深度学习建模,或者需要开发交互式应用和工具,那么Python是更合适的选择。在生物信息学领域,R和Python都是极其重要的工具,它们并非简单的替代关系,而是更像科研工作中的“黄金搭档”,各有专长且能协同工作。- 构建自动化分析流程(如Snakemake)
2025-10-25 09:17:20
402
原创 在 R 医学数据分析中,关于 RStudio 和 VSCode 哪个效率更高
• 如果你是医学数据分析的初学者,或者你的工作核心是使用 R 语言进行统计建模、绘制出版级图表和生成可复现报告(如用 R Markdown/Quarto 写论文),那么从 RStudio 开始会是更高效、更舒适的选择。• 如果你已经是有经验的开发者,或者你的项目涉及多语言协作(例如:用 Python 做数据预处理,用 R 做统计建模,用 Shell 脚本调度流程),并且需要强大的版本控制(Git)和工程化管理,那么 VSCode 的统一平台优势将极大提升你的整体效率。R 语言支持深度 ★★★★★。
2025-10-23 10:24:02
496
原创 Stata 15 16 18版本里打开 .dta 文件出现中文乱码,99 % 是因为文件本身是用 GB18030(或 GBK) 编码保存的,而 Stata 18 默认按 UTF-8 去解释字符串和标签
在 Stata 18 MP 版本里打开 .dta 文件出现中文乱码,99 % 是因为文件本身是用 GB18030(或 GBK) 编码保存的,而 Stata 18 默认按 UTF-8 去解释字符串和标签。把注释去掉、文件名写全即可。任意文件,中文变量名、标签即可正常显示。只打开 Stata,不要先打开数据文件。如果该文件夹里有很多。
2025-10-22 10:06:34
326
原创 Sci-Hub的核心运作方式是**未经授权破解学术数据库权限**,将付费论文免费传播,只能阅读
Sci-Hub等非法渠道的出现,反映了学术资源分配的不公与出版体系的缺陷。然而,以侵权对抗垄断并不能带来可持续的解决方案。作为科研人员,我们应坚守学术诚信,通过合法途径推动开放获取,同时积极参与制度改革,最终实现“知识共享、利益普惠”的学术生态。
2025-10-22 00:33:22
1002
原创 基因型-表型关联数基因/蛋白质/大分子相关经典生物信息数据集汇总 ,癌症体细胞突变,公共数据、药敏、多组学数据,找靶点、筛药物的“试药场”
本文汇总了14个主流生物医学数据库的最新下载地址和简介,涵盖基因组变异、癌症研究、蛋白质组学、结构生物学等领域。主要包括:dbSNP(变异位点总库)、gnomAD(群体频率)、ClinVar(临床变异注释)、COSMIC(癌症突变)、GTEx(组织表达谱)、ENCODE(功能元件)、TCGA(肿瘤多组学)、CCLE(癌细胞系)、Protein Atlas(蛋白定位)、PDB(分子结构)、GEO(公共表达数据)、EGA(欧盟受控数据)和dbGaP(NIH基因型-表型数据)。这些数据库为生物医学研究提供关键参考
2025-10-21 11:41:25
88
原创 Rtools43 是 R 语言在 Windows 操作系统上的一个关键工具链集合,主要用于从源代码构建 R 软件包
例如,R 4.3.x 必须搭配 Rtools43。主要应用 安装需要编译的 R 包 (通过 install.packages(“pkg_name”, type = “source”))、开发新的 R 包、从源码构建 R。如果你在具体的安装或配置过程中遇到问题,可以告诉我你使用的 R 版本和遇到的具体错误提示,我可以提供更进一步的帮助。• 处理旧版本冲突:如果你的系统上曾安装过旧版 Rtools(如 Rtools40),建议先卸载它们,并检查系统环境变量 PATH,确保没有残留的旧路径,以避免冲突。
2025-10-20 17:36:44
479
原创 在转录组数据的差异表达分析中,DESeq2、edgeR 和 limma 是三个最常被提及的工具。它们在设计理念、适用场景和结果输出上各有特点。
摘要:DESeq2、edgeR和limma是三种常用的转录组差异表达分析工具。DESeq2适合小样本RNA-seq数据,结果稳健但较保守;edgeR灵敏度高,适合中等样本量和复杂实验设计;limma计算速度快,在大样本和微阵列数据分析中表现优异。选择工具需考虑样本量、数据特点和实验复杂度,不同工具结果存在差异是正常的,可结合使用提高结果可靠性。注意输入数据格式要求,原始计数数据需用DESeq2或edgeR处理。
2025-10-20 14:47:35
898
原创 ftp.ebi.ac.uk 数据集介绍 表型数据 数据库 Harm_sumstats_status.db如何读取 pmid Genotyping_type基因分析
本文介绍了两种读取和导出 Harm_sumstats_status.db 数据库表为 TSV 文件的方法: SQLite 命令行工具:通过设置 .mode tabs 和 .output 命令直接导出指定表,适用于快速操作。 Python 脚本:利用 sqlite3 和 csv 模块实现灵活导出,可自定义表头和处理大批量数据。 两种方法均需先确认表名,适用于不同使用场景。命令行方式更高效,Python 方式则便于后续数据处理。
2025-10-20 09:52:30
1003
原创 要确定GCST90693191.tsv代谢数据集的基因组版本,核心是利用其**GCST编号的归属(IEU OpenGWAS项目)
快速扫文件注释:1分钟内判断是否有直接标注;查IEU OpenGWAS官方信息:通过网页或ieugwasr包,100%能获取准确版本(最可靠);补查原始文献:若前两步异常,文献是最终确认依据。多数情况下,GCST系列代谢数据集的基因组版本为GRCh37(对应hg19),但需以官方查询结果为准,避免因版本错配导致后续分析(如位置转rsID)出错。要不要我帮你整理一份GCST数据集基因组版本查询的步骤文档?包含网页查询截图指引和R代码模板,方便你后续处理其他GCST编号的数据集。
2025-10-19 12:39:40
833
mibiogen 肠道杆菌的gwas snp数据 用作孟德尔随机化分析 mr分析
2025-10-20
ebi 汇总 数据集的表型数据 包括 基因类型 pub mid ftp.ebi.ac.uk/pub/databases/gwas/summary-statistics/
2025-10-20
光子集成MOT综述这篇文章详细介绍了集成化三维磁光阱(3D-MOT) Enabling photonic integrated 3D magneto-opticaltraps 英文
2025-07-07
特别推荐的是 mysqlclient-1.4.6-cp37-cp37m-win-amd64.whl 文件等,专为 Windows 64 位系统下的 Python 3.6 3.7 3.8 环境设计
2025-01-15
html2canvas 截图功能 报表和文档转换
2024-04-08
各个国家地区的货币编码和国家代码数组
2023-08-16
portlets jquery drag插件
2009-12-16
epson TM-T88III.rar
2021-03-20
WindowsFormsApp1.rar
2021-03-29
jieqi cms 1.5防注入
2009-05-31
megento api soap xmlrpc接口 自定义扩展示例
2015-06-15
杰奇 jieqi cms 1.5防注入
2009-05-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅