- 博客(92)
- 收藏
- 关注
原创 【PDF编辑器】Adobe Acrobat Pro DC
摘要:该PDF编辑器提供高效便捷的文档处理功能,支持直接编辑文本、图片及页面重排,操作方式类似Word。可快速将各类文件转换为专业PDF,并实现多格式文件合并。扫描件处理功能可自动OCR识别,将纸质文档转为可编辑电子文本。核心功能包括:文本自由编辑、图像处理、页面管理、格式转换及文档合并优化。(98字)
2025-12-27 08:15:00
114
原创 【Plink使用细节】基因型数据合并中的正负链陷阱:从AC/TG冲突到安全合并的完整指南
本文探讨了基因型数据合并中"正负链陷阱"问题的处理方法。DNA双链结构的互补特性导致不同数据集对同一SNP位点可能出现AC/TG等冲突报告,特别是A/T和C/G这类"链模糊SNP"。文章详细分析了直接使用PLINK翻转命令的风险,并提出四步安全合并流程:数据准备检查、识别链模糊SNP、处理非模糊SNP、合并验证。针对链模糊SNP,推荐优先采用排除策略,或在可靠参考面板支持下进行校正。强调质量控制的重要性,建议建立标准化流程,在准确性和完整性之间优先确保数据准确性。
2025-12-26 12:00:00
1843
原创 【群体遗传学分析】之群体结构分析系列(下):从结果到洞察——专业解读与实战精要
掌握了原理与方法,最后一篇我们聚焦实战:如何组织分析流程?怎样从图中读出真正的生物学故事?让你的分析报告从“有图”升级到“有洞察”。
2025-12-26 07:30:00
1588
原创 【基因组选择育种】
基因组选择则如同为生物体进行一次“全生命周期的数字算命”。其哲学基石是:个体的所有遗传潜力,都编码在其DNA序列之中。只要能解读这本‘天书’,就能在其生命伊始,预见其终身的性能表现。
2025-12-26 07:15:00
499
原创 【群体遗传学分析】之群体结构分析系列(中):三大核心方法深度解读——ADMIXTURE、PCA与系统发生树
接上篇,我们知道了群体结构分析为何如此重要。本篇将深入技术核心,揭秘三大主流方法背后的原理,让你看懂结果图里的每一个细节。
2025-12-25 07:30:00
792
原创 【群体遗传学分析】之群体结构分析系列(上):它到底是什么?为何是数据分析的“第一步”?
做了这么多年分析,发现有些客户竟然不知道怎么看群体结构的结果,那我就娓娓道来,从原理、结果解读、能做什么。说的比较多,所以分了上中下几篇。之前也有讲过软件,但可能不够详细,文末有案例。
2025-12-24 07:30:00
707
原创 【Linux基础】Linux磁盘空间管理之批量删除文件
通过科学的"诊断-定位-确认-清理"四步法,配合安全的交互式操作,实现Linux磁盘空间的智能管理。
2025-12-19 21:30:00
385
2
原创 【Linux】生物信息学Linux入门指南:从核心命令到实战应用
本文介绍了生物信息学中必备的Linux命令行操作,分为三个阶段:基础导航与文件操作(如pwd、ls、cd等)、文本处理与搜索(grep、awk、sed等核心工具)以及效率与流程管理(软件安装、权限设置等)。文章强调Linux是生物信息分析的重要工具,建议通过实际任务边用边学,掌握命令组合使用技巧。同时提供了实战数据集推荐和常见问题解决方案,帮助读者快速上手生物信息分析工作。最后提醒初学者应在测试环境中练习,避免生产环境误操作。
2025-12-11 22:30:00
1664
原创 生物信息学入门指南:必须掌握的核心技能Linux、R与Python
为什么要学这么多?因为生物信息学的本质,是用计算的语言理解生命的逻辑。Linux是你的土壤,Python和R是你手中的锄头和画笔。土壤让你站稳,工具让你创造
2025-12-06 11:56:25
845
原创 【Linux】使用小细节之删除软链接的正确方法Linux删除软连接的正确姿势:别让一个斜杠毁掉你的心血!
Linux删除软连接的正确姿势:别让一个斜杠毁掉你的心血!
2025-12-04 22:21:04
344
原创 【Windows小技巧】单次微信退出,清空聊天记录
通过开启「退出登录时自动清理缓存」开关,或遵循「先手动清理缓存 -> 再退出登录」的步骤,你就可以完美实现每次更换微信账号或退出时,自动为手机腾出大量空间并保护隐私。养成这个好习惯,再也不用担心微信体积无限膨胀啦!互动话题:你的微信占了多少手机存储空间?快在评论区晒出来,看看谁是“微信大户”!
2025-11-12 22:59:44
672
原创 闲谈-三十而已
在XHH上面刷到人民日报这样一句话,共勉。一方面,又觉得,努力显得是多么的苍白,是我来到这个世界上的第3个十年,一方面,积极面对生活中的苦难,读到了这个 ,觉得很有道理。接受自己的平庸,和不完美,2025年11月11日,最近和这个大环境一样,
2025-11-11 22:07:14
295
原创 【windows办公小助手二】知识管理神器-思维导图工具:幕布 、XMind 、 TreeMind 树形思维导图、印象笔记等等
windows办公知识管理神器,提升你的大脑容量,增强逻辑能力。
2025-11-10 20:00:00
894
原创 【linux】如何只取消软连接,不删除原始文件或目录,注意目录最后不要有
删除的是软链接本身,不会影响原始目录。如果误删了原始目录,软链接会变成“悬空链接”(指向不存在的路径)。目标:用-L解引用符号链接,复制实际内容。场景cp -Lcp -RL或rsync -L风险:确保软链接有效,避免误操作。
2025-07-16 19:57:14
876
原创 【python基础一】协助你快速入门的小工具VS Code N+AI
安装VS Code + 必装插件(Python、Jupyter)遇到不会的代码,直接问豆包或Deepseek(别硬撑)写代码时先加注释,再写逻辑关键步骤用try-except包裹,避免崩溃工具和习惯到位了,写Python会从“痛苦的任务”变成“能快速出结果的乐趣”。刚开始不用追求“写得多好”,先保证“能跑起来、能看懂”,慢慢积累就会越来越顺~如果有其他好用的工具或技巧,欢迎在评论区补充!
2025-07-16 19:50:56
866
原创 【windows办公小助手】快速搜索文件及文件所处目录everything
使用简单:搜索框输入要搜索的内容,可以模糊匹配。1. 快速搜索文件小工具。
2025-07-13 17:07:36
222
原创 【小情绪小感悟】
突然明白一个道理,很多时候你认为困难的事情,先定一个小目标,再把它养成习惯,就不会那么难了。比如看书,之前一直会刷手机,当变成看书以后,时间显得都变慢了些。就像从对命令行一无所知,到依靠自学编程,自己分析数据,改变自己的习惯的过程比较困难,但当完成目标以后,再翻回头看自己,会成就感满满。当然,不能总和最最厉害的人比,只要在你能力范围内能达到最佳,就可以了。闲来无事,想分享下使用的软件,突然看见粉丝数刚刚达到1000。虽然博主也是在探索的路上,才疏学浅,也不可避免的走了一些弯路。希望我的经验能帮助到大家。
2025-07-12 17:00:46
162
原创 【windows处理技巧】如何缩小PDF
原因:近日输出的PDF太大,渲染需要较多的时间,所以需要缩小一下PDF。操作工具:adobe acrobat pro。方法:导入--另存为--缩减。
2025-06-26 19:45:00
216
原创 博客的浏览超过十万,再接再励
因为知道,在初次接触生物信息,连linux、R语言、python都不知道是什么的小白,开始学习与适应命令行,是一件相对比较难的事情。想说,所有的都只是过程,适应了慢慢来,总是会在学习中有所长进。希望能给所有迷茫的小白,一点微弱的帮助。来日方长,未来可期,终究会长成大树。看到博客的浏览超过十万,很震惊;生活不易,只有学习才能不断前进。
2025-06-11 22:58:25
123
原创 【群体结构ADMIXTURE之三】监督分群在祖先成分分析中的应用及原理
监督群体结构分析(血统分析)的原理是:利用已知祖先背景的参考群体数据训练一个监督学习模型(如LDA或随机森林),学习区分这些参考群体的遗传特征模式;然后将目标个体的基因型数据投影到这个训练好的模型空间或直接应用模型进行预测,计算出目标个体的基因组与每个参考群体的相似度或归属概率,这个相似度或概率即被量化为该参考群体贡献的血统比例。其结果的准确性极度依赖于参考面板的质量(纯度、代表性、样本量、SNP密度)。它是法医祖先推断、个人祖源检测、研究历史混合事件等应用中最主要的工具。
2025-06-11 22:27:39
1073
原创 【群体结构ADMIXTURE之二】监督分群
Admixture通过EM算法一般用于指定亚群分类;或者在不知材料群体结构背景下,通过迭代交叉验证获得error值,取最小error对应的K值为推荐亚群数目。如果我们(百分百确信),那么可以考虑方法,设置标签,提高分群的准确性。基于明确已知亚群的样本集,如已知纯种AA,BB,CC。鉴定未知样本中血统AA,BB,CC占比情况,则需要利用监督分群,提高准确性(参考个体视为训练样本,问题转化为监督学习问题。相反如果所有样本均未知,则依然采用无监督模型。
2025-06-10 21:00:00
1111
原创 【群体结构 ADMIXTURE之一】: fast ancestry estimation
就是在正式进行大规模运算前,计算机先尝试各种各样的随机分类,运行非常短的次数,然后评估哪种随机分类是最合理的。对每个K值模拟的结果,软件都会计算出一个CV error值和最大似然值,error值越小越好,似然值越大越好,两个指标都可以挑选最佳K值。那么软件就会模拟在K=x的情况下,使用贝叶斯算法推算群体是如何分群的,以及每个个体的血统构成是如何的。如果SNP数据集非常大,则可以随机选择SNP进行K值选择分析,比如随机选取20000个SNP进行分析,每个K值跑20次,确定最终的k值,然后分析。
2025-06-10 19:30:00
814
原创 【VScode】python初学者的有力工具
就在24年5月份,别人推荐下发现了一个更加轻量级、方便又快速的ID,“VScode”。几乎不到5秒就可以进入页面,支持各种好用的插件,设置快捷键。向所有python的初学者推荐这个编辑器,因为打开方便,还能连接远端终端服务器。所以重新回答一个问题,如果你是一个编程小白,或者你是一个习惯用Rstudio的人,想开始学习python,该怎么开始。推荐:三步曲,第一步下载软件python+VScode,这个网上有很多教程。第二步,粗略看语法,重点找示例,重复运行,加模仿。这时候遇到不会的,或者看不懂的,可以直接丢
2025-05-22 20:30:00
855
原创 【PPT制作利器】DeepSeek + Kimi生成一个初始的PPT文件
介绍的比较详细,就是这个PPT模版有点一言难进。tep2基于生成的文本,用。中PPT助手一键生成PPT。进行PPT渲染-自动渲染。
2025-05-06 20:30:00
807
原创 【使用Plink检测ROH问题查找】为什么检测ROH参数不一样,FROH近交系数结果差异很大?
纯合子片段(ROH)短ROH:远距离近亲繁殖指标长ROH:近期近亲繁殖指标最初发现于人类基因组。
2025-04-22 21:15:00
1604
原创 【单倍型理解及计算系列之三】怎么确定单倍型以及软件参数
LD Block通过量化SNP间的连锁不平衡,划分基因组中稳定遗传的区域,并推断单倍型组合。其本质是。
2025-04-19 16:45:00
1279
原创 【单倍型理解及计算系列之二】单倍型基本概念以及其与遗传定位中Bin的定义区别
简而言之:就是单倍型是基于LD,通常为连锁不平衡(LD)较高的区域形成。但bin是人为划分的,如以固定SNP数量/固定长度设置,将基因组分成连续的区间,用于简化分析等。如果依赖LD结构,这时候与单倍型有交集。Deepseek:在遗传学分析中,单倍型(Haplotype)和Bin(遗传定位中的区间)是两个不同的概念,尽管它们都用于简化基因组信息的复杂性,但其定义、构建方式和应用场景有显著差异。1. 定义与核心区别特征单倍型(Haplotype)遗传定位中的 Bin定义。
2025-04-19 15:15:00
1041
原创 【单倍型理解及计算系列之一】单倍型基本概念以及检测原理
检测LD block的主要目的是识别这些区域,从而简化遗传分析,比如通过选择标签SNP(tag SNP)来代表整个区块,减少需要分析的SNP数量。单倍型(haplotype)是遗传学中的重要概念,通常指的是一组在同一染色体上相邻的等位基因或遗传标记的组合,这些组合倾向于一起遗传给后代。单倍型(haplotype)是遗传学中的重要概念,通常指的是一组在同一染色体上相邻的等位基因或遗传标记的组合,这些组合倾向于一起遗传给后代。基因型指个体所有染色体上的等位组合,而单倍型特指一条染色体上的组合。
2025-04-18 20:45:00
1194
原创 【deepseek】辅助思考生物学问题:ICImapping构建遗传图谱gap较大
【代码】【deepseek】辅助思考生物学问题:ICImapping构建遗传图谱gap较大。
2025-03-06 22:15:00
326
原创 【DeepSeek 】学习编程的利器:DeepSeek 使用指南
head和tail:适合简单场景,直观易用。awk:简洁高效,适合一次性处理。sed:功能强大,适合复杂需求。循环:适合文件较多时批量处理。
2025-03-05 21:45:00
487
原创 【APP学习-制定计划】ticktick
可见这个百宝箱,还支持写一个简单的html小程序(题外话,工作需要,我之前还专门花几天时间研究html,研究它的语法规则,然会用最基础的语法修改模板html,但强大的deepseek竟然几分钟就能自动生成)。目前,我希望研究这个已有的软件。3.习惯打卡 :制定一些每日/每周重复的,如运动、看书等等,设置提醒,完成后可以打卡,并生成统计,即你完成多少次打卡,这种让生活变得很有成就感。功能:日计划、周计划,子任务(我最中意的)、看板模式、番茄时钟(我最中意的)、日历视图、习惯打卡(我最中意的)
2025-03-01 10:22:30
641
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅