自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

生信学习

记录读博期间的生信学习

  • 博客(63)
  • 收藏
  • 关注

原创 哑铃图:让数据对比一目了然【Dumbbell Chart】

没错,当我祭出 “哑铃” 阵列,你当如何破解,哈哈哈哈…此时,你可以适当怀疑笔者的精神状态了。但话说回来,如果稍加想象,把上图竖起来,“大致” 就是我要分享的 “哑铃图” 了。😑。

2025-04-07 11:15:50 473

原创 Linux Shell(Bash) 快捷键整理

【代码】Linux Shell(Bash) 快捷键整理。

2025-03-27 16:05:10 366

原创 CherryStudio 对话内容导出到 Obsidian

不知道大家是否也有这样的习惯——每天和DeepSeek、GPT、Claude、Gemini等这些AI助手聊个不停,把那些觉得特别有价值的对话都保留着,幻想着将来某天会重新翻阅。于是,我的对话列表里堆满诸如:”一周减脂晚餐计划“、”Linux Shell快捷键大全“、”神经网络入门指南“…这样的宝藏。最近发现CherryStudio更新了一个超棒的功能:它居然可以把对话内容直接导出到Notion和Obsidian!!

2025-03-27 13:38:31 361

原创 10分钟,借助 CherryStudio 实现满血版 DeepSeek-R1 自由

DeepSeek(深度求索)作为中国量化投资机构幻方量化孵化的开源大模型企业,凭借三大核心创新正在人工智能领域掀起技术革新浪潮。其产品矩阵中,对标GPT-4o的deepseek-chat(DeepSeek-V3)对话模型与专注逻辑推理的deepseek-reasoner(DeepSeek-R1)双星并耀,在知识测试、代码生成等关键指标上已实现对Llama等国际竞品的超越,而尤为值得一提的是——这是完全自主研发的国产大模型!

2025-03-21 12:54:13 696

原创 DeepSeek + Obsidian 打造个人知识库

很久之前,我邂逅了一款支持Markdown的笔记软件,初见时欣喜若狂,却在热情消退后将它束之高阁,自那之后,就没再“宠幸“它,它也只是安静的住在硬盘角落,我甚至忘记了它的名字。直到最近,它在 Copilot 的帮助下,给自己上了最近流行的 DeepSeek 妆容,散发着人工智能的魅力,重新回到了我的视野,呵,渣男竟是我自己。

2025-03-17 18:21:28 1124

原创 更改 Windsuf 插件市场 Market

之前一直用 VScode,现在全部迁移到 Windsuf 了,但是,Windsuf 默认的插件市场里没有我喜欢的主题……我又有点强迫症,所以,把Windsuf 默认的插件市场换成 VScode 的😑。

2025-03-15 19:01:25 214

原创 Bar Plot 进阶:环状堆叠条形图

某天,我老妹儿问我:“哥 会画玫瑰堆积图吗?”,自我感觉了一下,应该就是南丁格尔玫瑰图,在绘图过程中调整一下参数,把调整为,就会变成下图堆叠的效果,好看是毋庸置疑的,但是会给人带来视觉上的误判,因为就视觉效果而言,外圈会看起来似乎更大……(但是挡不住它好看啊)后来,坐在工位想了一下,如果有很多相同的实验组对照组,但是不同条件的处理,我又不想画好几张图,那是不是可以这样…这样…然后那样…就可以了😑👌欢迎关注:wx_gzh 猪猪的乌托邦。

2025-03-12 13:01:50 889

原创 Windsuf 连接失败问题:[unavailable] unavailable: dial tcp...

许多特殊网络环境需要通过代理服务器访问外部资源。如果应用程序未正确识别系统代理设置,会导致连接失败。域名解析失败可能导致无法连接到正确的服务器。:修改后保存文件,并重启相关应用使配置生效。本地防火墙或安全软件可能阻止了出站连接。看了眼目标服务器,全绿,感觉没啥问题。(ping 了一下,感觉没啥问题)(我确实开了代理,应该是这个原因)(然而,我并没有对其限制)该错误表明程序尝试通过。

2025-03-07 10:09:53 576 4

原创 文献速读:钱苔属(Riccia)性别系统的演化与退化【New Phytologis】

研究背景与核心问题研究对象:Riccia属(地钱纲复杂叶状苔类)是苔类中物种最丰富的属,多数为单性同株(monoicous),而祖先苔类及现存多数苔类为雌雄异株(dioicous)。退化演化:Riccia的配子体和孢子体均发生退化,孢子体缺乏孢子传播结构(如弹丝、蒴柄),孢子释放依赖母体配子体分解。关键科学问题:性系统(单性同株与雌雄异株)的演化机制、退化特征的遗传基础,以及Riccia与近缘属Ricciocarpos的演化关系。

2025-02-12 15:04:24 586

原创 RNA 测序技术概览(RNA-seq)

转录组测序(RNA-seq)是当下最流行的二代测序(NGS)方法之一,使科研工作者实现在转录水平上定量、定性的研究,它的出现已经革命性地改变了人们研究基因表达调控的方式。然而,转录组测序(RNA-seq)其实是广泛的概念,面对众多的RNA-Seq技术,常常难以选择最合适的方法。本文将概述几种主要的 RNA-Seq 技术,并探讨它们的应用和优势。

2025-01-24 17:01:58 1106

原创 Linux 系统安装 NCBI Blast + A Quick Guide

NCBI BLAST(Basic Local Alignment Search Tool)是由美国国家生物技术信息中心(NCBI)开发的一个深受生物信息学研究者青睐的基因序列比对工具。作为生物序列信息比对的行业标准,BLAST可用于分析核酸(DNA和RNA)以及蛋白质序列。本工具的核心功能是识别给定序列(查询序列)与数据库中最相似的序列,因此在基因注释、功能预测和分子进化研究中具有不可替代的作用。blastp:用于蛋白质序列与蛋白质数据库的比对。

2025-01-06 16:32:31 1098

原创 VScode、Windsurf、Cursor 中 R 语言相关快捷键设置

在生物信息学数据分析中,R语言是一个不可或缺的工具。为了提高R语言编程效率,合理设置快捷键显得尤为重要。本文介绍在VSCode Windsurf Cursor 中一些实用的R语言快捷键设置,让非 Rstudio 的 IDE 用起来得心应手😑。

2024-12-13 18:30:00 1147

原创 ggalign:热图等复杂组合图及图形数据对齐的 ggplot2 扩展

一个 R 语言绘图工具ggplot2的高级扩展,它专注于在多个图形之间对齐观察值,利用 vctrs 包中的“number of observations”或NROW()函数,确保图形组织的一致性。无论是自包含排序图形的对齐,还是在多个图形中应用一致的分组和排序(如 k-means 聚类),ggalign都可以帮助简化这一过程。

2024-11-11 20:40:30 1401

原创 数据重塑:长宽数据转换【基于tidyr】

每个观测单位占用一行每个变量占用一列适合人类直观阅读常见于Excel表格# 宽格式数据示例掌握长宽数据格式的转换是数据分析中的重要技能。通过tidyr包提供的工具,我们可以灵活地在不同格式之间转换,从而更好地满足分析和可视化的需求。需要创建可视化?使用长格式需要人工检查数据?使用宽格式需要进行统计分析?根据具体分析方法选择合适的格式。

2024-11-11 19:33:40 759

原创 Claude 3.5全面升级,AI 时代?我将何去何从

2024年10月22日,Anthropic Claude 3.5 有了一次更新, 在其官网上发布了声明,有能力的可以直接访问查看。

2024-10-24 14:17:27 1874 1

原创 R 语言 data.table 大规模数据处理利器

最近从一个 python 下的 anndata 中提取一个特殊处理过的单细胞矩阵用来画图,保存完之后,大概几个G的CSV文件,如果常规方法读入R,花费的时间比较久,就想到用fread这个函数(data.table工具内函数)。在R语言中处理大规模数据时,data.table包是一个强大而高效的工具。它不仅能够快速处理大型数据集,还提供了简洁的语法和丰富的功能。简单总计热data.table的基本操作、常用函数,以及两个实用的操作符:%like%和%between%。

2024-09-29 12:39:55 936

原创 【R语言】fs 工具功能速查

path_ext

2024-09-24 20:42:58 1065

原创 下载测序数据那些事儿(一)

最近在下载(分析)公共数据,无法避免的从 NCBI SRA 数据库下载已发表的“”优质“”数据。曾经一直以为,数据下载就是小case,直到我因为下载数据,折腾了几天……所以,聊一下目前下载拆分单细胞转录组测序数据踩过的SHIT。希望能为后来者提供一些参考😐。

2024-09-24 17:45:20 1020

原创 Error in irlba::irlba(L, nv = n, nu = 0, maxit = iters) : function ‘as_cholmod_sparse‘ not provided

好像好多 Seurat 相关的报错都和 Matrix 这个工具相关。单细胞分析过程中(Seurat V4),使用。

2024-09-17 13:03:28 1034

原创 解决【R】Error in check.length(gparname) : ‘gpar‘ element ‘lwd‘ must not be length 0

很久之前,在整理单细胞数据分析流程的时候,刚好看到一个 R packageclustree,感觉可以为选择聚类的分辨率(resolution) 提供参考,就加到了流程里,殊不知此举给自己埋了个小小的“雷”。后来,做湿实验的师兄师姐需要自己学习单细胞分析,就拿我整理的流程“学习”去了。只不过,因为各种工具、依赖的迭代更新等,我又没在流程里标注工具依赖的版本,以至于当时在我的环境中运行大致“无碍”的流程,在他们手里坎坎坷坷,其中,clustree。

2024-09-12 15:00:41 710

原创 缓解新手 R Packages 安装焦虑

对于一个刚学习生信和使用R的同学来说,安装 R Packages 可能算是一个小困难,因为光看 Packages 的名字,无法区分其来源是 CRAN、Github、Bioconductor、git repositories 或者 URL 等。,整合了几种不同来源工具的下载安装方式,包括从 CRAN、Bioconductor、GitHub、URL、git 存储库、本地文件和目录安装R包。而不同来源的 R Packages,使用的命令又有所不同,比如从CRAN 上安装,使用。就是一个依赖一个又依赖另一个…

2024-08-13 20:31:51 1155

原创 解决【R】Error in Ops.data.frame(guide_loc, panel_loc),‘==‘ only defined for equally-sized data frame

长话短说,就是最近在使用。

2024-07-13 17:57:28 5566

原创 从 Github 安装 R packages 不完全指南

R语言,一个被广泛使用的统计计算和数据分析工具。在日常使用过程中,需要安装实现各种功能、来自各种渠道的工具包(packages)比如:CRNA或者Github。很多包已经发布在 CRAN 上,使用就可以直接安装。但有时我们需要从 GitHub 安装,特别是一些最新或尚未发布到 CRAN 的工具。正好最近遇到个小问题,顺手记录一下。😑。

2024-07-08 14:52:02 1091

原创 PacBio or Nanopore:测序技术简单对比

在基因组学和生命科学领域,追求知识的旅程不断演变,由揭示DNA和RNA奥秘的技术创新推动。我们熟知的两大测序技术——PacBio和Nanopore,正位于这一领域的前沿。这些由 Pacific Biosciences 和 Oxford Nanopore Technologies 分别开发的先进仪器,开启了基因组探索的新纪元。但这两种技术有何不同呢?本文将简单理解PacBio与Nanopore,剖析它们在解码生命蓝图和照亮遗传景观中的角色。

2024-06-28 14:46:45 1671

原创 解决【scVelo】Error: Neighbors.compute_neighbors() got an unexpected keyword argument write_knn_indices

最近分析单细胞数据,发现自己环境中的scanpy版本落后太多了,所以更新了一下……然后在做分析的时候遇见了报错:,记录一下解决过程。我遇到的报错,应该之前会有人遇到过,多搜一搜,总会找到解决方案,提高信息检索筛选的能力,会明显减少解决问题所需时间。

2024-05-05 10:59:44 1310 1

原创 从 NCBI SRA 数据库下载文件——获取想要的数据

事情是这样的,最近啊,在研究拟南芥叶片的数据,需要下载一批数据,之前整理过Sra-ToolKit的安装使用,这次干脆整理一下我知道的NCBI数据搜索和下载的方式😑全称:Sequence Read Archive,是一个公开可访问的存储和共享高通量测序数据的中心资源库。它由美国国家生物技术信息中心(NCBI)维护,该中心是美国国家医学图书馆(NLM)的一部分。

2024-03-20 09:35:49 11687 3

原创 解决【R】Error: useNames = NA is defunct. Instead, specify either useNames = TRUE or useNames = FALSE

如题,最近在使用Seurat V5函数,简单记录解决过程😑遇到一些成熟的工具报错,排除数据格式问题后,基本都是其他依赖的版本问题……

2024-03-01 15:01:57 6616

原创 解决使用Plotly.py 中create_dendrogram 报错:AttributeError: Module ‘scipy‘ has no attribute ‘array‘

日期:2024.2.2,AttributeError: Module 'scipy' has no attribute 'array' 记录解决过程。

2024-02-02 16:23:06 756 1

原创 吐槽一个 R package :DSS

最近在整理WGBS分析的流程,下游需要类似普通转录组中的差异分析。之前看的一篇文章提到一个R包DSS,看Bioconductor 的教程:近期更新的,写的还不错,所以我就试了一下,结果就是196 cores的服务器直接卡死。

2023-11-20 17:24:34 344

原创 SRA ToolKit (sra-tools) 的安装和使用

事情的起因是从NCBI SRA Database下载数据时的一个报错:path not found while resolving tree within virtual file system module - 'SRR1上次下载数据的时候还是上次,并没有遇到这个问题,所以果断去GitHub借助NCBI的 https 或者 ftp 网址,使用wgetcurl等同类工具替代下载更新sra-tools没错,我选择第二种解决方案,记录一下😑

2023-10-31 11:00:57 9410 1

原创 K邻近算法(KNN,K-nearest Neighbors Algorithm)

之前看到一篇文章,方法部分提到了这个K邻近算法,正好自己不是很熟悉其原理,所以学习整理一下😑K邻近算法(K-nearest neighbors algorithm)是一种常用的机器学习算法,用于分类和回归问题。它基于一个简单的假设:与未知样本最相似的K个已标记样本的类别可以用来预测该未知样本的类别。在K邻近算法中,输入数据点被表示为n维空间中的向量,并且每个数据点都有一个对应的类别标签。计算距离:根据给定的距离度量方法(例如欧氏距离、曼哈顿距离等),计算未知样本与训练集中所有已标记样本之间的距离。

2023-10-14 15:02:23 1172 2

原创 探索组间差异利器:Tukey 检验 【Tukey Test】

统计学中有许多方法可用于比较不同组别之间的差异,而其中一种常见且强大的工具就是Tukey检验。当我们进行多组实验或研究时,常常需要了解哪些组别之间存在显著差异,而不仅仅是确定是否存在差异。在这个问题上,Tukey检验可以为我们提供确切的答案。Tukey检验,也称为Tukey的事后多重比较方法,是方差分析(ANOVA)的后续分析中经常采用的一种统计方法。它的目标是通过比较各组均值之间的差异来揭示群体之间的显著性差异。

2023-08-21 11:20:58 21234 8

原创 测序饱和度【cellranger】

单细胞转录组测序技术逐渐的,就像父辈人年轻时,彰显身份的“大哥大”,变成了我们这一代人,人手一部的现代手机,成了很多文章中的“头牌”或是“锦上添花”的部分,就像普通的转录组测序的发展趋势。

2023-07-04 22:14:53 2676

原创 南丁格尔玫瑰图 With ggplot2【R语言】

之前在饼图中提到过,要整理一下南丁格尔玫瑰图的画法😑南丁格尔玫瑰图又名鸡冠花图、极坐标区域图,是南丁格尔在克里米亚战争期间提交的一份关于士兵死伤的报告时发明的一种图表。南丁格尔玫瑰图是在极坐标下绘制的柱状图,使用圆弧的半径长短表示数据的大小(数量的多少)。由于半径和面积的关系是平方的关系,南丁格尔玫瑰图会将数据的比例大小夸大,尤其适合对比大小相近的数值。由于圆形有周期的特性,所以玫瑰图也适用于表示一个周期内的时间概念,比如星期、月份。

2023-04-08 15:28:16 3823 6

原创 格式转换:BAM 转 FASTQ

有时候,分析已发表数据的时候,避免不了会遇到作者上传的数据是BAM格式,但是作者用的基因组又不是我想要的,所以我就需要将BAM转换为FASTQ,加上许多分析工具都是需要以FASTQ文件为起始输入,据说BAM转换为FASTQ是生信中的一个常见步骤,虽然现在还没遇到,提前整理,以备不时之需😑工具有很多,接下来就罗列几个工具。

2023-04-03 17:20:53 8121 1

原创 生信必会格式:SAM & BAM 文件格式简介

对SAM、BAM、CRAM格式的简单介绍

2023-03-24 16:42:42 793

原创 使用 ggplot2 画一个饼图【R语言】

最近,可能会需要饼图,所以提前整理一下,用的时候直接翻出来,思路很简单,就是把柱状图换成极坐标的😑。

2023-02-23 20:25:32 6143

原创 正则表达式(Linux)通配符

对于生信学习,正则表达式超级重要,超级重要,超级重要

2023-01-01 16:05:46 357

原创 VScode中使用R语言:快捷键设置

之前提到,我从使用RStudio编辑器迁移到了使用VScode编辑器,也是最近几年,VScode才有了相对成熟的R语言支持,但是,有一些方便的快捷键(或者说我用习惯了)没有被初始化设置,所以,需要我手动添加😑。

2022-12-12 16:14:09 2665 4

原创 Heatmap Plot with ggplot2 【R】

热图,作为生命科学领域常用的数据展示方式,R中已经有很多专门画热图的工具,比如、等等,但是,有些特殊的需求,还是要用实现,最近有这需求,正好整理一下😑

2022-12-04 16:31:25 2181

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除