在处理gene id的时候,有时候gene id会用"|"分割:
> a$geneids
[1] "2147|14061|14066|56316|69568"
再做各geneid转化之前,将geneid分割
> b <- strsplit(a$geneids,"|")
> b
[[1]]
[1] "2" "1" "4" "7" "|" "1" "4" "0" "6" "1" "|" "1" "4" "0" "6" "6" "|" "5" "6" "3" "1" "6" "|" "6" "9"
[26] "5" "6" "8"
会造成每一个字符都分开,这是因为“|”是一个运算符,意思为“或”,所以此时要用转义符“\\”
> b <- strsplit(a$geneids,"\\|")#成功分割
> b
[[1]]
[1] "2147" "14061" "14066" "56316" "69568"
#或者用[]
> b <- strsplit(a$geneids,"[|]")
> b
[[1]]
[1] "2147" "14061" "14066" "56316" "69568"
这篇博客介绍了在R语言中处理基因ID时遇到的问题,特别是当ID由' '|' 分割时,如何使用strsplit函数进行正确分割。通过使用转义符''或者字符匹配'['']'来避免运算符冲突,成功地将基因ID拆分为单独的元素。这对于后续的数据转换和分析至关重要。
585

被折叠的 条评论
为什么被折叠?



