R 对于表格中有不同分类的数据的处理办法

原创已于 2023-04-10 11:07:26 修改 · 196 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#r语言

于 2022-08-18 15:04:51 首次发布

在处理数据时，遇到log2和normalizedcount数据混合的问题。通过使用R语言中的dplyr包和row_number()函数，巧妙地解决了这个问题。具体做法是依据第12行的标题作为分割点，将数据分成两部分：log2_norm_df包含前11行，linear_norm_df包含剩余行。这种方法大大减少了手动操作的工作量。

今天在处理下机的数据时候,遇到这个问题：
读取到的excal表
log2和normalized count数据在一个sheet中。虽然可以手动分开再处理，但是次次这么做工作量非常大。
最后使用dplyr 包内的row_number() 函数成功解决。
~~对 row_number() 这个函数还是很难理解~~
对于分割来说,一定要找到一定的分割条件,再通过这些条件去想办法分割。在这个例子中，我们发现标题可以用来分割，只要已第12行的标题分上下就好了。

log2_norm_df <- norm_df %>% filter(row_number() < which(V1=="mRNA - normalized linear count data"))
linear_norm_df <- norm_df %>% filter(row_number() > which(V1=="mRNA - normalized linear count data"))

> log2_norm_df <- norm_df %>% filter(row_number() <which(V1=="mRNA - normalized linear count data"))

在这里插入图片描述
成功分开