今天在处理下机的数据时候,遇到这个问题:

log2和normalized count数据在一个sheet中。虽然可以手动分开再处理,但是次次这么做工作量非常大。
最后使用dplyr 包内的row_number() 函数成功解决。
对 row_number() 这个函数还是很难理解
对于分割来说,一定要找到一定的分割条件,再通过这些条件去想办法分割。在这个例子中,我们发现标题可以用来分割,只要已第12行的标题分上下就好了。
log2_norm_df <- norm_df %>% filter(row_number() < which(V1=="mRNA - normalized linear count data"))
linear_norm_df <- norm_df %>% filter(row_number() > which(V1=="mRNA - normalized linear count data"))
> log2_norm_df <- norm_df %>% filter(row_number() <which(V1=="mRNA - normalized linear count data"))

成功分开
在处理数据时,遇到log2和normalizedcount数据混合的问题。通过使用R语言中的dplyr包和row_number()函数,巧妙地解决了这个问题。具体做法是依据第12行的标题作为分割点,将数据分成两部分:log2_norm_df包含前11行,linear_norm_df包含剩余行。这种方法大大减少了手动操作的工作量。

被折叠的 条评论
为什么被折叠?



