群友问题:如题。
尝试解答1
- https://blog.youkuaiyun.com/zhengxj_/article/details/129045464
这里给出了一种解释,
默认情况下,read.table 用 # 作为注释标识字符。如果碰到该字符(除了在被引用的字符串内),该行中随后的内容将会被忽略。只含有空白和注释的行被当作空白行。如果确认数据文件中没有注释内容,用
read.table(".csv",header=TRUE,sep=",",comment.char = "") ##h会减少行数
fread(".csv",header=TRUE,sep=",", fill=TRUE, na.strings="",) %>%filter(col!="NA") ##最好用
我尝试第一条,不起作用。
尝试解答2
- 用excel打开没问题,重新保存为csv,还是同样的报错。
- 删除该行,还是报错,而且行数略有变化,前后几行之间
- 最后逐行确认,在添加一行后,开始出现问题,这两行我都复制出来,放到文本编辑器中逐个逗号检查,终于发现了问题:
,"Squamous cell carcinoma, NOS",
这两个逗号之间出现了一个双引号括起来的逗号!读取语句添加, quote = '"'
,读取不报错了。
xx = read.table( paste0(inputRoot, "TCGA-LUSC.GDC_phenotype.csv"), sep = ",", header = T, quote = '"')