温馨提示,如果你有更好的方法欢迎留言分享
文章目录
####1.大文件预览
1.当我们处理大数据过程中,数据量特别的大,比如有如下文件达到800M,

使用记事本或者是Notepad均打不开。

那么我们又要查看数据,又不想写程序查看,可以在cmd中执行如下
type C:\Users\lenovo\Desktop\NewShortestPathCountrywideComplete.txt
操作流程如下图(它会全部读取进去,切断为操作Ctrl+c ):

####2.常见操作,文件行去重,以txt为例
#!usr/bin/env python
#_*_ coding:utf-8 _*_
readDir = "C:\\Users\\lenovo\\Desktop\\com_file.txt"
writeDir = "C:\\Users\\lenovo\\Desktop\\com_file2.txt"
lines_seen = set()
outfile=open(writeDir,"w")
f = open(readDir,"r")
for line in f:
if line not in lines_seen:
outfile.write(line)
lines_seen.add(line)
outfile.close()
print ("success")
####3.打出⇒
按Alt+小键盘8658就可以打出推出符号⇒
####1.txt 一共有多少行
使用命令: wc -l txt文件名(注意路径)
eg:
admindeMacBook-Pro:data_check hht$ wc -l baohui_data.txt
152839 baohui_data.txt

1083

被折叠的 条评论
为什么被折叠?



