TXT文本存储文字以行数存储的:
换行一下,更加直观。
代码如下:
train_txt = open("./data/ex1.txt", "r", encoding="UTF-8")
lines = train_txt.readlines()
print(lines[0])
line_1 = lines[0]
data = json.loads(line_1)
print(type(data))
# 结果:<class 'dict'>
for line in data:
print(line)
"""
结果:
content
doc_id
events
"""
print(data['content'])
data['content'] 的内容是:
证券代码:600644 股票简称:乐山电力 编号:临2016-03............
这就可以提取出了文档中需要的内容。