文章目录
信息内容安全-《人民的名义》人物图谱分析实验
简介
按集提取内容并分析。结果图用Gephi制作。
代码
# 信息内容安全实验-《人民的名义》人物图谱分析
import jieba
import csv
# 判断字符是否为汉字(是则返回 True)
def is_chinese(char):
if char >= u'\u4e00' and char <= u'\u9fa5':
return True
else:
return False
# 标准化处理(只留下汉字)
def standardize(text):
st_text = ''
for char in text:
if is_chinese(char):
st_text = st_text + char
elif char.isdigit():
st_text = st_text + char
return st_text
# 按集提取内容
def get_episode():
temp = '' # 临时存放每集内容
episode = [] # 存放每集内容
with open(material, 'r', encoding = 'utf-8') as f:
for line in f.readlines():
line = standardize(line)
for char in line:
if char == '第'