数据来源:https://www.kaggle.com/datasnaek/youtube
1.视频点赞数与评论数的关系
刚开始使用np.loadtxt()处理数据出错Wrong number of columns at line %d
原因1:使用,
作分隔符,数据中,
产生干扰,将,
替换为、
或者其他字符
原因2:comments默认为#
,之后的字符默认都被注释掉,将comments设置为None
之后还是有其他行报错
改为用np.genfromtxt(),可以处理缺失数据等信息(如果知道其他报错的原因还请各位大佬告知
import numpy as np
from matplotlib import pyplot as plt
us_file_path = "./USvideos.csv"
uk_file_path = "./GBvideos.csv"
t_uk = np.genfromtxt(uk_file_path, delimiter=",",
dtype=