假新闻检测:数据探索与模型构建
1. 数据加载与初步查看
在开始分析之前,我们先加载并查看数据的基本情况。以下是加载数据后查看前两行的代码和结果:
df.head(2)
| timestamp | baseurl | content | label |
|---|---|---|---|
| 0 2021 - 04 - 05 16:39:51 | dailybuzzlive.com | Cannibals Arrested in Florida Claim Eating Hum… | fake |
| 1 2016 - 01 - 01 23:17:43 | houstonchronicle - tv.com | BREAKING: Trump ores Deputy Attorney General … | fake |
2. 数据探索
2.1 数据分割
在进行探索性数据分析(EDA)之前,我们将数据分割为训练集和测试集,并且仅使用训练集进行 EDA。具体代码如下:
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



