python情感分析
本篇博文将使用Python实现一个简单的情感分析喔!
数据获取
情感分析项目中我用到了三个数据集,分别如下:
(1)京东商城红酒评价数据集 标签数量 2 数据量 2,000
(2)生活微博数据集 标签数量 4 数据量 40,000,
(3)英文推特数据集 标签数量 11 数据量 210,000,
英文推特数据集生活微博数据集词云
(需要数据集的邮箱联系吧)!
这篇基本不会用到这三个
weibo数据集获取API:
微博是我国最好的一个获取情感语料的平台之一,除了使用本书给定的数据集外,读者可以尝试自己爬取信息进行分析,微博的官方也给出了API,大家放心爬取评论就好。
首先给出一条爬取的评论的完整信息,也代表API的对象结构:
{
"comments": [
{
"created_at": "Wed Jun 01 00:50:25 +0800 2011",
"id": 12438492184,
"text": "love your work.......",
"source": "<a href="http://weibo.com" rel="nofollow">新浪微博</a>",
"mid": "202110601896455629",
"user": {
"id": 1404376560,
"screen_name": "zaku",
"name": "zaku",
"province": "11",
"city": "5",
"location": "北京 朝阳区",
"description": "人生五十年,乃如梦如幻;有生斯有死,壮士复何憾。",
"url": "http://blog.sina.com.cn/zaku",
"profile_image_url": "http://tp1.sinaimg.cn/1404376560/50/0/1",
"domain": "zaku",
"gender": "m",
"followers_count": 1204,
"friends_count": 447,
"statuses_count": 2908,
"favourites_count": 0,
"created_at&