python进行情感分析实践(一)

本文介绍了使用Python进行情感分析的实践,包括数据获取如京东商城红酒评价、生活微博和英文推特数据集,以及词汇分析,利用SnowNLP库进行中文文本处理和情感评分。通过示例展示了如何对微博评论进行爬取和词汇评分分析,揭示了情感分析的基本流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

python情感分析

本篇博文将使用Python实现一个简单的情感分析喔!

数据获取

情感分析项目中我用到了三个数据集,分别如下:
(1)京东商城红酒评价数据集 标签数量 2 数据量 2,000
(2)生活微博数据集 标签数量 4 数据量 40,000,
(3)英文推特数据集 标签数量 11 数据量 210,000,

英文推特数据集在这里插入图片描述生活微博数据集词云
在这里插入图片描述
(需要数据集的邮箱联系吧)!
这篇基本不会用到这三个

weibo数据集获取API:

微博是我国最好的一个获取情感语料的平台之一,除了使用本书给定的数据集外,读者可以尝试自己爬取信息进行分析,微博的官方也给出了API,大家放心爬取评论就好。

首先给出一条爬取的评论的完整信息,也代表API的对象结构:

{
   
    "comments": [
        {
   
            "created_at": "Wed Jun 01 00:50:25 +0800 2011",
            "id": 12438492184,
            "text": "love your work.......",
            "source": "<a href="http://weibo.com" rel="nofollow">新浪微博</a>",
            "mid": "202110601896455629",
            "user": {
   
                "id": 1404376560,
                "screen_name": "zaku",
                "name": "zaku",
                "province": "11",
                "city": "5",
                "location": "北京 朝阳区",
                "description": "人生五十年,乃如梦如幻;有生斯有死,壮士复何憾。",
                "url": "http://blog.sina.com.cn/zaku",
                "profile_image_url": "http://tp1.sinaimg.cn/1404376560/50/0/1",
                "domain": "zaku",
                "gender": "m",
                "followers_count": 1204,
                "friends_count": 447,
                "statuses_count": 2908,
                "favourites_count": 0,
                "created_at&
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值