<利用Python进行数据分析> Note 1

转载于 2017-07-02 16:39:00 发布 · 54 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/XinZhou-Annie/p/7103579.html

文章标签：

#json #python #matlab

本文介绍如何使用Python的pandas库处理JSON数据，并通过实例演示如何读取JSON文件并统计时区分布。此外，还讨论了NumPy、SciPy等库在科学计算中的应用。

NumPy 和SciPy结合完全可以替代MATLAB的计算功能（包括其插件工具箱）

NumPy, SciPy, matplotlib以及IPython这些包含在Canopy中了。

第2章引言

来自bit.ly的1.usa.gov数据

一、JSON 数据准备

首先准备一份 JSON 数据，这份数据共有 3560 条内容, name: usagov_bitly_data2012-03-16-1331923249.txt, store in Desktop

Input:

path = '/Users/zhouxin/Desktop/usagov_bitly_data2012-03-16-1331923249.txt'

open(path).readline()

Output:

时区（tz）Timezone

用pandas对时区进行计数

DataFrame 是pandas中最重要的数据结构，它用于将数据表示为一个表格。从一组原始记录中创建DataFrame是很简单的：

test.py :

# -*- coding: utf-8-sig -*-
import json
path = '/Users/zhouxin/Desktop/usagov_bitly_data2012-03-16-1331923249.txt'
records = [json.loads(line) for line in open(path)]

def get_counts(sequence):
    counts = {}
    for x in sequence:
        if x in counts:
            counts[x] += 1
        else:
            counts[x] = 1
    return counts

# from collections import defaultdict
# 
# def get_counts2(sequence):
#     counts = defaultdict(int) 
#     for x in sequence:
#         counts[x] += 1
#         return counts

def top_counts(count_dict, n=10):
    value_key_pairs = [(count, tz) for tz, count in count_dict.items()]
    value_key_pairs.sort()
    return value_key_pairs[-n:]

转载于:https://www.cnblogs.com/XinZhou-Annie/p/7103579.html

weixin_34161032

博客等级

码龄10年

138
原创

181
点赞

1233
收藏

7527
粉丝

关注

私信

热门文章

上一篇：: vert.x 结合JAX-RS

下一篇：: 麦肯锡：物联网遭过度吹嘘市场应回归理性

最新评论

东软JAVA面试题
m0_70709897: 大佬打不开了
网站开发之AngularJS篇
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。
ICMP端口号问题
爱煽风点火的吃瓜群众: 在防火墙里面用的，没有啥实际意义，状态检测防火墙要五元组，icmp没有端口，防火墙给生成一个
java.lang.reflect.InaccessibleObjectException: Unable to make
晓星如雨: 在写什么呀
波涛汹涌的黄金甲，一碗中药引发的血案！
m0_74005199: 我看懂了，王后生了杰王子，有一个太子。皇上用一碗中药杀掉了太子，杰王子，以及王后谋反的心。至于乌头虽然是慢性毒，但是它也是一味吃了头发永远乌黑的药。但是王后真的不吃。是因为她对杰王子只是利用，她并不因为杰王子年轻而让自己服下头发用远不白的慢性毒。所以杰王子谋后，很快就得到宽恕，并且自杀了。

大家在看

《苍穹之下，量子之上：一场118的时空之舞》

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。