数据分析系列 之python中便捷数据的获取(数据获取补充)

本文介绍了如何使用Python的pandas库来读取和写入CSV及Excel文件,并演示了简单的数据处理方法,如数据加总等。此外,还提供了一个从网页抓取数据的例子。

1 怎样读取/写入csv文件数据?

import pandas as pd
#读取
df = pd.read_csv('c/test/test.csv')
#帮助信息
help(pd.read_csv)
#写入
df.to_csv('...')

#excel同理
#读取
df = pd.read_excel('c/test/test.xlsx', sheet_name = 'scores')
#计算
df['sum'] = df['Python'] + df['Math']
#写入
df.to_excel('c/test/scores.xlsx', sheet_name = 'scores')

2 读取网页中的数据?

# -*- coding: utf-8 -*-
import requests
import re
import pandas as pd

def retrieve_dji_list():
    r = requests.get('https://money.cnn.com/data/markets/nasdaq/')
    #正则表达式
    search_pattern = re.compile()
    #正则表达式模块的findall()
    dji_list_in_text = re.findall()
    #存入dji_list中
    dji_list = []
    for item in dji_list_in_text:
    	dji_list.append()
    return dji_list

#调用
dji_list = retrieve_dji_list()
djidf = pd.DataFrame(dji_list)
print(djidf)

补充资料:
数据集获取:
kaggle.com/datasets
sklearn模块的datasets
NLTK语料库
参考资料:
https://www.icourse163.org/learn/NJU-1001571005?tid=1463102441&from=study#/learn/content?type=detail&id=1240380188&cid=1261816417 用python玩转数据

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值