
数据分析练习题
AI悦创|编程1v1
Python一对一/编程一对一/少儿编程一对一
展开
-
「练习」分析热门标签
任务1:找出最多人想读的50本书的名称 任务2:找出这50本书对应最热门的10个标签 文件1:to_read.csv 每行两个数据,用户 id 和该用户想读的书籍 id 文件2:books.csv 书籍的各类 id,名称,作者等信息 文件3:tags.csv 每行两个数据,标签 id 和标签名称 文件4:book_tags.csv 每行三个数据,_goodreads_book_id_(和 to_read 中的书籍 id 的对应关系可以在 books.csv 里找到),标签 id,标..原创 2020-08-30 08:24:01 · 429 阅读 · 0 评论 -
「练习」统计书本的平均评分
读取文件 rating.txt 中的的数据并分析 共有 10000 本书,以数字 id 表示 每个用户的打分为1~5 每一行数据有 3 个数字:分别表示用户 ID,书本 ID,该用户对该书的打分 要求输出: 所有书本各自的平均得分 数据集链接: 本题数据集文件名称:rating.txt 本题数据链接: https://aiyc.lanzous.com/iSU8ufj79af 总数据表链接: https://www.aiyc.top/data-analysis-data-set 题目解.原创 2020-08-30 08:13:36 · 857 阅读 · 0 评论 -
「练习」Numpy 与 Pandas 读取文件速度对比
本题就是操作 Numpy 与 Pandas 读取文件,并对比速度: 数据集: rating.txt:https://aiyc.lanzous.com/iSU8ufj79af rating.csv:https://aiyc.lanzous.com/iy3upfxymba import numpy as np import pandas as pd import time start_time = time.time() data = np.genfromtxt('./rating.txt', d原创 2020-08-30 08:09:03 · 708 阅读 · 0 评论 -
数据归一化「练习」
数据归一化 博客原文:https://www.aiyc.top/811.html 使用 NumPy,下载 iris.data 数据集。仅提取 iris 数据集的第二列 usecols = [1] 做数据归一化处理 数据集链接: 本题数据集文件名称:rating.txt 本题数据链接: 蓝奏云文件链接:https://aiyc.lanzous.com/iaVCifnpl0j 在线请求链接:https://images-aiyc-1301641396.cos.ap-guangzhou.myqc原创 2020-08-16 12:37:30 · 923 阅读 · 2 评论