- 博客(3)
- 收藏
- 关注
原创 2021-01-19
【Task 03】论文代码统计今天有点别的事要做,所以先把代码和结果简略写一下了,只是跑了一遍。没有思考。(我错了)主要是第一次是用jupyterbook好不习惯啊啊啊# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import jso
2021-01-19 21:30:33
111
原创 2021-01-16
任务说明任务主题:论文作者统计,统计所有论文作者出现评率Top10的姓名; 任务内容:论文作者的统计、使用 Pandas 读取数据并使用字符串操作; 任务成果:学习 Pandas 的字符串操作;数据处理步骤与字符串处理在原始arxiv数据集中论文作者authors字段是一个字符串格式,其中每个作者使用逗号进行分隔分,所以我们我们首先需要完成以下步骤:使用逗号对作者进行切分; 剔除单个作者中非常规的字符在原始数据集中authors_parsed字段已经帮我们处理好了作者信息,可以直接使用
2021-01-16 21:26:17
184
原创 2021-01-13
Task1:论文数据统计目录1.1任务说明1.2数据集介绍1.3arxiv论文类别介绍1.4具体代码实现1.4.1导入package并读取原始数据1.4.2数据预处理1.4.3数据分析及可视化1.1任务说明任务主题:论文数量统计,即统计2019年全年计算机各方向论文数量 赛题的理解、使⽤ Pandas 读取数据并进⾏统计; 学习 Pandas 的基础操作;1.2数据集介绍 数据集来源:: https://www.kaggle.com/Cornell-.
2021-01-13 23:25:41
504
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人