
基础知识
文章平均质量分 52
WBerica
这个作者很懒,什么都没留下…
展开
-
DataWhale之数据分析练习5:作者信息关联
任务说明学习主题:作者关联(数据建模任务),对论文作者关系进行建模,统计最常出现的作者关系;学习内容:构建作者关系图,挖掘作者关系学习成果:论文作者知识图谱、图关系挖掘数据处理步骤将作者列表进行处理,并完成统计。具体步骤如下:将论文第一作者与其他作者(论文非第一作者)构建图;使用图算法统计图中作者与其他作者的联系;社交网络分析图是复杂网络研究中的一个重要概念。Graph是用点和线来刻画离散事物集合中的每对事物间以某种方式相联系的数学模型。Graph在现实世界中随处可见,如交通原创 2021-01-25 13:10:10 · 340 阅读 · 0 评论 -
DataWhale之数据分析练习4:论文种类分类
1 任务说明学习主题:论文分类(数据建模任务),利用已有数据建模,对新论文进行类别分类;学习内容:使用论文标题完成类别分类;学习成果:学会文本分类的基本方法、TF-IDF等;2 数据处理步骤在原始arxiv论文中论文都有对应的类别,而论文类别是作者填写的。在本次任务中我们可以借助论文的标题和摘要完成:对论文标题和摘要进行处理;对论文类别进行处理;构建文本分类模型;3 文本分类思路思路1:TF-IDF+机器学习分类器直接使用TF-IDF对文本提取特征,使用分类器进行分类,分类器原创 2021-01-21 13:04:35 · 367 阅读 · 0 评论 -
DataWhale之数据分析练习3:论文代码统计
环境和依赖包导入import re # 用于正则表达式,匹配字符串的模式import json # 读取数据,我们的数据为json格式的import pandas as pd # 数据处理,数据分析import matplotlib.pyplot as plt # 画图工具读取数据源,读取100w行数据,全部读取运行时间较长data = [] # 初始化#使用with语句优势:1.自动关闭文件句柄;2.自动显示(处理)文件读取数据异常with open("arxiv-metada原创 2021-01-18 19:03:09 · 363 阅读 · 0 评论 -
转成各个国家的标准时间
from datetime import datetimeimport timedef utc_time(site): tss1 = str(datetime.utcnow()).split(".")[0] timeArray = time.strptime(tss1, "%Y-%m-%d %H:%M:%S") timeStamp = int(time.mktime...原创 2019-01-16 14:08:41 · 749 阅读 · 0 评论 -
pickle模块个base64模块的使用
pickle模块的使用pickle模块是python的标准模块,提供了对于python数据的序列化操作,可以将数据转换为bytes类型,其序列化速度比json模块要高。pickle.dumps() 将python数据序列化为bytes类型 pickle.loads() 将bytes类型数据反序列化为python的数据类型测试 >>> import pickle ...原创 2018-09-27 17:36:27 · 285 阅读 · 0 评论 -
30个Python常用小技巧
1、原地交换两个数字x, y =10, 20print(x, y)y, x = x, yprint(x, y)10 2020 102、链状比较操作符n = 10print(1 < n < 20)print(1 > n <= 9)TrueFalse3、使用三元操作符来实现条件赋值[表达式为真的返回值] if [表达式] else [表达式为假的...转载 2018-09-19 13:11:56 · 519 阅读 · 0 评论 -
什么是解释性语言? 什么是编译性语言?
计算机不能直接理解高级语言,只能直接理解机器语言,所以必须要把高级语言翻译成机器语言,计算机才能执行高级语言编写的程序。翻译的方式有两种,一个是编译,一个是解释。两种方式只是翻译的时间不同。解释性语言的定义:解释性语言的程序不需要编译,在运行程序的时候才翻译,每个语句都是执行的时候才翻译。这样解释性语言每执行一次就需要逐行翻译一次,效率比较低。现代解释性语言通常把源程序编译成中间代码,然后...原创 2018-09-18 13:43:57 · 1290 阅读 · 0 评论 -
什么是动态语言,编程里那些事动态语言
动态语言的定义:动态编程语言 是 高级程序设计语言 的一个类别,在计算机科学领域已被广泛应用。它是一类 在 运行时可以改变其结构的语言 :例如新的函数、对象、甚至代码可以被引进,已有的函数可以被删除或是其他结构上的变化。动态语言目前非常具有活力。众所周知的 ECMAScript ( JavaScript )便是一个动态语言,除此之外如 PHP 、 R...转载 2018-09-18 13:41:41 · 5610 阅读 · 0 评论 -
当args,kwargs与位置参数和默认参数混用的情况下的排序问题
示例一、(三者顺序是:位置参数、默认参数、*args)1 def foo(x,y=1,*args):2 pass3 foo (1,2,3,4,5) // 其中的x为1,y=1的值被2替换,3,4,5都给args,即args=(3,4,5)示例二、(三者顺序是:位置参数、*args、默认参数)1.def foo(x,*args,y=1):2. pass3.foo (1,2,...原创 2018-09-18 13:31:50 · 564 阅读 · 0 评论 -
python中主要存在四种命名方式
1、object #公用方法2、_object #半保护#被看作是“protect”,意思是只有类对象和子类对象自己能访问到这些变量,在模块或类外不可以使用,不能用’from module import *’导入。#object 是为了避免与子类的方法名称冲突, 对于该标识符描述的方法,父类的方法不能轻易地被子类的方法覆盖,他们的名字实际上是classname__methodname。...原创 2018-09-18 13:23:01 · 600 阅读 · 0 评论 -
python中有哪些类型的布尔值是False
NONE;False(布尔类型)所有的值为零的数 0(整型) 0.0(浮点型) 0L(长整型) 0.0+0.0j(复数)(空字符串)""(空列表)[](空元组)()(空字典){}原创 2018-09-18 13:08:18 · 14647 阅读 · 0 评论 -
__new__和__init__的区别?
init 方法为初始化方法, __new__方法才是真正的构造函数。new__方法默认返回实例对象供__init__方法、实例方法使用。init 方法为初始化方法,为类的实例提供一些属性或完成一些动作。new 方法创建实例对象供__init 方法使用,__init__方法定制实例对象。__new__是一个静态方法,而__init__是一个实例方法。实例方法隐含的参数为类实例,而类方法隐含...原创 2018-09-18 12:56:22 · 965 阅读 · 0 评论 -
pycharm中调用函数方法自动补全p,m,c,v,F分别是什么意思
p:parameter 参数m:method 方法c:class 类v:variable 变量f:function 函数原创 2018-09-18 10:44:51 · 2931 阅读 · 2 评论