
python
文章平均质量分 56
qq_35774189
这个作者很懒,什么都没留下…
展开
-
python 天数间隔计算
python 天数间隔计算原创 2022-05-14 15:59:23 · 526 阅读 · 0 评论 -
python 画折线图、柱状图、正负柱状图、堆叠图
折线图、柱状图、正负柱状图、堆叠图原创 2022-04-29 21:52:42 · 2439 阅读 · 0 评论 -
Python数据处理记录--总结
最近工作中使用Python处理数据遇到的一些知识点记录下来原创 2022-04-19 22:24:15 · 732 阅读 · 0 评论 -
NLP 搜索文本 计数词汇
基于上一篇博客,已经得到各文本的数据,现在开始对这些数据进行处理:搜索文本1、利用concordance函数来查找文本中的词:如monstrous、affection、lived2、利用similar函数查找相似文本3、common_contexts函数研究共用两个或两个以上词汇的上下文4、利用dispersion_plot函数绘制离散图计数词汇:使用len...原创 2018-11-26 20:04:09 · 320 阅读 · 0 评论 -
NLP 简单统计
1、变量名必须以字母开头,可以包含数字和下划线,名称是区分大小写的,变量名不能游空格,可以 用下划线 ( _ ) 把单词分开2、利用FreqDist寻找文本中最常见的50个词:第89行 计算whale出现的次数累积频率图计算文本中每个词的长度:fdist.keys() 只有20个不同的元素(说明只有20种不同的词长)fdist.freq(3) 表示 词长...原创 2018-11-26 22:14:39 · 306 阅读 · 0 评论 -
python 决策与控制
词汇比较运算符 函数 含义 s.startswith(t) 测试s是否以t开头 s.endswith(t) 测试s是否以t结尾 t in s 测试s是否包含t s.islower() 测试s中所有字符是否都是小写字母 s.isupper() 测试s中所有字符是否都是大写字母 s.isalpha() 测试s中所有字符是否都是字母...原创 2018-11-27 14:43:08 · 419 阅读 · 0 评论 -
数据结构 图
图的常用的两种表示:相邻矩阵和邻接表。 图是由顶点集V和边集E构成。 路径是从图中一个顶点到达另一个顶点的边的序列 路径的长度就是路径上的边的数目。 从图中的每一个顶点到其他的每一个顶点都有一条路径的话,这个图就是连通的;如果从每个顶点到其他的每一个顶点都有一条边的话,这个图就是完全的。 一个顶点的度数等于连接到它的边的数目。 连通区域是一个子图,包含了从给定的顶点所能到达的节点的集...原创 2018-11-27 22:30:59 · 207 阅读 · 0 评论 -
最短路径算法 Floyd算法 Dijkstra算法
1、Floyd算法解决的是所有成对的最短路径问题对于图中的每一个顶点,该算法都会找出从某个顶点到该顶点所能达到的任何其他顶点的最短路径构建的一个初始的距离矩阵,其单元格中包含了连接每一个顶点及其邻居节点的边的权重。当两个顶点之间没有直接的边的时候,我们会在矩阵的单元格中放置一个表示无限的值。Floyd算法的伪代码:for i from 0 to n-1 for r ...原创 2018-11-28 15:34:13 · 378 阅读 · 0 评论 -
卷积神经网络 CNN
1、feature_map=[(原图片尺寸 - 卷积核尺寸)/ 步长] + 1卷积核卷积运算是两个卷积核大小的矩阵的内积运算 卷积核的公式有很多,卷积核也称为滤波器:均值滤波器、高斯滤波器、拉普拉斯滤波器 每一层的卷积核大小和个数可以自己定义,不过一般情况下,根据实验得到的经验来看,会在越靠近输入层的卷积层设定少量的卷积核,越往后,卷积层设定的卷积核数目就越多池化层 池化层方...原创 2018-12-17 22:23:20 · 1576 阅读 · 0 评论 -
python3 爬表格数据
数据网址:http://gaokao.xdf.cn/201812/10838484.htmlhttps://www.maigoo.com/news/509088.html代码段:from bs4 import BeautifulSoupimport requestsimport csv#检查url地址 def check_link(url): try: ...原创 2019-01-17 16:10:44 · 425 阅读 · 0 评论 -
xgboost
学习xgboost github地址:https://github.com/dmlc/xgboost/tree/master/demoimport xgboost as xgbimport numpy as npimport pandas as pdnp.set_printoptions(threshold=np.inf) # 将数组数据全部输出# read in data...原创 2019-01-17 21:28:46 · 194 阅读 · 0 评论 -
xgboost model 处理 MNIST handwritten digits
参考博客:https://blog.youkuaiyun.com/sb19931201/article/details/52577592根据该博客内容,本博主运行的结果如下:原创 2019-01-21 12:29:34 · 782 阅读 · 0 评论 -
读取路径存入excel表
# -*- coding: utf-8 -*-import osfile_dir = "D:\\SHU-results-20190401"def file_name(file_dir): for root, dirs, files in os.walk(file_dir): print("root is ",root) # 当前目录路径 pr...原创 2019-04-02 11:44:20 · 199 阅读 · 0 评论 -
NLTK入门
1、下载NLTK,http://www.nltk.org/ 或者用 pip install nltk 下载2、安装完成,启动Python解释器,在提示符后面输入下面两行命令行来安装数据>>> import nltk>>> nltk.download()3、加载文本:from nltk.book import *在这个过程中遇到了很多...原创 2018-11-26 16:31:26 · 329 阅读 · 0 评论 -
正则表达式 匹配日期和时间
1、正则表达式匹配字符串,注意位数原创 2018-09-10 14:17:14 · 20399 阅读 · 1 评论 -
读取文件 problem
读取的原文:读取的代码遇到问题:1、转义字符:改成这样就好:2、编码可以改成:还可以写成:结果图参考:https://blog.youkuaiyun.com/xiaotao_1/article/details/79642399...原创 2018-09-05 14:03:10 · 200 阅读 · 0 评论 -
Python 语言精要
1. b=a 将a赋值给一个新变量b,此时a、b同时指向同一个对象,则对a进行添加一个元素,b同时也会增加赋值操作也叫做绑定(binding),实际上是将一个名称和一个对象绑定到一起2. 定义个函数如下图,按引用传递3. 动态引用,强类型语言,了解对象的类型4. isinstance可以接受由类型组成的元组,用来检查一个对象是否是某个特定类型及检查某个对象的类型原创 2018-01-22 22:39:00 · 282 阅读 · 0 评论 -
Python note
1.初识python3原创 2018-07-09 10:47:13 · 211 阅读 · 0 评论 -
接口设计
1、检查python中是否安装了turtle模块,turtle模块中提供了一个Turtle函数2、打印3、创建好一个乌龟(Turtle)之后,调用其方法,在窗口中来回移动fd的参数是移动的距离,以像素(pixel) 为单位,所以实际移动的距离依赖于显示器的分辨率Turtle对象的其他的方法包括bk(用于前进和后退)、lt和rt(用于左转和右转)、lt和rt的参数是旋转的角度,单位是度。4、封装5、...原创 2018-07-09 10:45:29 · 402 阅读 · 0 评论 -
条件和递归
1、向下取整除法操作符(//) % 求余2、布尔表达式3、条件执行4、选择执行5、条件链6、嵌套条件7、递归8、键盘输入原创 2018-07-09 18:25:19 · 187 阅读 · 0 评论 -
有返回值的函数
1、求圆的面积2、求绝对值3、比较两个数的大小4、计算两点之间的距离5、已知圆心和圆周上的一点,计算圆的面积6、布尔函数返回布尔值7、检查类型通过42-45行的测试,能确保知道n是正数或08、调试将一个大程序分解为小函数,自然而然地引入了调试的检查点。如果一个函数不能正常工作,可以考虑三种情况:(1)函数获得的实参有问题,某个前置条件没有达到(2)函数本身有问题,某个后置条件没有达到(3)函数的返...原创 2018-07-09 20:45:46 · 2877 阅读 · 0 评论 -
迭代
1、while循环2、利用循环实现“条件与递归”中递归部分的代码3、break语句:尖括号('>')来提示用户的输入,如果用户输入done,则退出循环4、平方根使用循环来尽心数值计算,以一个近似值开始,并迭代地优化计算结果。abs是计算差值的绝对值(量级)若测试float的相等,利用80行;大多数的a值,利用81行,效果是很好的...原创 2018-07-09 22:01:10 · 326 阅读 · 0 评论 -
字符串
1、字符串是一个序列2、使用for循环进行遍历3、字符串切片4、字符串是不可改变的,不能修改一个已经存在的字符串,可以新建一个字符串5、根据一个字符查找其出现在字符串中的下标6、循环和技术 第40行和44行字符串方法:upper()接收一个字符串,并返回一个全部字母都是大写的字符串操作符in : 看第一个是否是第二个的子串7、打印出word1中出现且出现在word2中的所有字母...原创 2018-07-10 10:40:31 · 859 阅读 · 0 评论 -
列表
1、列表 是值的序列 列表中的值称为元素,且可以列表可以嵌套2、列表是可变的,和字符串不同3、使用for循环遍历列表元素4、嵌套的列表被看作一个单独的元素5、列表的拼接操作符:+6、列表的切片 115行-117行7.118行 append可以在列表尾部添加新的元素sort() 将列表中的元素从低到高重新排列extend 方法接收一个列表作为参数,将其所有的元素附加到列表中8、想要把列表中所有...原创 2018-07-10 23:23:34 · 419 阅读 · 0 评论 -
字典
1、字典是一种映射:包含下标(键)和值,每一个键都和一个值相关联,键和值之间的关联称为键值对第1行:新建一个不包含任何项的字典;第2行:花括号表示一个空的字典。给字典添加新项,可以使用方括号操作符,如第3-6行;第7行为打印这个字典的结果,以冒号分隔***字典中键值对的顺序可能并不相同***,字典是利用键查找对应的值如果一个键不存在字典之中,会得到一个异常,如第8行2、len函数返回键值对的数量i...原创 2018-07-11 15:47:40 · 523 阅读 · 0 评论 -
元组
1、元组是值的一个序列,其中的值可以是任何类型,并且按照整数下标索引,但元组不可变元组是用逗号分隔,用括号括起来的,若新建元组,需在后面加一个逗号,第1行括号括起来的单独的值并不是元组,第3行;第5行为新建一个空元组2、第8行 是一个包含序列的元素的元组(序列包括字符串、列表或元组)。利用方括号操作符(下标)取得元素,第10行;第11行为切片操作元组是不可变的,所以不能修改它的元素,可以将一个元组...原创 2018-07-11 22:07:25 · 349 阅读 · 0 评论 -
文件
1、要写入一个文件,需要使用‘w’模式作为第二个实参来打开它,write方法是把数据写入到文件中,返回值是写入的字符数目,如果你再次调用write,它会在文件的结尾处添加新的数据,当写入完毕时,应该关闭文件,第8行写入的数据存储在output.txt记事本中,如下图2、在写入的内容后面加上\n,在记事本中会换行显示,如下图所示3、格式操作符% 第一个操作对象是格式字符...原创 2018-07-24 15:02:27 · 190 阅读 · 0 评论 -
类和对象
1、定义一个类 类名为Point 第110行和111行 使用句点表示法赋值,x,y称为属性2、print_point 接收一个点作为形参3、定义一个矩形类 属性有width、height及corner是一个Point对象,用来指定左下角的顶点第125行-130行 实例化一个 Rectangle对象 ,并对其属性赋值4、对象是可变的 修改矩...原创 2018-07-24 17:48:41 · 203 阅读 · 0 评论 -
python爬虫基础
1、爬虫就是一个自动从网络中获取数据的程序2、爬虫用处:新闻数据(今日头条)、机器学习(股票数据获取及分析)、网络搜索引擎的一个部件(谷歌、百度有集群搜索)3、推荐:https://learnxinyminutes.com/docs/python/4、python标准库里对HTTP的实现及其用法、正则表达式(用来解析爬取出来的数据初步分析)、多线程(提高爬虫的执行效率,分布式爬虫)、实...原创 2018-07-19 18:18:14 · 258 阅读 · 0 评论 -
python脚本出错:IndentationError: unindent does not match any outer indentation level
我写了一个python小程序,运行的时候出现了IndentationError: unindent does not match any outer indentation level的错误,经过试验,发现是tab和空格混用了,出错的地方为print(),语法本身并没有什么错误,因为我之前都使用的空格,所以就将print()之前改换成空格使其与while a原创 2017-04-08 13:58:29 · 667 阅读 · 0 评论