- 博客(27)
- 收藏
- 关注
原创 快排实现--
# -*- coding:utf-8 -*-def partition(li,left,right): """ :param li: 列表 :param left: 左边的元素 :param right: 右边的元素 :return:mid-中间元素的下标 如果右边指针<temp -- 令左指针指向的值=右指针指向值 如果左边指针>temp -- 令右指针指向的值=左指针指向值 当左右指针相等时 -- 结束,返回中间值,即le
2021-08-14 15:35:20
156
原创 leetcode(剑指OFFER)python题解记录1,2
1.用两个栈实现队列解法1:class CQueue: def __init__(self): self.stack1 = [] self.stack2 = [] def appendTail(self, value: int) -> None: self.stack1.append(value) def deleteHead(self) -> int: """ 先入先出-- 1全部
2021-08-14 14:25:44
148
原创 easyconnect连接不上解决办法
easyconnect连接不上显示:无法连接服务器,请检查网络1.可能是网址前面没有加https://2.尝试右键管理员登陆
2021-08-09 16:28:31
19409
3
原创 怎么在pypi中快速找到旧版本的python包
https://pypi.org/project/<package>/#history例如:https://pypi.org/project/django-filebrowser-no-grappelli/#history
2021-06-03 15:17:39
1439
原创 TensorFlow报错: AttributeError: module ‘tensorflow_core._api.v2.train’ has no attribute ‘Optimizer‘
TensorFlow报错:AttributeError: module ‘tensorflow_core._api.v2.train’ has no attribute 'Optimizer‘ 解决办法:将tf.train.Optimizer改为:tf.compat.v1.train.Optimizer 成功
2021-06-02 09:25:54
3249
原创 excel制图时y轴数据全为0
数字左上角有个三角形,说明你的单元格格式是文本,就是以文本形式存储的数字,所以你的散点图建不了。由于该表的单元格里的数字是文本的原因,插入一列,设置为数字,然后把为0的那一列,用选择性粘贴(只选数值)粘贴到你插入的那一列中试试,不行的话,可再建一个文档,用选择性粘贴,只选数字,再制图。...
2021-03-11 09:43:19
3844
原创 爬取佛山教育网上各中小学的学校性质和办学类型
网址链接:http://xuexiao.51sxue.com/slist/?t=2&areaCodeS=4406爬取内容:# -*-coding=utf-8-*-# @Time : 2021/3/9 10:43# @Author: Aymo# @File: banxueleixing.py# @Software: PyCharmimport requestsfrom bs4 import BeautifulSoupimport bs4import refor k.
2021-03-09 16:45:55
162
原创 数分1:探索性数据分析
# 加载import numpy as np import pandas as pddf = pd.read_csv('train.csv') df.head(3)df = pd.read_csv(‘’)#读取数据每1000行为一个数据模块,逐块读取chunker = pd.read_csv('train.csv', chunksize=1000)将表头改成中文,索引改为乘客ID对于某些英文资料,我们可以通过翻译来更直观的熟悉我们的数据 PassengerId => 乘客ID
2020-08-19 21:00:36
192
原创 leetcode1分治
主要思想分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破(一般是同种方法),将已经解决的子问题合并,最后,算法会层层合并得到原问题的答案。分治算法的步骤分:递归地将问题分解为各个的子问题(性质相同的、相互独立的子问题);治:将这些规模更小的子问题逐个击破;合:将已解决的子问题逐层合并,最终得出原问题的解;分治法适用的情况原问题的计算复杂度随着问题的规模的增加而增加。原问题能够被分解成更小的子问题。子问题的结构和性质与原问题一样,并且相互
2020-08-19 20:49:43
105
原创 爬虫笔记
from bs4 import BeautifulSoupimport requestsimport bs4def getHTMLText(url): try: r = requests.get(url,timeout = 30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return "".
2020-07-23 13:51:16
155
原创 pandas文本数据
文本数据string类型的性质string与object的区别① 字符存取方法(string accessor methods,如str.count)会返回相应数据的Nullable类型,而object会随着缺失值的存在而改变返回类型;② 某些Series⽅法不能在string上使⽤,如 Series.str.decode(),因为存储的是字符串而不是字节;③ string类型在缺失值存储或运算时,类型会广播为pd.NA,而不是浮点型np.nan;拆分与拼接str.split方法expand
2020-06-27 00:22:45
125
原创 pandas基础学习-Task06缺失值处理
第6章 缺失数据import pandas as pdimport numpy as npdf = pd.read_csv('data/table_missing.csv')df.head()一、缺失观测及其类型了解缺失信息(a)isna和notna方法对Series使用会返回布尔列表df['Physics'].isna().head()0 False1 False2 False3 True4 FalseName: Physics, dt
2020-06-23 23:22:16
135
原创 CV入门(街景字符编码识别)笔记(四)模型集成
集成学习方法在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boosting,同时这些集成学习方法与具体验证集划分联系紧密。由于深度学习模型一般需要较长的训练周期,如果硬件设备不允许建议选取留出法,如果需要追求精度可以使用交叉验证的方法。在深度学习中本身还有一些集成学习思路的做法,值得借鉴学习:1 DropoutDropout可以作为训练深度神经网络的一种技巧。在每个训练批次中,通过随机让一部分的节点停止工作。同时在预测的过程中让所有的节点
2020-06-02 23:07:18
215
原创 CV入门(街景字符编码识别)笔记(四)模型训练与验证
1.导包import os, sys, glob, shutil, jsonos.environ["CUDA_VISIBLE_DEVICES"] = '0'import cv2from PIL import Imageimport numpy as npfrom tqdm import tqdm, tqdm_notebookimport torchtorch.manual_seed(0)torch.backends.cudnn.deterministic = Falsetorch.
2020-05-31 11:52:05
247
原创 Python学习笔记
1.glob.glob(pathname)import glob#获取指定目录下的所有图片print (glob.glob(r"/home/qiaoyunhao/*/*.png"),"\n")#加上r让字符串不转义#获取上级目录的所有.py文件print (glob.glob(r'../*.py')) #相对路径
2020-05-25 12:03:41
130
转载 openCV踩坑记1--读取图像数据失败cv2.imread(image_dir)
转自知乎用OpenCV读取图像数据img_bgr = cv2.imread(image_dir)失败的原因:1、路径中不能有中文2、图像的名字不能有中文3、绝对路径调用方式,要双反斜杠image_dir='D:\\Documents\\GitHub\\my_OpenCV\\note_Machine Learning for OpenCV\\data\\longmao.jpg'img_bgr = cv2.imread(image_dir)4、绝对路径调用方式,要加‘r’image_di
2020-05-21 21:12:04
3477
原创 CV入门(街景字符编码识别)笔记(三)
使用Pytorch框架构建CNN模型,并完成训练定义模型# 定义模型class SVHN_Model1(nn.Module): def __init__(self): super(SVHN_Model1, self).__init__() # CNN提取特征模块 self.cnn = nn.Sequential( nn.Conv2d(3, 16, kernel_size=(3, 3), stride=(2, 2)),..
2020-05-20 17:56:52
208
原创 CV入门(街景字符编码识别)笔记(二)
1 数据读取在Python中有很多库可以完成数据读取的操作,比较常见的有Pillow和OpenCV。1.1 PillowPillow是Python图像处理函式库(PIL)的一个分支。Pillow提供了常见的图像读取和处理的操作,而且可以与ipython notebook无缝集成,是应用比较广泛的库。1.2 OpenCVOpenCV是一个跨平台的计算机视觉库,最早由Intel开源得来。OpenCV发展的非常早,拥有众多的计算机视觉、数字图像处理和机器视觉等功能。OpenCV在功能上比Pillow更加
2020-05-20 17:49:59
246
原创 CV入门(街景字符编码识别)笔记(一)
1.配置环境第一天肯定是先配置环境咯。又到了我最讨厌的下包时刻。我用的是Pycharm,需要下一个pytorch,试了在仓库里下,老说我pip版本不对,更新了版本,换了编译器路径,怎么都不行。最后还是pip安装成功的:pip3 install torch==1.2.0+cpu torchvision==0.4.0+cpu -f https://download.pytorch.org/whl/torch_stable.html然后成功了(也试了好多次,下包真是一件需要耐心的工作了)然后pip
2020-05-20 14:55:55
317
原创 pycharm的虚拟解释器解释
Python的代码运行需要一个运行环境,所要使用的第三方包也在这里进行管理。在创建Python项目的时候,pycharm可以选择所需要使用的虚拟环境,这次介绍使用默认的Virtualenv虚拟运行环境可以将项目分离,每个项目可以拥有一个独立的运行环境,当然你可以让多个项目公用一个虚拟环境在Location中填写项目路径、项目名;第二个Location为虚拟环境的路径在Base interpreter下拉框中选择Python解释器;勾选Inherit global site-packages可.
2020-05-20 11:24:10
966
原创 爬虫(四):腾讯新闻爬取
task4了解ajax加载通过chrome的开发者工具,监控网络请求,并分析用selenium完成爬虫具体流程如下:用selenium爬取https://news.qq.com/ 的热点精选import timefrom selenium import webdriverdriver=webdriver.Chrome(executable_path="D:\chromedrive...
2020-04-27 21:36:26
872
原创 爬虫(三):Session和cookie、代理、selenium自动化
Task03:session和cookie、代理、selenium自动化 拔高:丁香园留言板爬取(2天)
2020-04-24 21:42:59
401
原创 机器学习(三):EM算法
Task03:EM算法(2天)理论部分相关概念极大似然估计法贝叶斯估计方法EM基本原理E步M步推导、证明高斯混合分布练习部分算法实现
2020-04-24 21:42:04
625
原创 机器学习(二):朴素贝叶斯基本原理
Task02:朴素贝叶斯理论部分相关概念生成模型判别模型朴素贝叶斯基本原理条件概率公式乘法公式全概率公式贝叶斯定理特征条件独立假设后验概率最大化拉普拉斯平滑朴素贝叶斯的三种形式高斯型多项式型伯努利型极值问题情况下的每个类的分类概率下溢问题如何解决零概率问题如何解决sklearn参数详解练习部分利用sklearn解决聚类问题。sk...
2020-04-23 23:53:24
672
原创 爬虫(二):bs4和正则表达式
Task02:bs4、xpath和正则表达式0.前言小咸鱼又来打卡啦~今天主要从两个方面展开我的学习记录。- >见大标题1.BeautifulSoup名叫美丽汤,是一个库,继requests之后的第二个库。什么作用呢,大概意思是说,它可以使得无序的html源码变得有序起来,比较有层次感。官方:Beautiful Soup:解析HTML页面信息标记与提取方法首先安装也比较...
2020-04-23 22:53:49
1060
原创 机器学习(一):线性回归算法的评测方式、R^2
Task01:线性回归模型建立:线性回归原理、线性回归模型学习策略:线性回归损失函数、代价函数、目标函数算法求解:梯度下降法、牛顿法、拟牛顿法等线性回归的评估指标sklearn参数详解练习部分基于线性回归的房价预测问题利用sklearn解决回归问题sklearn.linear_model.LinearRegressionps:很多东西还没有时间学到。只把自己理解的东西写...
2020-04-21 22:41:02
1392
原创 Python爬虫(一):http、html、api及request-get的基础知识大杂烩
任务清单万事开头难。 了解http基础, html基础, 尝试使用request-get爬取豆瓣电影信息, 了解api的使用,Task01: html等有关知识, api使用, request-get使用0.前言1.Http基础、Html基础从http和html开始讲起,是由于本身爬虫的原理就是从网页出发,我们的数据来源是网页,去提取网页中的有用信息。而爬虫是指模拟...
2020-04-21 19:49:12
1240
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人