- 博客(15)
- 收藏
- 关注
原创 python excel数据导入与导出
虽然很简单,但是总是容易忘记。。。。。import pandas as pddata=pd.read_excel("C:/Users/Administrator/Desktop/bb.xlsx") ###读入数据data.head()data12.to_excel('C:/Users/Administrator/Desktop/aaab.xlsx') ####导出数据
2020-07-14 10:58:27
615
原创 Python爬取两个城市之间的直线距离
因需要爬取江浙沪皖地级市之间的城市距离,爬取的网址是http://www.china6636.com/。爬取代码如下:###江浙沪皖41城市代号x=[27005208,27017237,27029767,27035786,27036716,27071629,27044783,27115330,27045424,27060216, 27060379,27059992,27065633,27085865,27074128,27017808,27071103,27045640,27003122,2701
2020-05-28 15:47:53
1855
原创 python爬取2345天气网上2011年-2018年历史天气
由于学业需要,本文利用python爬取2345历史天气,爬取年份为2011年到2018年,由于网页格式以及自身编程水平有限,本文分成四个部分爬取2011~2018的历史天气,分别为:2011-2015年,201年1-2月,2016年3-12月,2017年以后。本文爬取的地区是江浙沪皖地区的历史天气。首先为2011年-2015年的天气代码如下:#####多个城市循环爬取###输入待查城市代号city0=[58362,58343,58141,58044,58238,58259,58357,58246,5
2020-05-27 15:54:18
1741
2
原创 ArcGIS从全国县界中提取江浙沪皖县界图
在实际应用中,我们通常会根据自己的研究需要裁定特定的县界图,比如我需要江浙沪皖的县界图,但是通常只能找到全国县界图,以前我都是去淘宝上花钱买,最近因为时间充裕,自己研究了一下,发现很简单,下面把制作做法分享给大家。...
2020-05-27 08:40:40
6201
转载 机器学习常见算法概述
注:本文为转载,原创文章连接如下:(非常非常感谢博主大大!!!)https://blog.youkuaiyun.com/a819825294/article/details/52275798 原创 机器学习常见算法概述 ...
2019-11-25 16:59:21
274
原创 python爬取新浪新闻——以新车为例
爬取新浪新闻时,主题词不同,网页格式也不一样,故在此选用“新车”为主题,爬取新浪新闻的标题、发布时间、链接、具体内容以及发布作者爬取网址:http://auto.sina.com.cn/newcar/index.d.html爬取代码如下:####爬取新闻标题、发布时间、新闻链接import requestsfrom bs4 import BeautifulSoupimport urll...
2019-11-01 16:05:21
452
原创 python爬取ZOL桌面壁纸图片
最近迷上了爬虫,看了一丢丢视频学习之后,开始实战,爬取图片地址:http://desk.zol.com.cn/循环爬取“风景”图片,实现代码如下:from urllib import request,errorimport rekey_name=request.quote("fengjing")##定义函数,将爬到的每一页的商品url写入到文件def savefile(data):...
2019-11-01 09:32:20
839
1
原创 决策树算法及应用
1、划分选择1.1信息增益样本集合D中第k类样本所占的比例为pk(k=1,2,……|y|),则D的信息熵定义为:Enter(D)越小,D的纯度越高。离散属性a有V个可能取值:v个分支节点包含D中所有在a上取值为a^V 的样本,记为D ^V,则信息增益定义为:信息增益越大,利用属性a进行划分的纯度提升就越大,ID3算法就是根据信息增益为准则来选择划分属性。1.2增益率信息增益...
2019-10-31 14:59:05
1253
原创 自然语言处理之序列标注(一)
隐马尔可夫模型与序列标注1、序列标注问题序列标注问题指的是给定一个序列x=x1x2……xn,找出序列中每个元素对应标签y=y1y2……yn的问题。最简单的,输入一个自然数序列,输出他们的奇偶性,按序列排成另一个序列。这时标注集为{奇,偶},标注过程如下:![在1.1序列标注与中文分词{B,M,E,S}法——B(Begin)、E(End)分别表示词语首尾;M(Middle)表示词中;S(S...
2019-10-30 09:15:03
2315
原创 pynlpir分词库报错解决办法
最近使用pynlpir分词库时,遇到了如下的报错:百度之后发现是license问题,很多百度回答都是去github上下载新的license,由于本人比较蠢,去官网上逛了很久,一直找不到下载选项,很久很久之后终于找到下载选项,但是文件太大,半天都没下载下来,emmmm……,后来经过不懈尝试,终于找到正确的下载网址:https://github.com/NLPIR-team/NLPIR/tree/...
2019-10-18 15:18:08
492
原创 python调用百度API正向、逆向解析地址
1、输入地址,获取经纬度#####读取数据import pandas as pddata=pd.read_excel('address.xlsx')data.head(5)#####创建列表z_level=[0 for i in range(0,len(data.address))]z_precise=[0 for i in range(0,len(data.address))]...
2019-10-18 14:35:54
583
原创 python去重、根据某列统计另一列频数
python去重、根据某列统计另一列频数假如有如下格式的数据,实现两个操作:(1)根据“ABC”列去重;(2)根据"jd"列统计“cun”代码如下:(1)去重data1=data.drop_duplicates('ABC') # 删除掉重复的行,在原值上直接修改len(data1)data1.to_excel('data1.xlsx')data1.head(10)结果:...
2019-10-16 21:17:22
4399
1
原创 ARCGIS绘制全国各省PM2.5浓度图操作步骤
ArcGIS新手小白一枚,经常需要帮助老师绘制一些简单的空间图,利用ArcGIS绘制全国各省的pm2.5浓度图,简单又方便,不记下来会忘记~
2019-10-16 15:31:30
18061
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人