
python
文章平均质量分 73
饮马长城窟
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
NLP知识笔记一
1 自监督学习 2 自监督 词表示学习 3 word2vec 分布式假设: 语义相近的句子之间,应该具备相近的空间向量, 紧密的关系。 4 句子的编码模型Language Modeling 5 自回归,自训练模型原创 2022-07-06 15:16:03 · 304 阅读 · 0 评论 -
KMeans聚类分析实战——如何把城市划分成不同的种类
问题背景:某业务有以下几个考核城市的指标, (如出车率,这里不详细介绍)现在要对全国所有的城市按照上述指标进行分类, 比如表现好的,表现差的,那么问题来了,我应该分为几类呢, 是分3类还是分7类?谁是好的那一类, 谁是差的那一类呢?土豪回答: 拍脑袋决定个目标值, 都达到就是好的那一类, 至于分几类,就好中坏吧!作者说: 其实也可以,但是我们还可以使用聚类分析的方式, 评估分为几类,以及如何分类更合适。第一步:数据预处理数据集: df(pandas.datafr...原创 2021-09-13 16:58:28 · 4885 阅读 · 2 评论 -
xgboost解决业务问题实践——司机流失预测模型
声明: 文章所引用的数据禁止用于商业用途业务需求描述:某部门今年的核心指标是司机留存率, 司机留存是指司机有完单 。 所以为了提高司机留存,需要预测出下周哪些司机完单量是0 , 从而城市的同学及时干预,促进司机完单, 提高司机留存率。所以本需求简述为:给你91万司机, 滴滴数据库的数据随便取,但是必须是第N周的数据, 请预测第N+1周,哪些司机没有完单量。下面是本次建模的基本流程第一步:确定特征如何司机下周不干了, 他这周有什么行动表现吗, 或者这周发生了什么...原创 2021-09-13 16:40:30 · 1401 阅读 · 4 评论 -
Python+Flask+ngrok调度刷新echarts数据并部署
①获得公众网络可以访问的网址下载注册ngrok,名字是不是很难记, 你rok哥, ngrokhttps://ngrok.com/download这里下载安装然后去这里注册一个你rok哥的账号,我直接用自己的github账号绑定了,我们的目的是要那个token这里https://dashboard.ngrok.com/auth/your-authtoken这是我的token1nnIwp751ucpJXj8WNwjWMPlzyk_**uHNvHCks3ePJfHTruoU② ...原创 2021-01-31 00:36:01 · 558 阅读 · 1 评论 -
python对用户评价内容进行语义情感分析
使用 QQ 号登陆腾讯云官网 https://www.qcloud.com/, 在管理中心,获取的 SecretId 和 SecretKey。背景:用户在点评平台上的评价文本内容,有时候感情色彩和打的分值并不相同,为了更准确的反映用户的感情色彩我们获取文本内容后,通过腾讯的语义分析平台进行感情色彩分析,得到两个分值,positive,negative为后面更深入的感情分析做铺垫。以...原创 2019-02-25 20:48:01 · 6154 阅读 · 2 评论 -
基于KNN的分类模型-预测美团外卖城市等级
需求介绍美团有自己的城市等级,外卖依据其业务体量,重新划分了外卖的城市等级。这个城市根据其业务情况来划分的,比较详细。现在有以下样本数据。city_name city_level pnum ddl 临汾 D2 ** ** 南京 A ** ** 洛阳 C1 ** ** 无锡 B1 ** ...原创 2019-03-01 10:15:42 · 1952 阅读 · 0 评论 -
地图可视化方案优缺点总结
地图可视化实现方式:excel——power map :优点 :方便易用,热力图调节比较方便,视频发布缺点:定位不是很准,无法到经纬度,发布的话,线上被封死了。echarts:优点:高度可调,基本上可以按照你想要的样子定制。交互方案多,效果好,适合做大屏缺点:数据吞吐量不大,有开发成本,部分js基于google国内无法访问。没有和数据处理工具集成(pyechart...原创 2019-03-12 08:57:40 · 6344 阅读 · 1 评论 -
python 安装impala报错及解决办法
from impala.dbapi import connect执行的时候报connect找不到 ,如果只 pip安装impyla是不行的.https://github.com/cloudera/impyla 官网可以看到依赖的包DependenciesRequired: Python 2.6+ or 3.3+ six, bit_array th...原创 2019-07-23 17:43:03 · 13168 阅读 · 2 评论 -
Python使用Flask实现文件上传和访问
安装: 在pycharm里面新建一个虚拟环境的工程pip安装(本次安装的版本 是0.10.1 python版本是2.7 )如何copy依赖安装包?pip freeze >requirements.txtpip install -r requirements.txt新建文件夹,static ,templates新建一个网站服务:#!/usr/b...原创 2019-08-25 18:49:15 · 2711 阅读 · 0 评论 -
python绘图工具plotly研究
plotly功能比较全,传统如matplot更多的是面向基础绘图组件的编辑。大部分情况下,我们更在乎的是可视化展现效果,因此plotly这种快速,漂亮,简单的可视化解决方案挺不错。但是呢,plotly也会有比较坑的地方,比如你要注册账户生成apikey,使用前必须写: plotly.tools.set_credentials_file(username='user_name', api_...原创 2019-02-13 14:37:07 · 5411 阅读 · 4 评论 -
python-地图可视化组件folium
folium是python的一个用来绘制地图,并在地图上打点,画圈,做颜色标记的工具类。简单易学,和pandas可以很好的融合,是居家必备良品。一 基本功能演示import foliumimport webbrowserm=folium.Map(location=[40.009867,116.485994],zoom_start=10) # 绘制地图,确定聚焦点folium.Mar...原创 2019-02-11 15:19:03 · 42312 阅读 · 17 评论 -
python机器学习scikit-learn线性回归及决策树分类
一 安装scikit-learn 依赖numpy,SciPy,mkl 如果包来源不同,有的使用whl,有的使用pip官方安装,会造成执行程序的时候报错,找不到模块。解决办法是,卸载所有的包,统一来源,重新安装。插播一个神奇的网站:http://sklearn.apachecn.org/#/ 二 广义线性回归模型2.1 简单的实例-二元一次方程拟合目前有3列数,已知x1...原创 2019-02-16 21:21:16 · 1342 阅读 · 2 评论 -
Python数据结构
A列表:a=['安徽','浙江','福建']相同数据类型,并且通过0,1,2,3索引可以引用值.函数: print()len()append()insert() 插入extend() 复制+ 合并del a[] 删除reverse()遍历: a = ['a','b', 'c']for i in range(len(a)):原创 2017-03-08 22:07:12 · 229 阅读 · 0 评论 -
Python文件操作
A接收用户输入,input函数=input("提示信息")输出数据print 函数%s 字符串%d 数字B打开文件=open(文件地址,r/w/r+,Buffer).close() 关闭文件读取文件内若能.read()readlines/readline原创 2017-03-11 16:04:16 · 232 阅读 · 0 评论 -
pymysql访问mysql数据库并且plotly实现可视化
①python和mysql数据库的交互 MysqlDb和pyMysql,推荐使用后者官方文档:http://pymysql.readthedocs.io/en/latest/user/examples.html pymysqlimport pymysql.cursorsconn=pymysql.connect(host='127.0.0.1',port=3306,user='root',pa原创 2017-07-12 22:51:18 · 2782 阅读 · 0 评论 -
scikit-learn对天气数据进行回归分析
一:实验背景: 结合《python数据分析实战》里面的方法,对山东的十个城市的6月17日的气温进行收集,分析气温和距离海岸线距离(以下简称s)的关系. 用到的库 matplotlib 库画出图像 scikit-learn 库对数据进行回归分析 numpy 库对数据进行切片 工具:pycharm 数据:高密,莱阳等十个地区的气温数据,6月17日当天分时段的温度 二 单城市温度可视化原创 2017-07-17 21:05:17 · 3273 阅读 · 0 评论 -
BeautifulSoup初体验
欲学爬虫,scrapy是python的重点,scrapy是框架,核心还是解析html元素,这方面专业的还是BeautifulSoup。 这是官方文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#id9 多看官方文档,多练习,基本上可以掌握的很清晰! ①实战案例 1,1配置模拟浏览器from bs原创 2017-08-03 22:30:47 · 592 阅读 · 0 评论 -
scrapy爬虫框架结合BeautifulSoup
①安装scrapy pip install scrapy 依赖的包 python-lxml python-dev libffi-dev原创 2017-08-10 23:00:15 · 2872 阅读 · 1 评论 -
maplotlib.pyplot学习笔记
参见 online guide:https://matplotlib.org/tutorials/index.html代码解析:import matplotlib.pyplot as pltimport numpy as npx=np.arange(0,10,0.2)y=np.arange(0,10,0.2)plt.figure(1,figsize=(9,3)) #定义画布尺...原创 2019-01-13 17:57:06 · 402 阅读 · 0 评论 -
numpy功能手册
numpy原创 2019-01-26 17:08:42 · 1938 阅读 · 0 评论