
个人笔记
IT界的小小小学生
写文章的目标不仅是解决问题,更是帮助阅读的人或企业实现商业价值。秉持 “从解决问题出发、在实践中学习,最终创造价值”的信念,予人玫瑰手留余香!
展开
-
从零学习人工智能,开启职业规划之路!
小学生都开始接触 Python 语言了!!!我还有什么理由不努力进步!原创 2018-07-24 13:11:07 · 21860 阅读 · 57 评论 -
数学建模过程中的特征选择:scikit-learn--Feature selection(特征选择)
sklearn.feature_selection模块的作用是feature selection,而不是feature extraction。Univariate feature selection:单变量的特征选择 单变量特征选择的原理是分别单独的计算每个变量的某个统计指标,根据该指标来判断哪些指标重要。剔除那些不重要的指标。sklearn.feature_selection模块中主要...原创 2018-07-23 11:33:24 · 3643 阅读 · 0 评论 -
XGBOOST从原理到实战:二分类 、多分类
1.XGBoostxgboost是大规模并行boosted tree的工具,它是目前最快最好的开源boosted tree工具包,比常见的工具包快10倍以上。在数据科学方面,有大量kaggle选手选用它进行数据挖掘比赛,其中包括两个以上kaggle比赛的夺冠方案。在工业界规模方面,xgboost的分布式版本有广泛的可移植性,支持在YARN, MPI, Sungrid Engine等各个平台上面...原创 2018-07-17 12:49:05 · 45876 阅读 · 1 评论 -
日常电脑操作小技能篇(生活无处不精彩)
温馨提示,如果你有更好的方法欢迎留言分享大文件预览1.当我们处理大数据过程中,数据量特别的大,比如有如下文件达到800M, 使用记事本或者是Notepad均打不开。 那么我们又要查看数据,又不想写程序查看,可以在cmd中执行如下type C:\Users\lenovo\Desktop\NewShortestPathCountrywideComplete.txt操作流...原创 2018-05-29 10:17:48 · 1648 阅读 · 0 评论 -
excel里面空白的单元格如何用0去填充
excel里面空白的单元格如何用0去填充使用定位-空值功能来完成Excel参考版本:2010举例演示说明:1、选择区域2、F5-空位条件-空值3、输入0,ctrl+enter4、完成...原创 2016-12-27 10:44:49 · 5441 阅读 · 0 评论 -
markdown中实现缩进的方法
markdown中实现缩进的方法在每一行开头的时候,先输入下面的代码,然后紧跟着输入文本即可。注意有分号。半角空格:  或  全角空格:  或  不换行空格:  或  ...原创 2018-02-26 11:47:55 · 2800 阅读 · 0 评论 -
textrank算法原理与提取关键词、自动提取摘要PYTHON
首先介绍原理与概念TextRank 算法是一种用于文本的基于图的排序算法。其基本思想来源于谷歌的 PageRank算法(其原理在本文在下面), 通过把文本分割成若干组成单元(单词、句子)并建立图模型, 利用投票机制对文本中的重要成分进行排序, 仅利用单篇文档本身的信息即可实现关键词提取、文摘。和 LDA、HMM 等模型不同, TextRank不需要事先对多篇文档进行学习训练, 因其简洁有效而得原创 2017-09-19 17:42:46 · 20439 阅读 · 0 评论 -
2018个人年度工作总结与2019工作计划(互联网)
2019新的一年已经到来,如何制定个人it工作计划呢?下面是收集整理的it个人工作计划,欢迎阅读。下手方向其实无论你是否是IT行业都可以从以下5个方向入手。写好年度总结的基本要点年度工作总结时应本着实事求是的态度,尽量避谈一些形式化的东西。一篇完美的工作总结必须是因人而异,他有总结者自己的“影子”。1、统揽全局,先写大纲根据对年度的“整体”性思考,然后罗列出工作总结的“大纲”,最后...原创 2019-01-02 21:06:04 · 30603 阅读 · 3 评论 -
python 保存list数据
对于一个列表a[]:保存filename = open(‘a.txt’, ‘w’)for value in a:filename.write(str(value))filename.close()读取f= open(“a.txt”,“r”)a = f.read()f.close()以上这种方法虽然占用空间小,但是原来的list格式会被破坏。为此也可以用以下发方法,此方法可以保留...原创 2019-06-24 15:34:31 · 39385 阅读 · 0 评论 -
mac 下常用快捷键,mac启动ftp
Command + K清屏Command + T新建标签Command + M最小化窗口Command +W 关闭当前标签页Command + S 保存终端输出Command + D 垂直分隔当前标签页Command + Shift + D 水平分隔当前标签页Command + shift + {或}向左/向右切换标签Ctrl + d 删除一个字符,相当于通常的Delete键(命...原创 2019-06-20 20:35:12 · 1407 阅读 · 0 评论 -
接口压力测试:Siege压测安装、使用和说明
简介siege是一款开源的压力测试工具,可以根据配置对一个WEB站点进行多用户的并发访问,记录每个用户所有请求过程的相应时间,并在一定数量的并发访问下重复进行。下载安装环境:centos 6.4 私有服务器官网地址:http://download.joedog.org/siege/1.下载:wget http://download.joedog.org/siege/siege-4.0....原创 2019-03-01 10:07:42 · 2046 阅读 · 0 评论 -
R语言读CSV、txt文件方式以及read.table read.csv 和readr(大数据读取包)
首先准备测试数据*(mtcars)分别为CSV. TXT**2018博客之星评选,如果喜欢我的文章,请投我一票,编号:No.009** [支持连接](https://blog.youkuaiyun.com/HHTNAN/article/details/85330758) ,万分感谢!!! R语言数据分析案例:直通车read.table 默认形式读取CSV(×)与TXT(效果理想)...原创 2017-01-24 12:23:26 · 83778 阅读 · 4 评论 -
查找python项目依赖并生成requirements.txt与安装,指定路径
Python项目中必须包含一个 requirements.txt 文件,用于记录所有依赖包及其精确的版本号。以便新环境部署。 我的是python -m 指定python类型,如果你只有一个版本直接用pip freeze >requirements.txt即可 之后查找相应的数据 指定路径输出, 安装所需要的文件 执行命令,如果指定某个虚拟环境的python,同上指定 pi原创 2018-01-12 12:06:24 · 5635 阅读 · 2 评论 -
python 下利用os模块创建目录以及巧妙使用if not os.path.exits()创建
一、单独使用os.makedirs(path,mode=0o777)import ospath='d\\test'os.makedirs(path,0755)print('路径被创建')二,循环创建path=base_path+'\\'+"ciliylist[i]"if not os.path.exists(path) os.makedirs原创 2017-07-13 00:34:55 · 10144 阅读 · 0 评论 -
python strip()函数 删除字符串中无空白字符或者是无用字符
函数原型声明:s为字符串,rm为要删除的字符序列s.strip(rm) 删除s字符串中开头、结尾处,位于 rm删除序列的字符s.lstrip(rm) 删除s字符串中开头处,位于 rm删除序列的字符s.rstrip(rm) 删除s字符串中结尾处,位于 rm删除序列的字符注意:1. 当rm为空时,默认删除空白符原创 2017-07-03 15:49:41 · 4284 阅读 · 0 评论 -
Python笔记从html中提取字段
def fun(): # url = 'http://quote.eastmoney.com/sh600010.html?from=BaiduAladdin' url_total = 'http://api.map.baidu.com/place/v2/search?q=景区&page_size=20&page_num=1®ion=白山市&scope=2&output=jso原创 2017-06-07 21:29:25 · 3590 阅读 · 0 评论 -
python 报错'gbk' codec can't encode character '\ue5d1' in position 0:
在网络怕爬虫过程中遇到,编码错误'gbk' codec can't encode character '\ue5d1' in position 0: illegal multibyte sequenceresponse = requests.get(url)html_uid = response.text# name=html_uid["result"]['name']# pat原创 2017-06-17 16:08:35 · 3485 阅读 · 0 评论 -
Python基本常用包整理(data analysis and machine learning),附查询包版本语句
python 数据分析模块(Numpy、Scipy、Scikit和Pandas等)python进行机器学习(tensorflow)一、①NumpyPython科学计算的基础包②Pandas提供了大量处理结构化数据的数据结构和函数,它是使Python成为强大的数据分析工具的最重要的工具③Matplotlib用于绘图的Python库④SciPy包含了一系列解原创 2017-05-30 20:28:27 · 4505 阅读 · 0 评论 -
基于R语言利用QQ群进行数据挖掘案例整理
利用QQ群进行数据挖掘案例,数据源来源于2016年12-2017年大致一个月的QQ群基本数据,通过对聊天内容的分析,了解QQ聊天群资料了解时间,人群以及关键词,并构建相应图表、云图等,下图为本人所在提取的QQ群: 以下是R代码部分:file.data<-scan("C:/Users/admin/Desktop/数据挖掘机器学习R-hive.txt",what="",sep=...原创 2017-01-19 14:13:49 · 5012 阅读 · 0 评论 -
使用selenium模块模拟浏览器爬去网页,并进行点击定位内容笔记
针对模拟浏览器采用。webdriver.Firefox()火狐浏览器模拟Windows系统解决办法如下:1、下载geckodriver.exe:下载地址:https://github.com/mozilla/geckodriver/releases请根据系统版本选择下载;(如Windows 64位系统)2、下载解压后将getckodriver.exe复制到Fir原创 2017-06-26 15:17:31 · 2597 阅读 · 0 评论 -
python 多进程设置 整理版本1
在Python中,实现多进程是比较容易的。我们可以使用multiprocessing进行进程的创建,比如说 import multiprocessing as mp p = mp.Process(target=run_proc, args=('fireling',), name='Run_procProcess') p.start() p.join()这样就创建了一个进程,用原创 2017-07-18 15:19:53 · 728 阅读 · 0 评论 -
Eviews(8)进行线性回归(ols一元)与格兰杰(Granger)因果关系检验操作步骤
使用EViews软件进行OLS估计参数,建立线性回归模型,同时得到模型的拟合图和残差图。点击proc->Make Model,弹出Model窗口。得到回归方程。 演示数据为股票数据:上证指数与微博情感分析处理后的大V指数数据之间的回归分析,与格兰杰因果检验(Granger),这里只记录操作流程,至于检验解读,后期有时间在补上、OLS估计参数,建立线性回归模型1.导入数据,建立方程 2.数据上原创 2018-01-03 14:29:28 · 21729 阅读 · 0 评论 -
汉语树状图:暂时保存网址与任务调度(apscheduler)
http://www.hankcs.com/nlp/corpus/chinese-treebank.html#h2-8原创 2017-09-19 17:38:53 · 759 阅读 · 0 评论 -
程序员一事无成,奈何桥上走一走
在公司认真干活 下了班努力学习 生活却毫无起色 忙忙碌碌却换来庸庸碌碌 这到底是为什么? 我究竟差在哪里?!别着急, 看看下面的故事中有没有你的身影01 我要做一个应用,在APPSTORE上线,你觉得会火吗?02 我用下班时间做了一个内容网站, django+jquery+nginx, 域名和服务器都弄好了,来给你看看。 你看这里的自适应布局,我研究了一个星期; 你看这里的动转载 2017-11-30 16:31:41 · 1047 阅读 · 0 评论 -
字节码:ASCII编码:单字节编码,ANSI编码:多字节编码,UNICODE编码:宽字节编码
字符字节与编码字符是人们常用的一些记号,比如”1”, “汉”, “お”,”℃”等等,包括各种语系的语言和一些符号都可以被称为字符。 字节是计算机存储数据的存储单元,是一个8位的二进制数,所以最多只能表示256个数字(0-255)。 编码是大家对计算机如何使用字节来表示一个字符的约定,可分为ASCII编码,ANSI编码(本地化编码),UNICODE编码(国际化编码)三种。1.ASCI...原创 2017-09-27 18:17:46 · 5111 阅读 · 0 评论 -
常用行或者列的对应解释与名称与ASCII码整理
常用行或者列的对应解释与名称与ASCII码整理原创 2017-09-19 11:29:41 · 1407 阅读 · 0 评论 -
python pandas.read_csv参数整理,读取txt,csv文件
pandas.read_csv参数整理 读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.Lo原创 2017-07-24 14:01:08 · 5214 阅读 · 0 评论 -
python 如何设置多线程
和多进程的思路类似,我们也可以实现对线程的创建,在Python中,使用threading包实现。参数如下: 构造方法: Thread(group=None, target=None, name=None, args=(), kwargs={}) group: 线程组,目前还没有实现,库引用中提示必须是None; target: 要执行的方法; name: 线程名;原创 2017-07-18 15:46:00 · 2609 阅读 · 0 评论 -
R语言读CSV、txt文件方式以及read.table read.csv 和readr(大数据读取包)
首先准备测试数据*(mtcars)分别为CSV. TXTread.table 默认形式读取CSV(×)与TXT(效果理想) ①> test<-read.table("C:/Users/admin/Desktop/test.txt",header = F)Error in scan(file = file, what = what, sep = sep, quote = quote, d原创 2017-07-18 15:35:43 · 13613 阅读 · 0 评论