- 博客(88)
- 资源 (25)
- 收藏
- 关注
原创 Linux搜索文件
Linux搜索文件常用的相关命令包括:whereis, which , find 和locate。whereis 简单快速并非从磁盘中直接查找,而是直接从数据库中查询。只支持二进制文件(-b),man帮助文件(-m)和源代码文件(-s)。locate 快而全命令可以用来递归查找指定目录下的各种文件类型。通过/var/lib/mlocate/mlocate.db查找,该数据库每天自动更新一...
2019-04-06 16:51:21
7689
1
原创 Linux工作环境的搭建顺序
根据日常工作总结经验,按照如下顺序来配置自己的linux工作环境较为快捷。首先考虑当前用户是否要加入root组 (/etc/sudoers)配置网络配置浏览器并导入书签,配置输入法配置oh-my-zsh和terminal 一个好的shell可以为工作加速很多。配置开发编译环境 (Java, Python, Maven, Git…)配置开发IDE (Idea, Pycharm, ...
2018-12-21 23:48:32
795
原创 整理一些用Pandas进行数据预处理的操作
读入数据读入部分列,自动处理千分位符column_num = [x for x in range(13,35)]df = pd.read_csv('???.csv',encoding='gbk',thousands=',',usecols=column_num)删除空值行针对部分列df = df.dropna(axis=0, how='any',subset=[A','B...
2018-08-28 09:46:11
2874
原创 离线安装python依赖
部署环境的时候,遇上封闭环境。总会有安装依赖的需求,这个时候必须得有个python第三方包的list,一般放在requirements.txt。1.生成requirements.txt的方法情形1如果一个项目使用时virtualenv环境,pip freeze 就可以解决进入虚拟环境envXpip freeze > requirements.txt将包依赖信息保存在requir
2018-01-05 15:43:27
5024
原创 Spark-SQL
Spark-SQL1.直接通过脚本执行注意指定使用的资源情况。 spark-sql –executor-cores 1 –executor-memory 2g2.采用Beeline工具执行(mr用户)beeline -u jdbc:hive2://localhost:18000 -n mr HiveQL官方语法文档 https://cwiki.apach
2018-01-05 10:51:19
451
原创 RapidMiner调试方法
打开RapidMiner安装目录 在RapidMiner-Studio.bat中把”%JAVA%” %JVM_OPTIONS% -cp “%RAPIDMINER_HOME%”\lib*;”%RAPIDMINER_HOME%”\lib\jdbc* com.rapidminer.launcher.GUILauncher %CMD_LINE_ARGS% 替换为 “%JAVA%” %JVM_OPTIO
2016-10-26 11:13:13
2163
原创 Python中文自然语言处理-NLTK 学习笔记1 chapter1
from nltk.book import **** Introductory Examples for the NLTK Book ***Loading text1, ..., text9 and sent1, ..., sent9Type the name of the text or sentence to view it.Type: 'texts()' or 'sents()' to
2016-10-21 17:39:37
2368
原创 添加已有项目到github
前提准备配置好认证秘钥–保证本地和远程建立安全连接准备工作新建repository,可以在github网站上直接新建或者使用windows github工具。总体思路(推荐)1,在github上创建一个空项目 然后clone这个项目到本地 2,将本地要上传的项目 放到clone的项目中,然后提交到github具体操作在github windows工具中使用git Bash打开项目,使用cd命令进
2016-02-25 10:39:59
1059
转载 JAR打包的误区:第三方包的嵌套打包
原文地址:http://blog.youkuaiyun.com/zwx19921215/article/details/24368099今天弄明白一个关于JAVA项目中JAR打包的问题。我们有时可能会把自己的项目做成第三方包给别人使用,但是同时我们自己的项目又引用了其他已有的第三方包,在打包的时候,我们经常可能自作聪明地将自己引用的第三方包全部封装在项目根目录下的某个folder下(如lib/
2016-01-13 15:42:32
1042
转载 ln 命令
ln是linux中一个非常重要命令,它的功能是为某一个文件在另外一个位置建立一个同步的链接.当我们需要在不同的目录,用到相同的文件时,我们不需要在每一个需要的目录下都放一个必须相同的文件,我们只要在某个固定的目录,放上该文件,然后在 其它的目录下用ln命令链接(link)它就可以,不必重复的占用磁盘空间。
2016-01-13 13:59:36
571
原创 《Web Scraping with Python》读书笔记
《Web Scraping with Python》 – Ryan Mitchell 2015年6月英文第一版,是我看到的第一本专门介绍python爬虫的书籍。本文并不记录详细的实验记录,事实上我也并没有花时间这样做–时间有限。简要记录该书的主要内容和思路。
2016-01-12 15:31:13
1198
原创 maven向本地仓库导入官方仓库没有的jar包
提要:通常maven项目依赖本地其他编译出的jar包时,需要先导入本地仓库测试(而不是导入中央仓库)。本文简要记录方法。情境:本地项目A依赖本地项目B、C编译出的jar包。 解决思路: 1.先编译出B、C对应的jar包 2.将B、C编译出的jar包导入本地仓库 3.编译项目A 通过并生成需要的jar包
2016-01-08 14:28:09
3677
原创 JavaScript入门经典 学习笔记
#读书目标1.掌握基础JS语法2.了解JS常识,比如内置对象,浏览器对象3. JS事件处理机制备注:以后再单独研究JS框架
2016-01-07 15:56:51
1477
原创 《图解HTTP》读书心得
读书初衷1.最近开发nutch网页解析插件遇到不少网页返回状态码让我在意。 2.对一些需要2次请求的页面的参数意义不明。 3.据说scrapy爬HTTPS会遇到困难,这东西究竟什么鬼?整理一下对我有用的知识点,不感兴趣的暂时没有细读。
2015-12-23 15:17:51
855
原创 读书是进步的源泉 | 实践是前进的基石
制定读书清单 和每月阅读的书籍时,要用SMART原则衡量。除了比较简单的读物,应该附上读书笔记。未读书单《Python自然语言处理》 《社交网站的数据挖掘与分析》 《利用Python进行数据分析》 《高效能人士的七个习惯》史蒂芬.科维 《聆听音乐》克雷格.怀特 (ing) 《Head First Python》web部分-Paul Barry (ing) 《失控:全人类的最终命运和结局》
2015-12-07 17:43:42
803
原创 中关村在线ZOL搜索页面:找出值得抓取的host
现需要获取某个论坛的帖子的url。并且需要更具获取的url的统计情况,对出现比较多的url提供解析功能。本文主要对统计部分的功能进行记录。以中关村在线的搜索结果页面为例,要获取华为和小米搜索结果的前5页进行统计。
2015-12-07 14:03:06
1407
原创 Java反射 二三事
为什么需要反射关于反射有很多场景可能会用到,这里用到是因为有一些私有方法必须要写单元测试。关于为什么会对私有方法进行单元测试,也许这并不是常见的需求。然而当外部环境变化很大(比如网站的url)时,保证你的函数正确有助于快速排错。对私有方法反射的主要流程1.首先获得方法A所在类的Class object,即通过Class.forName(ClassName)以及
2015-10-10 10:03:31
794
原创 [Linux杂记] 用户添加 删除 及赋权限
sudo useradd -m user1 //添加一个可以前台登录的用户,如果不用-m参数就登录不上,Ubuntu 14.10测试passwd user1 回车然后设置密码sudo useradd -r user2 //添加一个root用户,注意这个用户是没有办法前台登录的sudo userdel user2 // 删除用户2要使得一个用户
2015-01-13 21:01:26
1045
转载 IEEE 参考文献格式
Bibliographic: IEEE Formatreference:http://www.class.uidaho.edu/adv_tech_wrt/resources/sources/bibliographic_ieee_format.htmBook with a single authorJ. J. Adams, Urban Economy and Public
2014-10-06 10:58:55
33331
转载 美满电子校园招聘
网申09月01日 -10月31日笔试面试结束Marvell 美满电子2015校园招聘全面启动! 领先的技术、非凡的创新铸就美满的成功新鲜的血液、热情洋溢的你成就美满的未来你,正是我们寻找的象牙塔里展翅的雏鹰
2014-09-14 22:07:35
1640
原创 []趋势科技2015校园招聘
网申08月21日 -10月31日笔试09月15日 -10月31日 面试09月15日 -10月31日 结束来自趋势的offer ・ 第二季-2015年趋势科技校园招聘 我们是一家有文艺范儿的IT公司,在这里,你这样充满逻辑和条理的
2014-09-06 13:05:46
2225
原创 NOJ1023字符串排序
Time Limit(Common/Java):1000MS/3000MS Memory Limit:65536KByteTotal Submit:1243 Accepted:242Description有一些A、C、M组成的字符串,将其按字符A排序。Input一组测试数据,输入数据由若干行组成,每行是字符A、C或M组成的字符串。
2014-08-27 10:53:13
1173
Domain Storytelling
2023-05-23
tensorflow1.0.1 python3.6 cpu linux版安装文件
2017-03-27
tensorflow1.0.1 python2.7 cpu linux版安装文件
2017-03-27
Deep Learning- by Yoshua Bengio
2016-10-19
Exploring Data with RapidMiner - Andrew Chisholm
2016-10-13
TensorFlow MNIST数据集下载脚本input_data.py
2016-05-28
A Fast Approximate Nearest Neighbor Search Algorithm in the Hamming Space
2014-08-19
A DESIGN OF METADATA SERVER CLUSTER IN LARGE DISTRIBUTED OBJECT-BASED STORAGE
2014-01-21
基于行为模式的Android平台入侵检测系统的设计与实现
2014-01-16
A Survey of Mobile Malware in the Wild
2014-01-16
Android应用程序框架安全机制研究及改进
2014-01-15
Efficient Metadata Management in Large Distributed File Systems
2014-01-15
Understanding the Linux Kernel (3rd Edition)
2013-11-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人