- 博客(51)
- 资源 (1)
- 收藏
- 关注

原创 python爬虫实践之模拟登录
有些网站设置了权限,只有在登录了之后才能爬取网站的内容,如何模拟登录,目前的方法主要是利用浏览器cookie模拟登录。浏览器访问服务器的过程在用户访问网页时,不论是通过URL输入域名或IP,还是点击链接,浏览器向WEB服务器发出了一个HTTP请求(Http Request),WEB服务器接收到客户端浏览器的请求之后,响应客户端的请求,发回相应的响应信息(Http Response)
2014-01-24 10:04:19
32467
1

原创 C++11之智能指针(上)
缘起 对于C/C++程序员而言,资源管理是从来都不可回避的一个话题,资源泄露也成了程序员挥之不去的噩梦,稍不小心就掉到坑里去了,为了解决这些问题,托管语言引入了GC机制,由于C++缺乏语言层面的GC机制,资源管理一直很棘手,也是被很多人诟病。为了管理资源,C++采用RAII手法(资源获取即初始化,Resource Acquisition Is Initialization),利用局部
2013-11-29 23:52:16
5843

原创 致自己
by 阿飞_figo 我活在世上,无非想要明白一些道理,遇见些有趣的事。倘能如我所愿,我的一生就算成功。为一些也要去论是非,否则道理不给你明白,有趣的事也不让你遇到。我开始得太晚了,很可能做不成什么,但我总得申明我的态度,所以就有了这本书-------为我自己,也代表沉默的大多数。
2012-10-15 22:14:11
2381

原创 编程是一场漫长的修行
在这里,以文字的方式记录某些东西,不为了缅怀过去,或者展望未来,以此写给走在coding路上的我,也期待与君共勉。 by 阿飞_figo问题漫谈 我曾不止一次的被问到这个问题,怎样学习编程?如何学好编程?当你问这样的问题时,我想你一定是经过思考的,内心有冲动有激情的,或者至少有踏上这条贼船的意图(当然也不排除是无奈之举),才会在我这里里探探口风听听拙言,我就想
2012-09-27 22:07:04
1065
翻译 必读的计算机视觉开创性论文
摘要: 学习计算机视觉必须要看的几篇论文!image从ILSVRC中可以看出,近几年图像分类神经网络架构的错误率以惊人的幅度下降深度学习已经存在了几十年,Yann Lecun在1998年就发表了一篇关于卷积神经网络(CNN)的论文。但是直到十年前,深度学习才开始真正的发展并慢慢成为人工智能研究的主要焦点领域。这些转变主要是因为处理能力(即 GPU)的增强、大量可用性的数据(即Ima...
2019-01-27 13:40:58
514
转载 实战 | 一步步完成卷积神经网络CNN的搭建
摘要: 现有的Caffe、TensorFlow等工具箱已经很好地实现CNN模型,但这些工具箱需要的硬件资源比较多,不利于初学者实践和理解。因此,本文教大家如何仅使用NumPy来构建卷积神经网络(Convolutional Neural Network , CNN)模型,具体实现了卷积层、ReLU激活函数层以及最大池化层(max pooling),代码简单,讲解详细。 目前网络上存在...
2019-01-04 17:52:27
1657
转载 十分钟搞定pandas
Contents(译)十分钟搞定pandas + 实例 什么是pandas? 十分钟搞定pandas(译文+注释) 创建对象 查看数据 选择数据 缺失数据处理 相关操作 合并 分组 重塑 时间序列 分类 绘图 获取数据 写入导出 小陷阱 pandas实战 14.1. 什么是pandas?pandas : Python数据分...
2019-01-02 21:35:09
708
转载 要点|斯坦福大学公开课机器学习课程概要(2):概率论与统计
更多深度学习方面应用的理论实践经验和最新消息,欢迎关注公众号“深度学习杂货铺”或“shenduxuexizahuopu”微信扫描二维码添加关注。
2018-12-08 12:38:37
591
转载 要点|斯坦福大学公开课机器学习课程概要(1):线性代数与微积分
更多深度学习方面应用的理论实践经验和最新消息,欢迎关注公众号“深度学习杂货铺”或“shenduxuexizahuopu”微信扫描二维码添加关注。
2018-12-08 12:25:53
534
原创 【收藏】这是一份放在手边的机器学习的cheatsheet
这是一份放在手边的机器学习速查手册,内容包括监督学习、非监督学习、神经网络、机器学习方法和技巧、概率和统计、线性代数和微积分。 斯坦福大学的研究生(Shervine Amidi),麻省理工学院和Uber的Affsi-Adidie,提供了这样一套速查手册。 0.目录 1. 监督学习 2. 无监督...
2018-10-13 15:52:55
1396
原创 Nginx初探
Nginx初探Nginx初探了解NginxNginx的基本原理Nginx的安装Nginx的配置1 Nginx配置文件2 Nginx指令21 main全局配置22 http服务器23 server虚拟主机24 location25 访问控制 allowdeny26 列出目录 autoindexnginx配置location总结及rewrite规则写法1 location正则
2017-05-20 16:20:08
817
1
原创 mac os通过homebrew安装docker
一、安装virtual boxbrew cask install virtualbox一. 安装 docker 和 docker-machinebrew install dockerbrew install docker-machine二. 初始化 Virtual Box 的 default 虚拟机 docker-machine create --driv
2017-04-03 22:51:05
9863
转载 vim插件:显示树形目录插件NERDTree安装 和 使用
下载和配置NERDTree插件的官方地址如下,可以从这里获取最新的版本 https://github.com/scrooloose/nerdtree 下载zip安装包 或者使用下面官网源文件安装方法我的实验环境是centos6.6,其他版本可能有些不同。 安装方法很简单,先把压缩文件下载下来,解压后将plugin目录下的NERD_tree.vim拷贝~/.vim/plugin以及doc目录
2017-02-12 22:03:14
6205
转载 PHP 之道中文简体版
欢迎目前网络上充斥着大量的过时资讯,让 PHP 新手误入歧途,并且传播着错误的实践以及不安全的代码。PHP 之道 收集了现有的 PHP 最佳实践、编码规范和权威学习指南,方便 PHP 开发者阅读和查找使用 PHP 沒有规范化的方式。本网站主要是向 PHP 新手介绍一些他们没有发现或者是太晚发现的主题, 或是经验丰富的专业人士已经实践已久的做法提供一些新想法。本网站也不会告诉您应该使
2015-04-26 16:47:19
3420
原创 跳跃表skiplist简析
跳表作为基础的数据结构在一些开源的实现中使用非常广泛,包括leveldb,redis,都使用跳表作为基础的数据结构。redis中的有序集合就是基于跳表的基础结构实现的,leveldb中的memtable的实现就是基于跳表实现的 .
2014-10-30 14:14:06
1482
转载 PHP程序员的技术成长规划
PHP程序员的技术成长规划作者:黑夜路人(2014/10/15) 按照了解的很多PHP/LNMP程序员的发展轨迹,结合个人经验体会,抽象出很多程序员对未来的迷漫,特别对技术学习的盲目和慌乱,简单梳理了这个每个阶段PHP程序员的技术要求,来帮助很多PHP程序做对照设定学习成长目标。 本文按照目前主流技术做了一个基本的梳理,整个是假设PHP程序员不
2014-10-15 21:00:50
857
转载 土壤科学系的李博士,你还好么
作者/本冰李博士与我同是西安人,在我们系土壤科学专业做博士后。李博士有着一副标准的工科男长相,如果你站在五道口地铁站,五分钟之内就能看见30个和他长得一样的男人,毫无特征,过目即忘。同样,李博士的微信头像也和他的长相一样无趣:外套的两只袖子系在腰间背着双肩包站在山顶,同时单脚蹬着一块儿石头,左手插腰右手比出一个V,偏分。作为老乡,我问李博士你在田纳西呆得习惯么?他说还行。我说那
2014-09-04 23:07:49
2708
转载 分布式系统领域经典论文翻译集
分布式领域论文译序sql&nosql年代记SMAQ:海量数据的存储计算和查询一.google论文系列1. google系列论文译序2. The anatomy of a large-scale hypertextual Web search engine (译 zz)3. web search for a planet
2014-07-21 13:55:27
4110
转载 Linus,一生只为寻找欢笑
摘要 : 每个人桌面上一台电脑,这曾经是无数计算机先驱的梦想,这个梦想很早就实现了,在1997年,乔老师和比老师就说过,「比尔,我们共同控制了100%的桌面系统市场」,当然乔老师没说的是,比老师控制了97%,乔老师还不到3%。时至今日,乔老师走了,比老师颓了,移动终端把传统的 PC 市场冲击的七零八落。普通用户都知道了Windows、Android、OS X 、iOS、BlackBerry等等
2014-07-10 23:43:50
1160
原创 穿透内网所了解的一些知识
动机内网是相对于外网而言的,内网即是私有网络,互联网上的每个主机必须有一个唯一的IP地址来标识,现有的IPv4的地址为32位,所能标识的主机非常有限,随着internet上主机数量的不断的发展,IPv4地址的短缺越来越明显,IP地址资源也就愈加显得捉襟见肘。为了解决这种问题,出现了一种解决IPv4地址短缺以避免IP地址枯竭的方案,就是我们所谓的NAT(网络地址转换)技术,现在NAT成了家庭和小
2014-05-13 23:55:00
2908
原创 我所读到的王小波
那年今日,浪漫骑士王小波离我们而去,重发一篇自己在豆瓣上的旧文,谨怀 文/渔樵阿飞一个人只拥有此生此世是不够的,他还应该拥有诗意的世界。 -------王小波 我惊觉我的笔是颤抖的,我的语言是迟滞的,而我的
2014-04-11 20:57:20
1086
原创 爬虫实践之爬虫框架Scrapy安装
1.爬虫框架ScarpyScrapy 是一个快速的高层次的屏幕抓取和网页爬虫框架,爬取网站,从网站页面得到结构化的数据,它有着广泛的用途,从数据挖掘到监测和自动测试,Scrapy完全用Python实现,完全开源,代码托管在Github上,可运行在Linux,Windows,Mac和BSD平台上,基于Twisted的异步网络库来处理网络通讯,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用
2014-04-01 12:01:28
9379
转载 【存储入门必读】存储基础知识
第1章 网络存储主要技术 1.1 NAS简介 1.2 SAN简介 1.3 NAS、SAN和DAS的区别 1.4 SCSI访问控制原理介绍 1.5 NAS实现类型对比:统一式、网关式和横向扩展式(Scale-out) 1.6 SAN网络性能问题排错指南 (新) 第2
2014-03-30 00:28:29
4699
原创 MySQL的C++封装
最近的项目数据库管理系统从SQL SERVER2000迁移到了MySQL上来,之前基于ADO的连接方式连接上SQL SERVER,使用MySQL数据库管理系统之后,直接在MySQL的C语言的API上以面向对象的方式封装实现了数据库的创建,表的创建,数据库的读写操作快速搭建原型,目前没有添加连接池模块和事务处理。1.MySQL的特性使用C和C++编写,并使用了多种编译器进行测试,保证源代码的
2014-03-27 23:09:35
4758
原创 CnComm多线程串口通讯类的封装实现v0.02
在CnComm多线程串口通讯类的封装实现一文中实现了对于cncomm多线程串口类的简单封装,新版本将串口管理类改成了工厂类和单例类,实现了对于动态扩展新的串口,新的版本符合开闭原则。
2014-02-22 22:49:37
1709
转载 机器学习自学指南
事实上有许多的途径可以了解机器学习,也有许多的资源例如书籍、公开课等可为所用,一些相关的比赛和工具也是你了解这个领域的好帮手。本文我将围绕这个话题,给出一些总结性的认识,并为你由程序员到机器学习高手的蜕变旅程中提供一些学习指引。机器学习的四个层次根据能力可以将学习过程分成四个阶段。这也是一个有助于我们将所有学习资源进行分类的好方法。初学阶段新手阶段中级阶段高级阶段我
2014-02-20 10:32:41
1157
原创 CnComm多线程串口通讯类的封装实现
之前对于CnComm类库做过简单的分析,详见CnComm多线程串口通讯类解读CnComm是llbird开发的WINDOWS/WINCE 多线程串口通讯开源库,提供同步IO并发访问的支持,内存管理采用内存池技术,提供对于C++异常的支持。在实际的项目中,需要使用多个串口来收发消息,于是对于CnComm类做了简单的封装操作。实现对于CnComm串口类的封装,提供基本的接口通过串口管理类
2014-02-17 22:58:09
7290
原创 写在1314
遇到很多琐碎的事情,见过很多喧嚣,只是想静静地写一些东西, 经历的事太琐碎繁杂,理顺起来又毫无头绪,承得起思量与回望的甚少,却终究也只是一知半解, 难在一条脉络上梳理清楚。于我而言,更偏爱的,是暗涌波澜的生活中保留的细密景致,比起庙堂之上的权阀更迭,我更关心触手可及的温凉。其实我相信很多人都不关心,这只是他们茶余饭后的谈资罢了,虚无的存在感蔓延在每一个角落。 细细思量这
2014-02-13 11:49:55
1253
转载 疯狂的Web应用开源项目
下面是一个Web应用的开源列表。没什么可说的,太疯狂了。尤其是Web 2.0那一堆。我不知道你怎么想,有些开源项目的源码写得挺不好的,尤其是性能方面。或许你会以为改一改他们就可以成为为自己所用,不过,改这些开源的项目还真不容易。玩玩还可以。数字媒体相册(Flickr, Picasa)Gallery,基于PHP + MySQL的Web相册。非常易于使用,包括一个配
2014-02-11 19:20:14
2652
翻译 特征描述子评测
本文分享我关于几种类型的特征描述子的性能的研究结果,本文是对"Comparison offeature descriptors" 的更新,新增了ORB特征描述子,仍然包含SIFT,还新增测试了新版本的LAZY描述子的性能。为了测试这些描述子的性能,我写了专用的测试框架,在这个框架下,我可以轻易地增加一些新的描述子,测试案例并且能够生成CSV-like格式的报告数据,然后我将其上传到了goo
2014-02-10 14:08:25
3455
1
转载 2013流行Python项目汇总
原文: Pycoder Weekly / 编译: 蟒周刊Python作为程序员的宠儿,越来越得到人们的关注,使用Python进行应用程序开发的越来也多。那么,在2013年有哪些流行的Python项目呢?下面,我们一起来看下。一、测试和调试python_koans :Python Koans 算 “Ruby Koans” 的一部分,作为交互式教程,可以学习
2014-01-24 10:20:42
2762
原创 爬虫开发实践之前端知识
1.前端知识开发爬虫需要了解一些前端知识和基本原理,分析网页的构成元素,WEB前端的三要素:HTML + CSS + JavaScript,它们构成一MVC框架,即23个设计模式中的Model_View_Controller模式,HTML作为信息模型(Model),CSS控制样式(View),JavaScript负责调度数据和实现某种展现逻辑(Controller),很好的实现了业务逻辑和用户
2014-01-13 23:51:34
5412
1
原创 python爬虫实践之网页抓取
python自带了urllib和urllib2模块,以及第三方的requests库来抓取网页,这里我们使用easy_install包管理工具下载requests库,BeautifulSoup库,在CMD命令行下,切换到easy_install的目录,运行命令easy_install 包名称。easy_install requests安装好requests包之后,我们就可以选择使用urlli
2014-01-12 00:04:32
4977
1
原创 python之字符编码解码
用VS做C++开发的人,肯定遇到过将工程的字符集在Multibyte与Unicode之间互相转换的经历,CString,char*的转换也是家常便饭,L,_T这些宏的使用,MultiByteToWideChar()和WideCharToMultiByte(),W2A()和A2W(),虽然用起来很丑陋,但是都可以解决问题。前段时间使用python写一些脚本的时候,总是遇到UnicodeEncodeE
2014-01-08 23:21:29
3802
转载 推荐系统开源软件列表汇总和评点
收集和整理了目前互联网上能找到的开源推荐系统,并附上了个人的一些简单点评(未必全面准确),这个列表是目前为止比较全面的了,希望对大家了解掌握推荐系统有帮助(文/陈运文)SVDFeature由上海交大的同学开发,采用C++语言,代码质量很高。去年我们参加KDD竞赛时用过,很好很方便,而且出自咱们国人之手,所以置顶推荐!项目地址:http://svdfeature.
2013-12-02 14:40:56
1446
原创 CnComm多线程串口通讯类解读
CnComm是llbird开发的WINDOWS/WINCE 多线程串口通讯开源库,使用C++ (ANSI/UNICODE)开发,代码采用传统C++的继承机制, 采用VC命名风格(匈牙利),提供同步IO并发访问的支持,内存管理采用内存池技术,提供对于C++异常的支持,对于串口库的扩展,不推荐直接在本代码上修改, 应通过C++继承扩展机制扩展本代码。现代C++使用RAII的机制,使用类来管理资源,在构造函数中分配资源,在析构函数中释放资源,如果出现在多线程的情况下,并发访问的出现,还不止要解决好内存泄露方面的问
2013-11-03 00:39:46
5534
1
转载 C++11标准后的C++阅读书目
本文由 伯乐在线 - JingerJoe 翻译自 drdobbs。欢迎加入技术翻译小组。转载请参见文章末尾处的要求。C++ 新标准 C++11 的发布导致了大批新书的出现,还有一些经典书籍也进行了更新。Andrew Binstock 在 Dr.dobbs 上给大家推介一些学习 C++ 必需的核心书籍。 1. 《C++程序设计语言》英文第四版,作者: Bjarne Str
2013-09-26 00:17:41
1000
转载 计算机科学中最重要的32个算法
奥地利符号计算研究所(Research Institute for Symbolic Computation,简称RISC)的Christoph Koutschan博士在自己的页面上发布了一篇文章,提到他做了一个调查,参与者大多数是计算机科学家,他请这些科学家投票选出最重要的算法,以下是这次调查的结果,按照英文名称字母顺序排序。A* 搜索算法——图形搜索算法,从给定起点到给定终点计算出
2013-08-28 00:06:09
755
原创 那些人,珍重便好
"人生有时候,总是很讽刺。 一转身可能就是一世。说好永远的,不知怎么就散了。最后自己想来想去竟然也搞不清当初是什么原因分开彼此的。然后,你忽然醒悟,感情原来是这么脆弱的。经得起风雨,却经不起平凡;风雨同船,天晴便各自散了。也许只是赌气,也许只是因为小小的事。幻想着和好的甜蜜,或重逢时的拥抱,那个时候会是边流泪边捶打对方,还傻笑着。该是多美的画面。没想到的是,一别竟是一辈子了。 "
2013-08-18 23:45:09
1039
转载 告别 Google Reader,告别一个时代!
告别 Google Reader,告别一个时代!作者: 善用佳软北京时间7月2日15:00, Google Reader 正式关闭!重发旧文,作为纪念。以下文章原发于2013年4月期 @CHIP 《新电脑》Google Reader就要走了,他的母亲决定活活掐死他,原因是要给另一个孩子让位。无数Googler为之扼腕!好运、智慧、伟大的成就与荣耀,不会永远归属一
2013-07-04 00:01:47
960
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人