
工具使用
文章平均质量分 53
ae5555
这个作者很懒,什么都没留下…
展开
-
memcached
memcached是高性能的分布式内存缓存数据库。 一般的使用目的是,通过缓存数据库查询结果,减少数据库访问次数,以提高动态Web应用的速度、 提高可扩展性。memcached的特点 一、memcached的服务器客户端通信使用简单的基于文本行的协议。因此,通过telnet 也能在memcached上保存数据、取得数据。 $ telnet loca原创 2015-02-07 13:56:13 · 383 阅读 · 0 评论 -
D2RQ
D2RD2R主要包括D2R Server、D2RQ Engine以及D2RQ Mapping语言。D2R Server 是一个HTTP Server,提供对RDF数据的查询访问接口;D2RQ Engine 使用一个可定制的D2RQ Mapping文件(.ttl)将关系型数据库中的数据换成RDF格式,它并没有将关系型数据库发布成真实的RDF数据,而是使用D2RQ Mapping文件将其映射成虚拟的RD原创 2016-07-06 15:40:22 · 2396 阅读 · 0 评论 -
nutch使用
nutch 1.x (nutch 1.11为例)抓取网页存储到本地bin/crawl urls crawl 2建索引bin/nutch solrindex http://127.0.0.1:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/*nutch 2.x (nutch 2.2.1为例)mysqlmy.ini或my.c原创 2016-07-03 09:18:27 · 1069 阅读 · 0 评论 -
数据库优化
性能瓶颈要正确的优化SQL,需要快速定位性能的瓶颈点。索引索引会大大增加表记录DML(insert、update、delete)的开销。一个表可以建多个索引,一个索引可以由多个字段组成。有些时候,只需要访问表中的几个字段,并且字段内容较少,可以为这几个字段单独建立一个组合索引。 性能优化是无止境的,当性能可以满足需求时即可,不要过度优化。在实际数据库中我们不可能把每个SQL请求的字段都建在索引里,原创 2016-05-20 21:23:27 · 349 阅读 · 0 评论 -
Cmake使用
基本配置 cmake_minimum_required(VERSION 2.6) project(myproject) set(SRC_LIST main.c) add_executable(myproject ${SRC_LIST})cmake自带的环境变量PROJECT_SOURCE_DIR 工程代码所在目录 PROJECT_BINARY_DIR 生成执行原创 2016-01-25 16:27:26 · 458 阅读 · 0 评论 -
NAT类型和检测方法
转载:http://club.topsage.com/thread-746864-1-1.html考虑到UDP的无状态特性,目前针对其的NAT实现大致可分为Full Cone、Restricted Cone、Port Restricted Cone和Symmetric NAT四种。值得指出的是,对于TCP协议而言,一般来说,目前NAT中针对TCP的实现基本上是一致的,其间并不存在太大差异,这是因为T转载 2015-12-11 22:13:30 · 717 阅读 · 0 评论 -
Word2Vec
Word2VecWord2Vec是将词表示为实数值向量的工具,并将对文本内容的处理转换为K维向量空间的向量运算。Word2Vec输出的词向量可以用来做NLP相关的工作,比如聚类、同义词、词性分析等。1.向量空间上的相似度可以用来表示文本语义上的相似度。Word2Vec模型word2vec使用的是Distributed representation 的词向量表示方式,这种向量原创 2015-10-27 22:47:45 · 2432 阅读 · 0 评论 -
WebMagic/JMX&爬虫监控
WebMagic使用JMX实现了对爬虫的监控,可以通过Jconsole等JMX工具查看本地或者远程的爬虫信息。为爬虫添加监控:获取一个SpiderMonitor的实例SpiderMonitor.instance(),并将要监控的Spider注册进去即可。可以注册多个Spider到SpiderMonitor中。Spider spider=Spider.create();Spide原创 2015-08-02 00:02:30 · 1476 阅读 · 0 评论 -
ScalaNLP-breeze&breeze-viz总结
统计分布breeze.stats.distributions.Guassian(0,1) 正态分布/高斯分布breeze.stats.distributions.Binomial(n,p) 伯努利二项分布生成图像:val f =Figure()val g=distributions.Guassian(0,1)f.subplot()+=hist(g.sample(1原创 2015-07-18 13:35:17 · 3024 阅读 · 0 评论 -
redis
redis-check-dump.exe 本地数据库检查redis-check-aof.exe 更新日志检查redis-benchmark.exe 性能测试客户端连接:redis-cli.exe -h 127.0.0.1 -p 6379java:基本类型和操作hash 哈希表Map map=new HashMap();原创 2015-07-17 16:05:40 · 318 阅读 · 0 评论 -
Maven
pom.xml POM模板版本,通常是4.0.0 项目所属的组织编号,通常用域名 项目名称 项目编译的版本号 项目打包形式,jar或war声明依赖dependencies> dependency> groupId>groupId> artifactId>artifactId> version>versio原创 2015-07-11 14:54:08 · 269 阅读 · 0 评论 -
有用的链接
XAMPP http://www.apachefriends.org/zh_cn/xampp.html原创 2015-01-05 15:30:42 · 382 阅读 · 0 评论 -
AWStats
生成网页perl awstats.pl -update -config=IDXXXX -month=xx -year=xxxx -output -staticlinks > /pathname/filename.html原创 2015-01-25 21:46:25 · 418 阅读 · 0 评论 -
Gearman工具
通常,使用Gearman集成项目中的多语言多系统。Gearman是一个任务分发架构,将前端的任务通过Job Server分发给后端的Worker处理。Client ->Job Server -> WorkerClient、Worker并不限制使用一样的语言。甚至可以通过增加更多的Worker,很方便的实现应用程序的分布式负载均衡架构。前端Client的负载降低了原创 2015-03-13 19:44:43 · 444 阅读 · 0 评论 -
xgboost
xgboost构建过程xgboost 从顶到底构建树,在从低到顶反向进行剪枝。原创 2017-06-29 22:03:10 · 2594 阅读 · 0 评论