- 博客(19)
- 资源 (1)
- 收藏
- 关注
原创 查看局域网所有ip地址
想adb连接车机,不知道ip地址,使用下面方法可找到cmd输入for /L %i IN (1,1,254) DO ping -w 2 -n 1 192.168.1.%i” 改成自己的网段,等待几分钟,输入arp -a即可看到所有的ip地址
2022-02-15 15:56:14
3419
原创 EditText动态InputType属性
记录一下方便查找//输入类型为没有指定明确的类型的特殊内容类型editText.setInputType(InputType.TYPE_NULL);//输入类型为普通文本editText.setInputType(InputType.TYPE_CLASS_TEXT);//输入类型为数字文本editText.setInputType(InputType.TYPE_CLASS_NUMBER);//输入类型为电话号码editText.setInputType(InputType.TYP.
2022-01-26 10:52:13
1041
原创 华为手机通过HCI抓取的蓝牙数据包路径
操作步骤,开发者模式打开hci,关键是生成的文件不同手机,千奇百怪,按照网上的方法全都找不到抓取的文件。最后通过cmd,输入adb pull /data/log/bt,就会在把蓝牙文件导出到本地,大概路径是C:\Users\用户名\bt 文件名btsnoop_hci_20211222_100954.log,使用wireshark打开即可...
2021-12-22 21:56:07
2236
1
转载 怎么学习逆向工程?
逆向工程是一个综合性和实践性很强的学科,最需要的是耐心和毅力。初学者往往一开始就拿一个成熟软件去反汇编分析,结果被海量的指令和错综复杂的流程搞得晕头转向,然后大多数人就中途放弃了。 我们建议大家从最简单的程序开始入手,最好从自己用汇编写的“Hello World”程序开始。然后在学习的过程中逐步将难度升级,一点点去看懂流程特性。等把汇编程序看顺眼了,就开始研究C/C++
2009-11-23 13:07:00
1624
转载 nutch的排名算法OPIC
工作需要扩展nutch爬虫一些功能,在nutch资料甚少的互联网总算在一个角落搜到了nutch类似google的pagerank的算法,叫做Adaptive On-Line Page Importance Computation,简称OPIC,继续搜索到下边这篇文章,感觉对自己理解这个算法方面有入门的帮助,特转贴过来。 庄子曾说:“吾生也有涯,而知也无涯,以有涯随无涯,殆已”。当然,我
2009-05-21 11:23:00
3430
原创 nutch1.0各种命令
局域网抓取bin/nutch crawl urls -dir 20090519 -depth 1 -topN 50 -threads 2 >& nutch.log 互联网抓取命令(注:1.0版本的命令和以前版本有许多不一样)1.读取urls目录下的站点添加到crawldb里bin/nutch inject 20090519/crawldb urls2.创建一个segments,存放
2009-05-19 13:31:00
1997
转载 boost简单分析
Boost field的值是通过链接到此网页的链接数目来进行计算的,链接到此网页的链接越多,此值越大。但是两者并不是成线性关系的,而是通过对数计算而得,计算公式为ln(e+n),其中参数n即是链接数目。例如此例中链接到网页A的只有一个网页B,所以boost的值计算为ln(e+1) = 1.3132616… 但是本质上,boost的值并不是仅仅依赖于链接数目,它还
2009-05-18 15:09:00
818
原创 Nutch1.0源码分析-----抓取部分
<! v/:* {behavior:url(#default#VML);}o/:* {behavior:url(#default#VML);}w/:* {behavior:url(#default#VML);}.shape {behavior:url(#default#VML);}--> Normal 0 7.8 磅 0 2
2009-05-11 17:17:00
3273
转载 有关搜索引擎中索引问题---Nutch look and feel
I. Intro前几天我赶着做了一个股票搜索的demo,总算是有了一个成型的东西。这几天一直在看资料,为下一个milestone准备着......II. Open Issues从编程的角度看来Lucene就是一个只支持纯文本检索的类库(Oops!!!):没有spider,不支持html、doc、pdf等复杂类型的文本检索。而作者DougCutting的另一个masterpiec
2009-05-07 16:40:00
896
转载 Nutch的Analysis包详解
对于中国用户,最早遇到的棘手问题可能就是中文分词了。由于nutch对中文的支持默认是单字分词,所以很多人在一拿到nutch后要解决的第二件事情(第一件事情当然是让nutch跑起来了)往往是要加入一个可行的中文分词模块。所以对这个包研究的人也是最多的,在网上关于nutch的中文分词的文章也是人气很高的。那么就让我们一起来走近它看看它到底是怎么一回事,也让我们来做个中文分词器让中文在
2009-05-07 16:29:00
744
转载 Nutch距离一个商业应用的搜索引擎还有多远
参考:http://lotusroots.bokee.com/6106980.html 了解nutch的人基本上对这个开源的系统都是比较欣赏的,起码在国内是这样的,也很有多搜索网站是基于这个系统修改过来的,不过要做得好,做得真正是一个商业化的搜索,这个修改就不是一朝一夕的事情,也不是修修剪剪那么简单了。 作为一个通用的全网级别的搜索引擎架构,nutch(lucene)确实为广大人民群众
2009-05-07 16:23:00
778
转载 vi常用命令
进入vi的命令vi filename: 打开或新建文件,并将光标置于第一行首vi +n filename: 打开文件,并将光标置于第n行首vi + filename: 打开文件,并将光标置于最后一行首vi +/pattern filename: 打开文件,并将光标置于第一个与pattern匹配的串处vi -r filename: 在上次正用vi编辑时发生系
2009-04-28 11:00:00
562
转载 ubuntu下用jsvc把java程序做为linux服务启动
网上关于jsvc跑java的文章就搜到一篇,照着做结果还是出错,所以决定花点时间结合自己最终成功的体会记录下,加深印象。 linux环境:ubuntu8.10servertomcat:6.0.18jdk:1.6 1.安装jsvc在tomcat的bin目录下有一个jsvc.tar.gz的文件,进入tomcat的bin目录下#tar zxvf jsvc.tar.gz#cd js
2009-04-28 10:16:00
3889
转载 运行nutch常见几个错误
1.1.1 Crawl抓取出现hadoop出错提示配置完成nutch在cygwin中运行nutch的crawl命令时:[Fatal Error] hadoop-site.xml:15:7: The content of elements must consist of well-formed character data or markup.Exception in th
2009-04-27 22:37:00
4843
3
原创 windows下nutch1.0环境搭建及测试
先申明,此文非全部原创,结合网上资料加上自己测试环境记录的内容,做个记录加深自己的印象。 1.安装jdk并设置环境Jdk版本为1.6,在这里用了最简单环境设置,如果你设置不成功请参照网上教程,再此不过多说明.配置PATH环境变量;D:/soft/Java/jdk1.6.0_13/bin配置CLASSPATH环境变量 ,;配置NUTCH_JAVA_HOME为D:/soft/Java/jd
2009-04-27 14:35:00
3333
1
转载 Doug Cutting 访谈录 -- 关于搜索引擎的开发
作为Lucene和Nutch两大Apach Open Source Project的始创人(其实还有Lucy, Lucene4C 和Hadoop等相关子项目),DougCutting一直为搜索引擎的开发人员所关注。他终于在为Yahoo以Contractor的身份工作4年后,于今年正式以Employee的身份加入Yahoo下面是笔者在工作之余,翻译其一篇2年前的访谈录,原文(Doug C
2009-04-27 10:24:00
634
nutch 详细分析(包括配置文件等)
2009-08-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人