使用nutch进行搜索代码

本文展示了一个使用Nutch进行搜索的简单示例代码,并介绍了如何配置插件以实现特定功能。通过该示例,读者可以了解如何进行爬虫结果查询。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

使用nutch进行搜索代码
<script src="http://pagead2.googlesyndication.com/pagead/show_ads.js" type="text/javascript"> </script> name="google_ads_frame" marginwidth="0" marginheight="0" src="http://pagead2.googlesyndication.com/pagead/ads?client=ca-pub-3593204875158947&dt=1179969527437&lmt=1179969527&prev_fmts=728x90_as&format=250x250_as&output=html&correlator=1179969527328&channel=3252141990&url=http%3A%2F%2Fwww.ideagrace.com%2Fclub%2Fread.php%3Ftid%3D320&color_bg=FFFFFF&color_text=000000&color_link=0000CC&color_url=000000&color_border=FFFFFF&ad_type=text_image&cc=179&flash=9&u_h=768&u_w=1024&u_ah=734&u_aw=1024&u_cd=32&u_tz=480&u_his=3&u_java=true" frameborder="0" width="250" scrolling="no" height="250" allowtransparency="allowtransparency">

package com.ideagrace.nutch;

import java.io.File;

import org.apache.nutch.protocol.Protocol;
import org.apache.nutch.protocol.ProtocolFactory;
import org.apache.nutch.protocol.ProtocolNotFound;
import org.apache.nutch.util.NutchConf;
import org.apache.nutch.searcher.*;
import org.apache.nutch.html.Entities;

public class NutchTest {
  public static void main(String args[]) {
   
    System.out.println(NutchConf.get().get("searcher.dir"));
    try {
        NutchBean bean = new NutchBean(new File("C://cygwin//nutch-0.7.2//bin//crawled2"));
       
//         NutchBean bean = new NutchBean();
        String keyword = "侯白出谜";
        String queryString = Entities.encode("侯白出谜");
        queryString = keyword;
        Query query = Query.parse(queryString);
        Hits hits;
        hits = bean.search(query, 20);
        System.out.println("result size is : " + hits.getLength());

        int length = (int)Math.min(hits.getTotal(), 10);
        Hit[] show = hits.getHits(0, length);
       
//         Hit[] show = hits.getHits(0, 20);
        HitDetails[] details = bean.getDetails(show);
        String[] summaries = bean.getSummary(details, query);
        if (hits != null) {
          for (int i = 0; i < show.length; i++) {
            Hit hit = show[i];
            HitDetails detail = details[i];
            String summary = summaries[i];
            System.out.println("---------------------------");
            System.out.println("hit id is :" + hit.getIndexNo());
            System.out.println("hit doc id is :" + hit.getIndexDocNo());
            System.out.println("title is :" + detail.getValue("title"));
            System.out.println("url is :" + detail.getValue("url"));
            System.out.println("summary is :" + summary);
          }
        }
    } catch (Exception e) {
        e.printStackTrace();
    }
  }
}


以上是对爬行结果进行查询的代码,参考nutch的搜索程序。把它放在application中运行,了解一下nutch的查询。呵呵,只是一个很简单的程序,以此为入口,希望深入的学习nutch。
运行这个查询,试用到了nutch的plugin。nutch的大部分参数都在nutch-default.xml中定义,以下这段代码定义了插件存放的文件夹,以及引入了哪些插件:
<!-- plugin properties -->
<property>
<name>plugin.folders</name>
<value>plugins</value>
<description>Directories where nutch plugins are located. Each
element may be a relative or absolute path. If absolute, it is used
as is. If relative, it is searched for on the classpath.</description>
</property>
<property>
<name>plugin.includes</name>
<value>nutch-extensionpoints|protocol-http|urlfilter-regex|parse-(text|html)|index-basic|query-(basic|site|url)</value>
<description>Regular expression naming plugin directory names to
include. Any plugin not matching this expression is excluded.
In any case you need at least include the nutch-extensionpoints plugin. By
default Nutch includes crawling just HTML and plain text via HTTP,
and basic indexing and search plugins.
</description>
</property>
<property>
<name>plugin.excludes</name>
<value></value>
<description>Regular expression naming plugin directory names to exclude.
</description>
</property>



 
资源下载链接为: https://pan.quark.cn/s/abbae039bf2a 无锡平芯微半导体科技有限公司生产的A1SHB三极管(全称PW2301A)是一款P沟道增强型MOSFET,具备低内阻、高重复雪崩耐受能力以及高效电源切换设计等优势。其技术规格如下:最大漏源电压(VDS)为-20V,最大连续漏极电流(ID)为-3A,可在此条件下稳定工作;栅源电压(VGS)最大值为±12V,能承受正反向电压;脉冲漏极电流(IDM)可达-10A,适合处理短暂高电流脉冲;最大功率耗散(PD)为1W,可防止器件过热。A1SHB采用3引脚SOT23-3封装,小型化设计利于空间受限的应用场景。热特性方面,结到环境的热阻(RθJA)为125℃/W,即每增加1W功率损耗,结温上升125℃,提示设计电路时需考虑散热。 A1SHB的电气性能出色,开关特性优异。开关测试电路及波形图(图1、图2)展示了不同条件下的开关性能,包括开关上升时间(tr)、下降时间(tf)、开启时间(ton)和关闭时间(toff),这些参数对评估MOSFET在高频开关应用中的效率至关重要。图4呈现了漏极电流(ID)与漏源电压(VDS)的关系,图5描绘了输出特性曲线,反映不同栅源电压下漏极电流的变化。图6至图10进一步揭示性能特征:转移特性(图7)显示栅极电压(Vgs)对漏极电流的影响;漏源开态电阻(RDS(ON))随Vgs变化的曲线(图8、图9)展现不同控制电压下的阻抗;图10可能涉及电容特性,对开关操作的响应速度和稳定性有重要影响。 A1SHB三极管(PW2301A)是高性能P沟道MOSFET,适用于低内阻、高效率电源切换及其他多种应用。用户在设计电路时,需充分考虑其电气参数、封装尺寸及热管理,以确保器件的可靠性和长期稳定性。无锡平芯微半导体科技有限公司提供的技术支持和代理商服务,可为用户在产品选型和应用过程中提供有
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值