regular

最新推荐文章于 2025-10-01 21:20:51 发布

转载最新推荐文章于 2025-10-01 21:20:51 发布 · 261 阅读

<!DOCTYPE regular-resource PUBLIC "Spider-Core workflow dtd"
"http://rc.91yong.com/spider.dtd"
>
<regular-resource prefix="ganji">

        <node>
            <filter><![CDATA[(?i)<ul[^>]*class=['"]pageLink[^>]+>(?:[^<]*<li.*?</li>)*[^<]*<li[^>]*><a[^>]+>(\d+).*?</li>]]></filter>
            <node name="pageTotal" order="1">
                <value-filter name="DealText"></value-filter>
            </node>
        </node>

            <node name="name" order="2">
                <value-filter name="DealText"></value-filter>
            </node>
            <node name="gender" order="3">
                <value-filter name="DealText"></value-filter>
                <dic-filter>
                    <dicname>sex</dicname>
                    <from>value</from>
                    <to>stdkey</to>
                </dic-filter>
            </node>
            <node name="dateOfBirth" order="4">
                <value-filter name="DealText"></value-filter>
            </node>
            <node name="degree" order="5">
                <value-filter name="DealText"></value-filter>
                <dic-filter>
                    <dicname>educational</dicname>
                    <from>value</from>
                    <to>stdkey</to>
                </dic-filter>
            </node>
            <node name="serviceYear" order="6">
                <value-filter name="DealText"></value-filter>
            </node>

</node>

        <node>
            <filter><![CDATA[<dt class="fc4b".*?[^<]class="fc70"]]></filter>
            <filter><![CDATA[>([^<\s]+)<.*?>([^<\s]+)<.*?>([^<\s]+)岁<]]></filter>
            <node name="name" order="1">
                <value-filter name="DealText"/>
            </node>
            <node name="gender" order="2">
                <dic-filter>
                    <dicname>sex</dicname>
                    <from>value</from>
                    <to>stdkey</to>
                </dic-filter>
            </node>
            <node name="dateOfBirth" order="3">
                <value-filter name="DealText"/>
            </node>
        </node>

        <node>
            <filter><![CDATA[教育经历</dt.*?</dd>]]></filter>
            <filter><![CDATA[\|([^|]+)\|([^|]+)\|([^|<]+)]]></filter>
            <node name="major" order="3">
                <value-filter name="DealText"/>
            </node>
            <node name="degree" order="2">
                <dic-filter>
                    <dicname>educational</dicname>
                    <from>value</from>
                    <to>stdkey</to>
                </dic-filter>
            </node>
            <node name="graduatedFrom" order="1">
                <value-filter name="DealText"/>
            </node>

</node>

            <node name="currentAddress" order="1">
                <value-filter name="DealText"/>
                <dic-filter>
                    <dicname>workareas</dicname>
                    <from>value</from>
                    <to>stdkey</to>
                </dic-filter>
            </node>

</node>

    <node id="checkCodeValidate">
        <node exists="no">
            <filter><![CDATA[<title>机器人确认</title>]]></filter>
        </node>
    </node>

    <node id="checkFreeCount">
        <node>
            <filter><![CDATA[今天还可以免费查看[^>]+>[1-5]</span>份]]></filter>
             <node name="freecheck"/>
        </node>
        <node>
            <filter><![CDATA[查看联系方式需要扣除<b style="font-weight:bold">1</b>份下载简历数，您目前有]]></filter>
            <node name="freecheck"/>
        </node>
    </node>