环境:
OS:Ubuntu 8.04 Hardy
JDK:6.0
1.首先将默认包中的java源代码进行编译,得到class文件。
2.创建SHELL脚本,命令行执行java,同时将引用的第三方包路径(此处为/home/iems/htmlparser.jar)加入到环境变量CLASSPATH中,脚本search.sh内容如下:
#!/bin/sh
java -classpath .:/home/iems/htmlparser.jar NewsSearch
3.编辑crontab文件
#gedit /etc/crontab
4.在文件中加入一条如下记录,其中第一栏为分钟,第二栏为小时,即每天19:31执行该命令
31 19 * * * iems cd /home/iems && sh search.sh
5.重新启动cron进程,使得新的配置文件能够被重新读取,改变生效
#/etc/init.d/cron restart
PS:若想查看crontab日志,访问/var/log/syslog即可。同时如果执行失败,可以选择发送邮件给管理员。
这样每天的新闻都会被自动抓取并且相关信息都能够存储到文本文件中了。