2014-08-10 日志

今天学了Servlet:

Servlet


1. 什么是Servlet
  * Servlet是JavaWeb三大组件之一(Servlet、Filter、Listener)
  * Servlet是用来处理客户端请求的动态资源
  * Servlet的任务有:
    > 获取请求数据
    > 处理请求
    > 完成响应
  * Servlet接口方法:
    > void init(ServletConfig)
    > void service(ServletRequest,ServletResponse)
    > void destory()
    > ServletConfig getServletConfig()
    > String getServletInfo()


2. 实现Servlet的方式
  * 实现Servlet接口(不方便)
  * 继承GenericServlet类(不方便)
  * 继承HttpServlet类(方便)


3. Servlet第一例
  * 写一个类cn.itcast.MyServlet,实现Servlet接口
  * 实现service()方法,在其中给出System.out.println("hello servlet!");
  * 在web.xml文件中指定Servlet的访问路径为:/myservlet
<servlet>
  <servlet-name>xxx</servlet-name>
  <servlet-class>cn.itcast.MyServlet</servlet-class>
</servlet>
<servlet-mapping>
  <servlet-name>xxx</servlet-name>
  <url-pattern>/myservlet</url-pattern>
</servlet-mapping>
  当用户在地址栏中访问:http://localhost:8080/day04_1/myservlet时,会执行System.out.println("hello 


servlet!");


===============================


Servlet生命周期


  Servlet接口一共5个方法,但其中只有三个是生命周期方法:
  * void init(ServletConfig)
  * void service(ServletRequest,ServletResponse)
  * void destory()


  1). 服务器创建Servlet:
  * 当Servlet第一次被请求时,或服务器启动时,服务器会创建Servlet实例。
  * 服务器默认是在servlet第一次被请求时创建Servlet实例,如果希望服务器启动时就创建Servlet实现需要在web.xml


中配置
  * 服务器只为一个类型的Servlet创建一个实例对象,所以Servlet是单例的;


  2). 服务器初始化Servlet:
  * 当服务器创建Servlet实例后会马上调用Servlet的init(ServletConfig)方法,完成对Servlet的初始化;
  * init(ServletConfig)只会被调用一次
  * 服务器会在调用init()方法时传递ServletConfig参数
  
  3). 服务器使用Servlet处理请求:
  * 当Servlet被请求时,服务器会调用Servlet的service(ServletRequest,ServletResponse)方法
  * service(ServletRequest,ServletResponse)方法每处理一次请求,就会被调用一次,所以它可能会被调用N次
  * 因为Servlet是单例的,所以可能在同一时刻一个Servlet对象会被多个请求同时访问,所以这可能出现线程案例问题
  * Servlet不是线程案例的,这有助与提高效率,但不能让Servlet具有状态,以免多个线程争抢数据


  4). 服务器销毁Servlet
  * 服务器通常不会销毁Servlet,通常只有在服务器关闭时才会销毁Servlet
  * 服务器会在销毁Servlet之前调用Servlet的destory()方法
  * 可以在destory()方法中给出释放Servlet占有的资源,但通常Servlet是没什么可要释放的,所以该方法一般都是空





===============================


ServletConfig


  ServletConfig是Servlet中的init()方法的参数类型,服务器会在调用init()方法时传递ServletConfig对象给init()


方法。
  ServletConfig对象封装了Servlet在web.xml中的配置信息,它对应<servlet>元素。ServletConfig类的功能有:
  * String getServletName():获取Servlet配置名,即<servlet-name>的值;
  * ServletContext getServletContext():获取ServletContext对象,这个对象稍后介绍
  * String getInitParameter(String name):获取初始化参数
  * Enumeration getInitParameterNames():获取所有初始化参数的名称


  在web.xml文件中,配置<servlet>时可以为<servlet>配置0~N个初始化参数,例如:
<servlet>
  <servlet-name>xxx</servlet-name>
  <servlet-class>cn.itcast.servlet.MyServlet</servlet-class>
  <init-param>
    <param-name>p1</param-name>
    <param-value>v1</param-value>
  </init-param>
  <init-param>
    <param-name>p2</param-name>
    <param-value>v2</param-value>
  </init-param>
</servlet>


===============================


GenericServlet


  GenericServlet是Servlet接口的实现类,但它是一个抽象类,它唯一的抽象方法就是service()方法
  GenericServlet实现了Servlet方法:
  * 实现了String getServletInfo()方法
  * 实现了void destory()方法,空实现
  * 实现了void init(ServletConfig)方法,用来保存ServletConfig参数
  * 实现了ServletConfig getServletConfig()方法


  GenericServlet实现了ServletConfig接口:
  * 实现了ServletContext getServletContext()方法
  * 实现了String getInitParameter()方法
  * 实现了String getServletName()方法
  * 实现了Enumeration getInitParameterNames()方法


  GenericServlet添加了init()方法:
  * 该方法会被init(ServletConfig)方法调用
  * 如果希望对Servlet进行初始化,那么应该覆盖init()方法,而不是init(ServletConfig)方法


===============================


HttpServlet
  
  HttpServlet是GenericServlet的子类,它专注HTTP请求
  HttpServlet类的方法:
  * 实现了void service(ServletRequest,ServletResponse)方法,实现内容是:
    > 把ServletRequest强转成HttpServletRequest
    > 把ServletResponse强转成HttpServletResponse
    > 调用本类添加的void service(HttpServletRequest,HttpServletResponse)方法
  * 添加了void service(HttpServletRequest,HttpServletResponse)方法,内容是:
    > 调用request的getMethod()获取请求方式
    > 如果请求方式为GET,那么调用本类添加的doGet(HttpServletRequest,HttpServletResponse)方法
    > 如果请求方式为POST,那么调用本类添加的doPost(HttpServletRequest,HttpServletResponse)方法
  * 添加了doGet(HttpServletRequest,HttpServletResponse)方法,内容是响应405,表示错误,所以我们应该去覆盖这


个方法
  * 添加了doPost(HttpServletRequest,HttpServletResponse)方法,内容是响应405,表示错误,所以我们应用去覆盖


这个方法


 如果是通过继承HttpServlet类来自定义Sevlet的话,那么:
  * 不要去覆盖void service(ServletRequest,ServletResponse)
  * 不要去覆盖void service(HttpServletRequest, HttpServletResponse)
  * 而应该去覆盖doGet()或doPost()方法。


===============================


<url-pattern>


  <url-pattern>是<servlet-mapping>的子元素,用来绑定Servlet的访问路径
  可以在一个<servlet-mapping>中给出多个<url-pattern>,也就是说一个Servlet可以有多个访问路径:
  <servlet-mapping>
    <servlet-name>xxx</servlet-name>
    <url-pattern>/helo1<url-pattern>
    <url-pattern>/hello2<url-pattern>
  </servlet-mapping>


  还可以在<url-pattern>中使用通配符,即“*”。
  * <url-pattern>/*<url-pattern>:表示匹配任何路径
  * <url-pattern>/do/*<url-pattern>:表示匹配以/do开头的任何路径
  * <url-pattern>*.do<url-pattern>:表示匹配任何以“.do”结尾的路径


  注意:
  * 通配符要么在开头,要么在结尾,不能在中间,例如:/*.do就是错误的使用。
  * 如果不使用通配符,那么<url-pattern>必须以“/”开头,例如:<url-pattern>abc</url-pattern>就是错误的


===============================
===============================
===============================


ServletContext
  
  ServletContext是Servlet三大域对象之一
  ServletContext在服务器启动时创建,在服务器关闭时销毁,一个JavaWeb应用只创建一个ServletContext对象
  
1. 它的功能分类:
  * 存取数据
  * 读取web.xml中的应用初始化参数
  * 读取应用资源


2. 获取ServletContext对象
  在HttpServlet中可以通过以下方法来获取ServletContext对象
  * ServletContext sc = this.getServletContext()
  * ServletContext sc = this.getServletConfig().getServletContext()


2. 存取数据
  因为在一个JavaWeb应用中,只有一个ServletContext对象,所以在ServletContext中保存的数据可以共整个JavaWeb应


用中的动态资源共享
  ServletContext是Servlet三大域对象之一,域对象内部有一个Map,用来保存数据


  * void setAttribute(String name, Object value):用来添加或替换ServletContext域数据
    > servletContext.setAttribute("xxx", "XXX"),添加域数据
    > servletContext.setAttribute("xxx", "XXXX"),覆盖域数据,因为在域中已经存在了名为xxx的数据,所以这次


就是覆盖了
  * Object getAttribute(String name):通过名称来获取域数据
  * void removeAttribute(String name):通过名称移除域数据
  * Enumeration<String> getAttributeNames():获取所有ServletContext域数据的名称


3. 读取web.xml中配置的应用初始化参数


  <context-param>
    <param-name>p1</param-name>
    <param-value>v1</param-value>  
  </context-param>
  <context-param> 
    <param-name>p2</param-name>
    <param-value>v2</param-value>  
  </context-param>


  * servletContext.getInitParameter("p1"),返回v1
  * servletContext.getInitParameter("p2"),返回v2
  * servletContext.getInitParameterNames(),返回Enumeration<String>,包含p1和p2


4. 获取项目资源
  * String getRealPath(String path):获取资源的真实名称
  String path = servletContext.getRealPath("/WEB-INF/a.jpg");
  返回值为/WEB-INF/a.jpg真实路径,即磁盘路径:C:/tomcat6/wabapps/hello/WEB-INF/a.jpg


  * InputStream getResourceAsStream(String path):获取资源的输入流
  InputStream in = servletContext.getResourceAsStream("/WEB-INF/a.jpg");
  返回的是a.jpg的输入流对象,可以从流中得到a.jpg的数据


  * Set<String> getResourcePaths(String path):获取指定目录下的所有资源路径
  Set<String> paths = servletContext.getResourcePaths("/WEB-INF");
  返回的Set中包含如下字符串:
    > /WEB-INF/lib/
    > /WEB-INF/classes/
    > /WEB-INF/web.xml
    > /WEB-INF/a.jpg


===============================
===============================
===============================


获取类路径资源


  可以通过Class类的对象来获取类路径下的资源,对应JavaWeb应用的类路径就是classes目录下的资源
  例如:
  InputStream in = cn.itcast.servlet.MyServlet.class.getResourceAsStream("a.jpg");
  获取的是:/WEB-INF/classes/cn/itcast/servlet/a.jpg,即与MyServlet.class同目录下的资源


  例如:
  InputStream in = cn.itcast.servlet.MyServlet.class.getResourceAsStream("/a.jpg");
  获取的是:/WEB-INF/classes/a.jpg,即类路径的根目录下的资源,类路径的根目录就是/classes目录
  

在处理 `shop_access_log 2014-08-01.txt` 这类访问日志文件时,通常需要通过日志分析技术来提取有价值的信息,以支持运维监控、安全审计、流量分析等目标。以下是几种常见的分析处理方法: ### 日志文件格式解析 访问日志通常以特定格式记录请求信息,例如 Nginx 的 `access_log` 默认格式可能包含客户端 IP、请求时间、请求方法、URL、响应状态码、用户代理等字段。在处理日志前,需要确认日志格式以便正确解析字段内容。例如,Nginx 的典型日志格式如下: ```log 192.168.1.1 - - [01/Aug/2014:12:34:56 +0800] "GET /index.html HTTP/1.1" 200 612 "-" "Mozilla/5.0 ..." ``` 解析时可以使用正则表达式或日志分析工具进行字段提取和结构化存储[^1]。 ### 使用日志分析工具 可以借助日志分析工具自动化处理日志文件,提高分析效率。例如: - **AWStats**:支持 Nginx 等 Web 服务器的日志分析,可以生成访问统计图表,如访问量趋势、访客地区分布、页面访问排名等。 - **GoAccess**:实时日志分析工具,支持命令行和 Web 界面,能够快速展示访问日志中的关键指标。 - **ELK Stack(Elasticsearch + Logstash + Kibana)**:适用于大规模日志处理,支持复杂查询和可视化分析,适合需要长期存储和深度分析的场景。 ### 常用命令行操作 对于较小的日志文件,可以通过 Linux 命令行进行快速分析: - **统计访问量**:按 IP 统计访问次数,识别高频访问者或潜在攻击源。 ```bash awk '{print $1}' shop_access_log_2014-08-01.txt | sort | uniq -c | sort -nr | head -n 10 ``` - **分析 HTTP 状态码**:查看 4xx、5xx 错误数量,排查服务器问题。 ```bash awk '{print $9}' shop_access_log_2014-08-01.txt | sort | uniq -c | sort -nr ``` - **提取特定时间段的日志**:例如分析某个小时内的访问情况。 ```bash awk '$4 >= "[01/Aug/2014:12:00:00" && $4 <= "[01/Aug/2014:13:00:00"' shop_access_log_2014-08-01.txt > log_12h.txt ``` ### 安全分析与异常检测 在日志中查找异常行为,例如频繁的 404 请求、SQL 注入尝试、目录遍历攻击等。可以结合正则表达式匹配可疑请求,例如: ```bash grep -E '404|sql|etc/passwd' shop_access_log_2014-08-01.txt > suspicious_requests.txt ``` 通过分析这些日志,可以发现潜在的安全威胁并采取相应措施[^2]。 ### 日志归档与备份 为了防止日志被篡改或删除,应定期归档日志文件并存储在安全位置。例如,使用脚本将日志按日期分类存储,并结合 `cron` 定时任务执行。以下是一个日志归档脚本示例: ```bash #!/bin/bash log_dir="/data/logs/nginx" date_dir=$(date +%Y%m%d) mkdir -p ${log_dir}/${date_dir} mv ${log_dir}/shop_access_log_2014-08-01.txt ${log_dir}/${date_dir}/ ``` 此外,归档后可以通过 `kill -USR1` 通知 Nginx 重新打开日志文件,避免服务中断[^1]。 ### 数据可视化 将日志数据导入数据库(如 MySQL、Elasticsearch)后,可以使用可视化工具(如 Grafana、Kibana)展示访问趋势、错误率、用户行为等信息,为决策提供数据支持。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值