URL和URI的区别

原文出处:URL和URI的区别


译者:华科小涛:http://www.cnblogs.com/hust-ghtao/太棒了

初学http协议,就被这两个相似的术语搞蒙了,查了很多资料,总算搞清楚了。(找资料还是英文啊,靠谱。。。)。

本篇博客翻译自:https://danielmiessler.com/study/url_vs_uri/,是在是一片简单实用的好文,对帮我们弄清概念很有帮助:

译文:

 

                                                  

 

    一直存在很多技术上的争论,其中最为妙的恐怕就是web地址应该叫什么的问题。通常情况就是这样:有人把地址栏的内容叫“URL”,这时候有些人就来劲了:“不!其实那时URI。。。”

    对于这种纠正的反应呢,通常也有这么几种情况,心眼小的就寻思这人赶紧走吧,淡定点的就耸耸肩表示同意,火气大的就拔刀相向了好不?

那这篇文章呢,就对这个只是提供一个简单的总结,毕竟互黑也要黑到点子上是吧。

 

URI,URL,URN

从上面的那幅图可以看出来,一共有三个不同的概念URI,URL,URN。这讨论这样的问题时,最好的方法就是回到原点啊,这里我们在RFC 3986: Uniform Resource Identifier (URI): Generic Syntax里面收集了点资料:

“A Uniform Resource Identifier (URI) 是一个紧凑的字符串用来标示抽象或物理资源。”

“A URI 可以进一步被分为定位符、名字或两者都是. 术语“Uniform Resource Locator” (URL) 是URI的子集, 除了确定一个资源,还提供一种定位该资源的主要访问机制(如其网络“位置”)。“

那我们无所不知的维基百科把这段消化的很好,并描述的更加形象了:

“URI可以分为URL,URN或同时具备locators 和names特性的一个东西。URN作用就好像一个人的名字,URL就像一个人的地址。换句话说:URN确定了东西的身份,URL提供了找到它的方式。”

通过这些描述我们可以得到一些结论:

 

  • 首先,URL是URI的一种(通过那个图就看的出来吧)。所以有人跟你说URL不是URI,他就错了呗。但也不是所有的URI都是URL哦,就好像蝴蝶都会飞,但会飞的可不都是蝴蝶啊,你让苍蝇怎么想!
  • 让URI能成为URL的当然就是那个“访问机制”,“网络位置”。e.g. http:// or ftp://.。
  • URN是唯一标识的一部分,就是一个特殊的名字。

  下面就来看看例子吧,当来也是来自权威的RFC:

  • ftp://ftp.is.co.za/rfc/rfc1808.txt (also a URL because of the protocol)
  • http://www.ietf.org/rfc/rfc2396.txt (also a URL because of the protocol)
  • ldap://[2001:db8::7]/c=GB?objectClass?one (also a URL because of the protocol)
  • mailto:John.Doe@example.com (also a URL because of the protocol)
  • news:comp.infosystems.www.servers.unix (also a URL because of the protocol)
  • tel:+1-816-555-1212
  • telnet://192.0.2.16:80/ (also a URL because of the protocol)
  • urn:oasis:names:specification:docbook:dtd:xml:4.1.2

  这些全都是URI, 其中有些事URL. 哪些? 就是那些提供了访问机制的.

 

总结

下面到了回答问题的时候了:

当我们替代web地址的时候,URI和URL那个更准确?

基于我读的很多的文章,包括RFC,我想说URI更准确。

别急,我有我的理由:

我们经常使用的URI不是严格技术意义上的URL。例如:你需要的文件在files.hp.com. 这是URI,但不是URL–系统可能会对很多协议和端口都做出正

确的反应。

你去http://files.hp.com 和ftp://files.hp.com.可能得到完全不同的内容。这种情况可能更加普遍,想想不同谷歌域名上的不同服务啊。

所以,用URI吧,这样你通常技术上是正确的,URL可不一定。最后“URL”这个术语正在被弃用。所以明智吧少年!

 
结语

If you don’t mind being “that guy”, URI is probably the more accurate term to use. But if you are in the linguist / “use what’s understood” camp, feel free to Go with URL.

 

参考:

https://en.wikipedia.org/wiki/Uniform_Resource_Identifier

https://danielmiessler.com/study/url_vs_uri/


#######################################3

Java中获取一个浏览器访问地址信息

  1. 3 request  
  2.     * request对象,tomcat根据http协议的请求的内容,将相应的数据封装到request对象中。  
  3.     * request和response必须是成对出现,先有的request,再有的response  
  4.     * 接口:javax.servlet.http.HttpServletRequest extends javax.servlet.ServletRequest  
  5.     * 实现类:tomcat实现,并在请求时,tomcat创建 。  
  6.     * 请求行  
  7.         * 入口:http://localhost:8080/day05/demo/pathRequestServlet?username=jack&password=1234  
  8.         * 请求方式  
  9.             request.getMethod();  
  10.         * 路径  
  11.             // * 请求资源路径  
  12.             // 1 获得servlet路径,web.xml配置的url-pattern【★★★】  
  13.             String servletPath = request.getServletPath();  
  14.             System.out.println(“ 1 servletPath –>” + servletPath);  //–> /demo/pathRequestServlet  
  15.               
  16.             //2 获得发布到tomcat时的项目名称【★★★】  
  17.             String contextPath = request.getContextPath();  
  18.             System.out.println(“ 2 contextPath –>” + contextPath);  //–> /day05  
  19.               
  20.             //3 获得请求行中的资源路径  
  21.             String requestURI = request.getRequestURI();  
  22.             System.out.println(“ 3 requestURI –>” + requestURI);//–>/day05/demo/pathRequestServlet  
  23.               
  24.             //4 获得请求URL(地址栏书写)  
  25.             String requestURL = request.getRequestURL().toString();  
  26.             System.out.println(“ 4 requestURL –>” + requestURL);//–>http://localhost:8080/day05/demo/pathRequestServlet  
  27.             // *** 以上都不获得get请求的参数  
  28.               
  29.             //5 获得get请求的参数,获得的是所有参数的一个字符串  
  30.             String queryString = request.getQueryString();  
  31.             System.out.println(“ 5 queryString –>” + queryString); //–>username=jack&password=1234  
  32.           
  33.         * 协议  
  34.             request.getProtocol();  
  35.     * 请求头  
  36.         * java.lang.String getHeader(java.lang.String name) 获得指定名称的头信息(一条)【★★★】  
  37.         * long getDateHeader(java.lang.String name) 获得特殊数据,时间  
  38.         * int getIntHeader(java.lang.String name) 获得特殊数据,整型  
  39.         * java.util.Enumeration getHeaderNames() 获得所有的请求头的名称  
  40.         * java.util.Enumeration getHeaders(java.lang.String name) 获得指定名称头的所有内容  
  41.         * 实例:防盗链,(不能直接访问 /refererTwoServlet)  
  42.     * 请求体  
  43.         * ServletInputStream getInputStream() 获得请求体的所有内容。(之后讲,文件上传)  
  44.    
  45.     * 核心API  
  46.         * 属性操作  
  47.             * xxxAttribute (set / get / remove)  服务器端【★★★】  
  48.         * 获得参数  
  49.             * 获得浏览器 发送给 服务器端的参数(Parameter)  
  50.             * API【★★★】  
  51.                 * 实例:url?username=jack&username=rose&username=tom&password=1234  
  52.                 * getParameter(java.lang.String name) 获得指定参数的第一个值,如果数据不存在获得null 。  
  53.                     * 例如:getParameter(“username”) 获得 jack  
  54.                 * java.lang.String[] getParameterValues(java.lang.String name) 获得指定参数的所有的值。  
  55.                     * 例如:getParameterValues(“username”) ,获得[jack,rose,tom]  
  56.                 * java.util.Map<String,String[]> getParameterMap() 获得所有的内容,key 参数的名称 ,value 该参数的所有的值  
  57.                     * 例如:{username=[jack,rose,tom],password=[1234]}  
  58.             * 中文乱码  
  59.                 * POST请求【★★★】  
  60.                     * 设置 setCharacterEncoding(java.lang.String env) ,设置字符编码  
  61.                 * GET请求  
  62.                     * new String(username.getBytes(“ISO-8859-1”), ”字符集”);  
3 request
    * request对象,tomcat根据http协议的请求的内容,将相应的数据封装到request对象中。
    * request和response必须是成对出现,先有的request,再有的response
    * 接口:javax.servlet.http.HttpServletRequest extends javax.servlet.ServletRequest
    * 实现类:tomcat实现,并在请求时,tomcat创建 。
    * 请求行
        * 入口:http://localhost:8080/day05/demo/pathRequestServlet?username=jack&password=1234
        * 请求方式
            request.getMethod();
        * 路径
            // * 请求资源路径
            // 1 获得servlet路径,web.xml配置的url-pattern【★★★】
            String servletPath = request.getServletPath();
            System.out.println(" 1 servletPath -->" + servletPath);  //--> /demo/pathRequestServlet

            //2 获得发布到tomcat时的项目名称【★★★】
            String contextPath = request.getContextPath();
            System.out.println(" 2 contextPath -->" + contextPath);  //--> /day05

            //3 获得请求行中的资源路径
            String requestURI = request.getRequestURI();
            System.out.println(" 3 requestURI -->" + requestURI);//-->/day05/demo/pathRequestServlet

            //4 获得请求URL(地址栏书写)
            String requestURL = request.getRequestURL().toString();
            System.out.println(" 4 requestURL -->" + requestURL);//-->http://localhost:8080/day05/demo/pathRequestServlet
            // *** 以上都不获得get请求的参数

            //5 获得get请求的参数,获得的是所有参数的一个字符串
            String queryString = request.getQueryString();
            System.out.println(" 5 queryString -->" + queryString); //-->username=jack&password=1234

        * 协议
            request.getProtocol();
    * 请求头
        * java.lang.String getHeader(java.lang.String name) 获得指定名称的头信息(一条)【★★★】
        * long getDateHeader(java.lang.String name) 获得特殊数据,时间
        * int getIntHeader(java.lang.String name) 获得特殊数据,整型
        * java.util.Enumeration getHeaderNames() 获得所有的请求头的名称
        * java.util.Enumeration getHeaders(java.lang.String name) 获得指定名称头的所有内容
        * 实例:防盗链,(不能直接访问 /refererTwoServlet)
    * 请求体
        * ServletInputStream getInputStream() 获得请求体的所有内容。(之后讲,文件上传)

    * 核心API
        * 属性操作
            * xxxAttribute (set / get / remove)  服务器端【★★★】
        * 获得参数
            * 获得浏览器 发送给 服务器端的参数(Parameter)
            * API【★★★】
                * 实例:url?username=jack&username=rose&username=tom&password=1234
                * getParameter(java.lang.String name) 获得指定参数的第一个值,如果数据不存在获得null 。
                    * 例如:getParameter("username") 获得 jack
                * java.lang.String[] getParameterValues(java.lang.String name) 获得指定参数的所有的值。
                    * 例如:getParameterValues("username") ,获得[jack,rose,tom]
                * java.util.Map<String,String[]> getParameterMap() 获得所有的内容,key 参数的名称 ,value 该参数的所有的值
                    * 例如:{username=[jack,rose,tom],password=[1234]}
            * 中文乱码
                * POST请求【★★★】
                    * 设置 setCharacterEncoding(java.lang.String env) ,设置字符编码
                * GET请求
                    * new String(username.getBytes("ISO-8859-1"), "字符集");

另请参见:

URI和URL的区别


<think>首先,用户的问题是:“URL URI区别”。这是一个关于网络编程的基础知识问题,不是具体的编程代码,但我需要以编程专家的身份回答,尽可能详尽地解释。 关键点: - URL (Uniform Resource Locator):统一资源定位符,用于指定资源的位置访问方式。 - URI (Uniform Resource Identifier):统一资源标识符,是一个更广泛的术语,包括 URL URN (Uniform Resource Name)。 区别: - URI 是标识资源的通用术语。 - URLURI 的子集,它指定了如何获取资源(例如,通过协议HTTP)。 - URN 是另一个子集,用于命名资源,而不指定位置。 作为编程专家,我应该提供一些代码示例来展示如何在实际编程中处理 URL URI。用户提到“尽可能给出代码”,所以我需要包括代码片段。 例如: - 在 Python 中,使用 `urllib.parse` 模块来解析 URL。 - 在 Java 中,使用 `java.net.URI` `java.net.URL` 类。 由于用户没有指定语言,我可以选择一种通用的语言,比如 Python 或 Java。我会选择 Python,因为它更简洁。 代码思路: 1. 展示如何解析一个 URL。 2. 解释 URI 的概念。 用户说“代码请使用markdown格式包裹起来”,所以我需要用 ```python 等包裹代码。 回答流程: - 先回答问题:解释 URL URI区别。 - 然后给出解释:详细说明。 - 接着提供代码示例:例如,在 Python 中解析 URL。 - 最后,提出相关问题:格式为“§§相关问题§§:”后跟1-4个问题。 相关问题格式: - 必须严格遵循:以“§§相关问题§§:”开头,然后列表1. 2. 3. 4. - 问题应该相关,例如,关于 URI/URL 的其他方面、在编程中的使用等。 完整回答结构: 1. **回答问题**:简述 URL URI区别。 2. **给出解释**:详细解释每个概念,包括例子。 3. **代码示例**:提供代码并解释。 4. **相关问题**:列出 4 个相关问题。 代码示例: - 使用 Python: ```python from urllib.parse import urlparse url = "https://www.example.com/path?query=123" parsed_url = urlparse(url) print(parsed_url.scheme) # 输出: https print(parsed_url.netloc) # 输出: www.example.com ``` 解释:这段代码解析 URL 并提取其组成部分。 由于 URI 更抽象,我可以展示如何比较 URI 在 Java 中,但为了简单,用 Python 解释概念。 最终,相关问题: 1. URI URN 的区别是什么? 2. 在 HTTP 请求中,URL 如何被解析? 3. 使用 Python 如何构建一个完整的 URL? 4. URL 编码的作用是什么? 确保回答详尽。</think>### URL URI区别 URL(Uniform Resource Locator,统一资源定位符) URI(Uniform Resource Identifier,统一资源标识符)是网络编程中常见的概念,它们都与资源标识相关,但存在关键区别。以下是简明解释: - **URI (Uniform Resource Identifier)**:是一个更广泛的术语,用于标识任何资源(如文档、图像、服务等)。URI 可以是定位符(URL)、名称(URN)或两者结合。URI 的格式通常包括协议、路径、查询参数等组件,但不一定指定如何访问资源。URI 的目的是唯一标识资源。 - 示例:`urn:isbn:0451450523`(这是一个 URN,表示一本书的 ISBN 号,不指定位置)。 - **URL (Uniform Resource Locator)**:是 URI 的一个子集,专门用于指定资源的位置访问方式(如通过 HTTP 或 FTP)。URL 必须包含协议(如 `http://`),并指明如何获取资源。 - 示例:`https://www.example.com/index.html`(这是一个 URL,指定了资源的网络位置访问协议)。 **核心区别**: - URI 是超集(所有 URL 都是 URI,但并非所有 URI 都是 URL)。URL 专注于资源的位置访问机制,而 URI 更通用,可以包括不指定位置的标识符(如 URN)。 - 在编程中,URI 常用于抽象的资源标识,而 URL 用于具体的资源访问。 ### 详细解释 在编程中,理解 URI URL区别对于处理网络请求、解析资源路径或构建 API 至关重要。以下是关键点: - **URI 结构**:URI 的通用格式为 `[scheme:]scheme-specific-part[?query][#fragment]`。其中: - `scheme`:协议(如 `http`、`ftp`)。 - `scheme-specific-part`:资源的具体路径(如 `//www.example.com/path`)。 - `query`:可选参数(如 `?id=123`)。 - `fragment`:可选锚点(如 `#section1`)。 - **URL 结构**:URLURI 的一种,其格式强制包括协议位置。典型 URL:`<protocol>://<host>/<path>?<query>#<fragment>`。 - 示例:`https://www.google.com/search?q=hello#results`,其中: - `https` 是协议。 - `www.google.com` 是主机。 - `/search` 是路径。 - `q=hello` 是查询参数。 - `results` 是片段。 **为什么重要**: - 在编程中,混淆 URI URL 可能导致错误,例如使用 URI 直接访问资源(URI 可能不包含访问协议,导致失败)。 - 大多数编程语言提供单独的类来处理 URI URL(如 Java 的 `java.net.URI` `java.net.URL`),以确保正确的资源处理。 ### 代码示例:使用 Python 解析 URL URI Python 的 `urllib.parse` 模块提供了工具来解析操作 URL/URI。以下代码演示如何解析一个 URL 并提取其组件,同时解释 URI 的概念。 ```python from urllib.parse import urlparse, urlunparse # 示例 URL(这是一个具体的 URI,因为它指定了访问位置) url = "https://www.example.com:8080/path/to/resource?query=param#fragment" # 解析 URL parsed_url = urlparse(url) # 输出解析后的组件 print("解析后的 URL 组件:") print(f"Scheme (协议): {parsed_url.scheme}") # 输出: https print(f"Netloc (网络位置): {parsed_url.netloc}") # 输出: www.example.com:8080 print(f"Path (路径): {parsed_url.path}") # 输出: /path/to/resource print(f"Query (查询参数): {parsed_url.query}") # 输出: query=param print(f"Fragment (片段): {parsed_url.fragment}") # 输出: fragment # 构建回完整 URL(演示 URL 操作) reconstructed_url = urlunparse(( parsed_url.scheme, parsed_url.netloc, parsed_url.path, '', # 通常为空 parsed_url.query, parsed_url.fragment )) print(f"\n重构后的 URL: {reconstructed_url}") # 输出: https://www.example.com:8080/path/to/resource?query=param#fragment # URI 概念演示:URI 可以是非 URL 形式,如 URN urn_uri = "urn:isbn:0451450523" # 这是一个 URI(URN),但不是 URL,因为它不指定位置 try: parsed_urn = urlparse(urn_uri) print(f"\n解析 URN URI - Scheme: {parsed_urn.scheme}") # 输出: urn except Exception as e: print(f"错误:{e}") # 不会出错,但解析后无法直接用于网络访问 ``` **代码解释**: - `urlparse(url)`:将 URL 字符串解析为命名元组,提取协议、主机、路径等组件。 - `urlunparse()`:将解析后的组件重新构建为完整 URL,确保格式正确。 - 在示例中,`https://www.example.com...` 是一个 URL(也是 URI),而 `urn:isbn:0451450523` 是一个 URI(但不是 URL),因为它只标识资源而不提供访问方式。 - 关键点:URL 必须包含协议(如 `http`),而 URI 可以是更抽象的标识符。在编程中,使用 `urlparse` 可以处理 URL,但 URI 的广义概念需要开发者确保资源标识的准确性。 在真实项目中,正确处理 URI/URL 可避免资源访问错误(如无效链接或 API 请求失败)。例如,在 Web 开发中,URL 用于 HTTP 请求,而 URI 用于 RESTful API 的资源标识。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值