URL和URI

解析URL与URN

参见:https://tools.ietf.org/html/rfc3986#section-1.1

 

URL是Uniform Resource Locator的缩写,即统一资源定位器,它是一个识别Internet中哪里有信息资源,并且将 Internet提供的服务统一编址的系统。通过URL可以到达任何一个地方寻找需要的东西,比如文件、数据库、图像、新闻组等等,可以这样说,URL是 Internet上的地址簿。URL一般由三个部分构成,各个部分如下: 1. 服务器标识符  通过选择服务器标识符能够确定将要访问的服务器的类型, URL中的服务器标识符可以有HTTP://、FTP://、GOPHER://、TELNET://、NWES://等等类型,分别指定为采用超文本传输协议连接、采用文件传输协议连接、与GOPHER服务器连接、与TELNET会话连接、与USENET新闻组相连接。 2. 信息资源地址  信息资源地址是由两部分构成的,一是机器名称,如www.tsinghua.edu.cn是用来指示资源所存在的机器,另一个是通信端口号(port number),是连接时所使用的通信端口号。端口是Internet用来辨别特定信息服务用的一种软件标识,其设置范围是0到65535之间的整数,一般情况下使用的是标准端口号,可以不用写出。在需要特殊服务时会用到非标准端口号,这时就要写出,如http://www.tsinghua.edu.cn:81。常见的Internet提供服务的端口号,如HTTP的标准端口号为80,TELNET的标准端口号为23,FTP的标准端口号为21等等。 3. 路径名  路径名是给出资源在所在机器上的完整文件名,一般情况下只有用户知道所要找的资源在什么地方时才会给出这个选项。如http://www.tsinghua.edu.cn/index.html等。

 

 

 

通过下面的例子(源自 Wikipedia),我们可以很好地理解URN 和 URL之间的区别。如果是一个人,我们会想到他的姓名和住址。

URL类似于住址,它告诉你一种寻找目标的方式(在这个例子中,是通过街道地址找到一个人)。要知道,上述定义同时也是一个URI。

相对地,我们可以把一个人的名字看作是URN;因此可以用URN来唯一标识一个实体。由于可能存在同名(姓氏也相同)的情况,所以更准确地说,人名这个例子并不是十分恰当。更为恰当的是书籍的ISBN码和产品在系统内的序列号,尽管没有告诉你用什么方式或者到什么地方去找到目标,但是你有足够的信息来检索到它。引自这篇文章:

所有的URN都遵循如下语法(引号内的短语是必须的):

 

 

其中NID是命名空间标识符,NSS是标识命名空间的特定字符串。

一个用于理解这三者的例子

我们来看一下上述概念如何应用于与我们息息相关的互联网。

再次引用Wikipedia ,这些引文给出的解释,比上面人员地址的例子更为专业:

关于URL:

URL是URI的一种,不仅标识了Web 资源,还指定了操作或者获取方式,同时指出了主要访问机制和网络位置。

关于URN:

URN是URI的一种,用特定命名空间的名字标识资源。使用URN可以在不知道其网络位置及访问方式的情况下讨论资源。

现在,如果到Web上去看一下,你会找出很多例子,这比其他东西更容易让人困惑。我只展示一个例子,非常简单清楚地告诉你在互联网中URI 、URL和URN之间的不同。

我们一起来看下面这个虚构的例子。这是一个URI

 

我们开始分析

 

 

是定义如何访问资源的方式。另外

 

 

是资源存放的位置,那么,在这个例子中,

 

 

是资源。

URL是URI的一个子集,告诉我们访问网络位置的方式。在我们的例子中,URL应该如下所示:

 

 

URN是URI的子集,包括名字(给定的命名空间内),但是不包括访问方式,如下所示:

 

就是这样。现在你应该能够辨别出URL和URN之间的不同。

 

转载于:https://www.cnblogs.com/ruoju/p/5956219.html

<think>首先,用户的问题是:“URL URI 的区别”。这是一个关于网络编程的基础知识问题,不是具体的编程代码,但我需要以编程专家的身份回答,尽可能详尽地解释。 关键点: - URL (Uniform Resource Locator):统一资源定位符,用于指定资源的位置访问方式。 - URI (Uniform Resource Identifier):统一资源标识符,是一个更广泛的术语,包括 URL URN (Uniform Resource Name)。 区别: - URI 是标识资源的通用术语。 - URLURI 的子集,它指定了如何获取资源(例如,通过协议如 HTTP)。 - URN 是另一个子集,用于命名资源,而不指定位置。 作为编程专家,我应该提供一些代码示例来展示如何在实际编程中处理 URL URI。用户提到“尽可能给出代码”,所以我需要包括代码片段。 例如: - 在 Python 中,使用 `urllib.parse` 模块来解析 URL。 - 在 Java 中,使用 `java.net.URI` `java.net.URL` 类。 由于用户没有指定语言,我可以选择一种通用的语言,比如 Python 或 Java。我会选择 Python,因为它更简洁。 代码思路: 1. 展示如何解析一个 URL。 2. 解释 URI 的概念。 用户说“代码请使用markdown格式包裹起来”,所以我需要用 ```python 等包裹代码。 回答流程: - 先回答问题:解释 URL URI 的区别。 - 然后给出解释:详细说明。 - 接着提供代码示例:例如,在 Python 中解析 URL。 - 最后,提出相关问题:格式为“§§相关问题§§:”后跟1-4个问题。 相关问题格式: - 必须严格遵循:以“§§相关问题§§:”开头,然后列表1. 2. 3. 4. - 问题应该相关,例如,关于 URI/URL 的其他方面、在编程中的使用等。 完整回答结构: 1. **回答问题**:简述 URL URI 的区别。 2. **给出解释**:详细解释每个概念,包括例子。 3. **代码示例**:提供代码并解释。 4. **相关问题**:列出 4 个相关问题。 代码示例: - 使用 Python: ```python from urllib.parse import urlparse url = "https://www.example.com/path?query=123" parsed_url = urlparse(url) print(parsed_url.scheme) # 输出: https print(parsed_url.netloc) # 输出: www.example.com ``` 解释:这段代码解析 URL 并提取其组成部分。 由于 URI 更抽象,我可以展示如何比较 URI 在 Java 中,但为了简单,用 Python 解释概念。 最终,相关问题: 1. URI URN 的区别是什么? 2. 在 HTTP 请求中,URL 如何被解析? 3. 使用 Python 如何构建一个完整的 URL? 4. URL 编码的作用是什么? 确保回答详尽。</think>### URL URI 的区别 URL(Uniform Resource Locator,统一资源定位符) URI(Uniform Resource Identifier,统一资源标识符)是网络编程中常见的概念,它们都与资源标识相关,但存在关键区别。以下是简明解释: - **URI (Uniform Resource Identifier)**:是一个更广泛的术语,用于标识任何资源(如文档、图像、服务等)。URI 可以是定位符(URL)、名称(URN)或两者结合。URI 的格式通常包括协议、路径、查询参数等组件,但不一定指定如何访问资源。URI 的目的是唯一标识资源。 - 示例:`urn:isbn:0451450523`(这是一个 URN,表示一本书的 ISBN 号,不指定位置)。 - **URL (Uniform Resource Locator)**:是 URI 的一个子集,专门用于指定资源的位置访问方式(如通过 HTTP 或 FTP)。URL 必须包含协议(如 `http://`),并指明如何获取资源。 - 示例:`https://www.example.com/index.html`(这是一个 URL,指定了资源的网络位置访问协议)。 **核心区别**: - URI 是超集(所有 URL 都是 URI,但并非所有 URI 都是 URL)。URL 专注于资源的位置访问机制,而 URI 更通用,可以包括不指定位置的标识符(如 URN)。 - 在编程中,URI 常用于抽象的资源标识,而 URL 用于具体的资源访问。 ### 详细解释 在编程中,理解 URI URL 的区别对于处理网络请求、解析资源路径或构建 API 至关重要。以下是关键点: - **URI 结构**:URI 的通用格式为 `[scheme:]scheme-specific-part[?query][#fragment]`。其中: - `scheme`:协议(如 `http`、`ftp`)。 - `scheme-specific-part`:资源的具体路径(如 `//www.example.com/path`)。 - `query`:可选参数(如 `?id=123`)。 - `fragment`:可选锚点(如 `#section1`)。 - **URL 结构**:URLURI 的一种,其格式强制包括协议位置。典型 URL:`<protocol>://<host>/<path>?<query>#<fragment>`。 - 示例:`https://www.google.com/search?q=hello#results`,其中: - `https` 是协议。 - `www.google.com` 是主机。 - `/search` 是路径。 - `q=hello` 是查询参数。 - `results` 是片段。 **为什么重要**: - 在编程中,混淆 URI URL 可能导致错误,例如使用 URI 直接访问资源(URI 可能不包含访问协议,导致失败)。 - 大多数编程语言提供单独的类来处理 URI URL(如 Java 的 `java.net.URI` `java.net.URL`),以确保正确的资源处理。 ### 代码示例:使用 Python 解析 URL URI Python 的 `urllib.parse` 模块提供了工具来解析操作 URL/URI。以下代码演示如何解析一个 URL 并提取其组件,同时解释 URI 的概念。 ```python from urllib.parse import urlparse, urlunparse # 示例 URL(这是一个具体的 URI,因为它指定了访问位置) url = "https://www.example.com:8080/path/to/resource?query=param#fragment" # 解析 URL parsed_url = urlparse(url) # 输出解析后的组件 print("解析后的 URL 组件:") print(f"Scheme (协议): {parsed_url.scheme}") # 输出: https print(f"Netloc (网络位置): {parsed_url.netloc}") # 输出: www.example.com:8080 print(f"Path (路径): {parsed_url.path}") # 输出: /path/to/resource print(f"Query (查询参数): {parsed_url.query}") # 输出: query=param print(f"Fragment (片段): {parsed_url.fragment}") # 输出: fragment # 构建回完整 URL(演示 URL 操作) reconstructed_url = urlunparse(( parsed_url.scheme, parsed_url.netloc, parsed_url.path, '', # 通常为空 parsed_url.query, parsed_url.fragment )) print(f"\n重构后的 URL: {reconstructed_url}") # 输出: https://www.example.com:8080/path/to/resource?query=param#fragment # URI 概念演示:URI 可以是非 URL 形式,如 URN urn_uri = "urn:isbn:0451450523" # 这是一个 URI(URN),但不是 URL,因为它不指定位置 try: parsed_urn = urlparse(urn_uri) print(f"\n解析 URN URI - Scheme: {parsed_urn.scheme}") # 输出: urn except Exception as e: print(f"错误:{e}") # 不会出错,但解析后无法直接用于网络访问 ``` **代码解释**: - `urlparse(url)`:将 URL 字符串解析为命名元组,提取协议、主机、路径等组件。 - `urlunparse()`:将解析后的组件重新构建为完整 URL,确保格式正确。 - 在示例中,`https://www.example.com...` 是一个 URL(也是 URI),而 `urn:isbn:0451450523` 是一个 URI(但不是 URL),因为它只标识资源而不提供访问方式。 - 关键点:URL 必须包含协议(如 `http`),而 URI 可以是更抽象的标识符。在编程中,使用 `urlparse` 可以处理 URL,但 URI 的广义概念需要开发者确保资源标识的准确性。 在真实项目中,正确处理 URI/URL 可避免资源访问错误(如无效链接或 API 请求失败)。例如,在 Web 开发中,URL 用于 HTTP 请求,而 URI 用于 RESTful API 的资源标识。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值