W楠-优快云博客

原创七十五：握手的优化：Session缓存、Ticket票据及TLS 1.3的0-RTT

为了优化握手的效率，TLS协议引入了多种机制，包括Session缓存、票据（Session Ticket）及TLS 1.3中的0-RTT。通过Session缓存、票据和TLS 1.3的0-RTT握手机制，TLS协议显著优化了原有的握手过程。这些方法不仅提高了连接的性能，降低了延迟，同时保持了加密连接的安全性。这样，在未来的连接中，客户端可以使用先前的会话ID来请求重新建立连接，从而减少握手的步骤。TLS 1.3协议引入了0-RTT（零往返时间）握手的概念，这进一步优化了连接的建立过程。

2025-01-15 09:40:03 699

原创七十四：TLS 1.2与TLS 1.3中的ECDH协议

椭圆曲线Diffie-Hellman（ECDH）是一种密钥交换协议，允许两方在不直接交换密钥的情况下生成共享的秘密密钥。ECDH利用椭圆曲线的数学特性，使得密钥交换过程在计算上既安全又高效。ECDH的安全性依赖于椭圆曲线对离散对数问题的抵抗力，提供比传统Diffie-Hellman协议更高的安全性和更小的密钥长度。

2025-01-15 09:36:54 224

原创七十三：DH协议升级：基于椭圆曲线的ECDH协议

DH协议由Whitfield Diffie和Martin Hellman于1976年提出，旨在允许两方在不安全的通道中安全地交换密钥。其基本思想是双方各自生成私钥，然后计算共享密钥。尽管DH协议为安全通信奠定了基础，但其主要安全性依赖于大整数分解的困难性，因此，当密钥长度不足时，容易受到攻击。

2025-01-14 11:01:57 199

原创七十二：ECC椭圆曲线的特性

椭圆曲线密码学（Elliptic Curve Cryptography, ECC）是一种基于椭圆曲线数学特性而发展起来的公钥密码学方案。与传统公钥加密方法（如RSA）相比，ECC在较小的密钥尺寸下提供相同水平的安全性，因此它在现代安全通信中得到了广泛应用。本文将深入探讨ECC的椭圆曲线特性及其加密应用。

2025-01-14 10:59:37 64

原创七十一：非对称密码应用：DH密钥交换协议

DH密钥交换协议作为非对称密码学的奠基石之一，为现代安全通信奠定了重要基础。尽管它存在一些缺陷，但通过与其他技术的结合和改进，DH协议依然在诸多领域发挥着重要作用。在未来，随着量子计算的崛起，研究更加安全、高效的密钥交换协议将成为密码学的重要方向。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客二：基于ABNF语义定义的HTTP消息格式-优快云博客三:网络为什么要分层：OSI模型与TCP/IP模型-优快云博客四：HTTP的诞生：它解决了哪些网络通信难题？

2025-01-13 11:10:11 400

原创七十：非对称密码应用：PKI证书体系

非对称密码技术，也称公钥密码技术，使用一对密钥（公钥和私钥）来完成加密和解密。公钥公开用于加密数据或验证签名。私钥由用户保密，用于解密数据或生成签名。这种双密钥机制使得非对称密码在身份认证、数字签名和密钥交换等场景中具有独特优势。PKI 是一套基于非对称密码技术的标准和服务，用于管理公钥和私钥的生命周期。证书颁发机构（Certificate Authority，CA）CA 是 PKI 的核心，负责签发、管理和撤销数字证书。CA 的可信性直接决定了整个 PKI 系统的安全性。

2025-01-11 11:19:50 539

原创六十九：基于openssl实战验证RSA

本文通过实际操作展示了使用 OpenSSL 进行 RSA 的密钥生成、加密解密以及签名验证的全过程。这些操作不仅有助于加深对 RSA 工作原理的理解，还为实际开发中的安全性需求提供了实践参考。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客二：基于ABNF语义定义的HTTP消息格式-优快云博客三:网络为什么要分层：OSI模型与TCP/IP模型-优快云博客四：HTTP的诞生：它解决了哪些网络通信难题？-优快云博客五：评估Web架构的七大关键属性-优快云博客。

2025-01-11 11:17:39 507

原创六十八：非对称密码与RSA算法

公钥（Public Key）：公开给所有人的密钥，用于加密数据或验证数字签名。私钥（Private Key）：保密的密钥，仅持有者可使用，用于解密数据或生成数字签名。这种密钥对的数学关系确保公钥无法轻易推导出私钥。消除了对密钥分发的需求，提升了安全性。适合公开环境下的安全通信。优缺点：优点：无需提前共享密钥，密钥管理方便。缺点：加解密过程比对称加密慢，计算复杂度更高。

2025-01-10 10:39:38 316

原创六十七：详解AES对称加密算法

对称加密是一种加密方式，其特点是加密和解密使用相同的密钥。加密算法将明文通过密钥转换为密文，而解密算法则利用相同的密钥将密文还原为明文。速度快：算法简单，适合处理大规模数据。实现方便：加解密过程较为直观。然而，其最大挑战是密钥的安全分发和管理。

2025-01-10 10:37:19 185

原创六十六：对称加密的工作原理（2）：工作模式

对称加密的工作模式直接影响了加密算法的效率、安全性和应用场景。从最简单的ECB模式到复杂的CBC、CTR等模式，每种工作模式在处理数据时有其独特的优势和劣势。选择合适的工作模式需要根据加密任务的性质、性能要求和安全需求来决定。ECB：简单但安全性差，适用于低安全要求且数据没有重复的场景。CBC：广泛使用，安全性较高，但不能并行处理。CTR：支持并行加密，适用于高性能要求，但需要小心计数器管理。OFB与CFB：适合流加密，但管理和效率方面不如CTR模式。

2025-01-08 11:23:22 230

原创六十五：对称加密的工作原理（1）：XOR与填充

在对称加密中，XOR运算和填充技术发挥了重要作用。XOR作为一种高效且可逆的运算方法，是加密算法中最基本的操作之一。而填充技术则解决了数据长度不匹配的问题，确保了加密算法的稳定性和可靠性。随着加密算法的发展，XOR和填充可能被结合到更复杂的算法和加密模式中，如分组加密模式（如CBC模式）和流加密模式，但它们仍然是理解现代加密算法工作原理的基础。了解这些基本操作有助于更好地理解对称加密技术及其应用。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客。

2025-01-08 11:17:43 80

原创六十四：TLS协议的工作原理

TLS是SSL（Secure Sockets Layer，安全套接字层）的继任者，其主要目标是为通信双方提供机密性、数据完整性和身份认证。机密性：通过加密保护数据免遭窃听。数据完整性：确保数据在传输过程中未被篡改。身份认证：验证通信双方的身份，通常通过数字证书实现。TLS协议通过握手、加密和完整性校验，为网络通信提供了强大的安全保障。随着版本的演进，TLS在性能和安全性上不断提升，已成为互联网安全的基石。然而，在实际部署中，仍需关注协议配置和证书管理，以确保其安全效能。

2025-01-06 14:20:27 147

原创六十三：七层负载均衡做了些什么？

七层负载均衡是基于OSI模型中第七层（应用层）的负载均衡技术。与四层负载均衡不同，七层负载均衡能够读取并解析应用层数据包，从而根据HTTP头、URL路径、Cookie、查询参数甚至用户身份等内容做出流量分发决策。它更适合需要深度流量管理和高级路由的场景。七层负载均衡通过深入理解应用层流量，提供了超越传统负载均衡的能力。它不仅优化了流量分发和服务器性能，还能显著提升用户体验与安全性。在云原生架构和现代化应用中，七层负载均衡已成为不可或缺的一部分。

2025-01-06 14:17:10 409

原创六十二：HTTP/3: QUIC 协议格式

HTTP/3 的出现标志着网络传输协议的一次重大升级，而其背后的核心技术 QUIC 协议，则为这一升级提供了坚实的基础。从无队头阻塞、多路复用到增强的安全性和灵活性，QUIC 协议的设计理念为现代网络需求量身定制。随着 HTTP/3 的逐步推广和普及，它将显著改善用户的网络体验，为未来的互联网发展奠定基础。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客二：基于ABNF语义定义的HTTP消息格式-优快云博客。

2025-01-02 16:49:05 538

原创六十一：HTTP/2的问题及HTTP/3的意义

HTTP/3 的推出标志着网络传输协议的又一次重大升级。从 HTTP/2 的技术难题出发，HTTP/3 提供了基于 QUIC 的创新解决方案，不仅提高了传输效率，还增强了网络安全性和适应性。随着 HTTP/3 的逐步普及，它将为互联网用户带来更快速、更可靠的网络体验，成为未来网络协议发展的重要基石。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客二：基于ABNF语义定义的HTTP消息格式-优快云博客三:网络为什么要分层：OSI模型与TCP/IP模型-优快云博客。

2025-01-02 16:45:36 520

原创六十：HTTP/2与gRPC框架

HTTP/2是HTTP协议的第二个主要版本，相较于HTTP/1.x，HTTP/2在性能和功能上做出了显著改进。gRPC是一个开源的高性能远程过程调用（RPC）框架，由Google设计并基于HTTP/2协议构建。gRPC支持多种编程语言，适合分布式系统的通信需求。HTTP/2协议和gRPC框架的结合为现代网络通信提供了高效、灵活和可靠的解决方案。随着微服务架构和分布式系统的普及，gRPC的使用场景将进一步扩大，成为开发者构建高性能通信系统的重要工具。

2024-12-28 12:38:04 421 1

原创五十九：非TCP流量控制机制

非TCP流量控制机制提供了灵活、低延迟和高性能的解决方案，特别适合特定场景的需求。然而，与TCP相比，这些机制通常需要开发者投入更多的精力进行设计和调试。在选择流量控制机制时，需权衡应用场景的需求和开发成本，以实现最佳效果。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客二：基于ABNF语义定义的HTTP消息格式-优快云博客三:网络为什么要分层：OSI模型与TCP/IP模型-优快云博客四：HTTP的诞生：它解决了哪些网络通信难题？-优快云博客。

2024-12-28 12:34:54 237

原创五十八：我们需要Stream优先级

在网络通信和数据传输中，特别是在使用HTTP/2协议时，Stream优先级的概念显得尤为重要。Stream优先级通过对不同数据流进行排序，使得网络资源能够更加高效地分配，从而提升用户体验和减少延迟。本文将探讨Stream优先级的必要性、实现方式以及其在网络通信中的应用。

2024-12-27 10:57:43 162

原创五十七：RST_STREAM帧及常见错误码

RST_STREAM帧是HTTP/2协议中的一种控制帧，用于强制结束一个流并释放与该流相关的资源。每个流都有一个唯一的流标识符，而RST_STREAM帧包含需要结束的流的标识符以及表示原因的错误码。当一方希望终止某个流时，可以发送RST_STREAM帧，此帧的接收方应当立即停止对该流的处理，并及时释放相关的资源。当一方发现某个流已经不再需要。当流的传输中发生了错误，无法继续。当资源受限，不得不停掉某些流以确保系统的正常运行。

2024-12-27 10:55:34 278

原创五十六：Stream的状态变迁

Stream 是一种数据传输的抽象，表示数据从一个地方传输到另一个地方的过程。它可以是有限的（如文件流），也可以是无限的（如实时数据流）。Stream 通过异步方式传递数据，能够显著提高系统的响应能力和吞吐量。Stream 的状态变迁是其运行机制的核心，理解和掌握状态流转过程能够帮助开发者更高效地设计和优化系统。在实践中，选择合适的工具和模型，结合业务需求灵活处理流的状态问题，能够为系统的性能和可靠性提供强有力的支持。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客。

2024-12-26 16:41:19 170

原创五十五：服务器端的主动消息推送

服务器端的主动消息推送技术极大地改善了现代应用的实时交互能力。在实际开发中，选择合适的推送方案需要根据业务需求、技术难度和资源成本综合考量。无论是 WebSocket、SSE，还是推送通知，它们都在不同的场景中展现了独特的价值，助力开发者打造更加智能、实时的互联网应用。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客二：基于ABNF语义定义的HTTP消息格式-优快云博客三:网络为什么要分层：OSI模型与TCP/IP模型-优快云博客。

2024-12-26 16:37:24 598

原创五十四：HPACK中头部名称与值的编码格式

在HTTP/1.x协议中，每个请求和响应都会包括一个头部字段列表，这些字段可能重复出现在多个请求或响应中，增加了带宽的消耗。为了提升HTTP/2的性能，HPACK通过对头部字段进行压缩来优化网络传输。静态表（Static Table）：预定义的固定头部名称列表，常用于标准的HTTP头部字段（如User-Agent等）。动态表（Dynamic Table）：动态构建的表格，存储会话过程中出现的头部名称和值。头部名称和值的编码方式是HPACK压缩的核心，直接影响到压缩的效率和带宽的节省。

2024-12-25 17:49:46 328

原创五十三：HPACK中整型数字的编码

HPACK的目标是通过对头部进行有效的压缩，减少HTTP/2请求和响应头的大小。头部通常由键值对组成，其中键和值常常是字符串类型。但为了进一步优化压缩效果，HPACK不仅支持字符串压缩，还使用了整数值压缩的方法。这对于许多HTTP头部字段（如缓存控制、Cookie、Content-Length等）来说，极为重要，因为它们通常包含数字型值。HPACK中的整型数字编码采用了无符号整数变长编码的方法，通过根据数字的大小动态调整编码长度，最大化压缩效果。

2024-12-25 17:47:42 200

原创五十二：HPACK中如何使用Huffman树编码？

分配较短的编码。分配较长的编码。这种方法确保了整体数据的平均编码长度最小化，从而实现数据压缩。

2024-12-24 15:23:42 201

原创五十一：HPACK如何减少HTTP头部的大小？

在现代的Web通信中，HTTP是最常用的协议。然而，随着网络应用程序的复杂化，HTTP头部的大小迅速增加，尤其是在HTTP/2中，由于其多路复用特性，多个请求和响应共享同一个连接，头部大小对性能的影响变得更加显著。为了解决这个问题，HTTP/2引入了HPACK压缩算法，以减少HTTP头部的大小并提高传输效率。

2024-12-24 15:20:30 350

原创五十：带号格式：带型及设置带的子型

带型是用于区分和标识不同功能带的基本类型。带型确定了带的基本功能，如数据传输、操作指令和连接管理。通常，带型被用于标明子型的主要用途，从而允许系统根据需求对带进行重点处理。HTTP/2 中的带型：包括HEADERS带、DATA带和SETTINGS带，对带内容和处理进行核心规定。设置带的子型是与设置相关的其他提交值和选项，用于实现选择性和可配置性功能。子型充分提供了更精细的定义，可以配置带的操作行为。

2024-12-23 16:19:32 171

原创四十九：Stream流ID的作用

Stream流ID是一个唯一的数字标识，用于区分同一个连接中传输的多个流。在HTTP/2和其他日现协议中，流ID通常为一个整数，逐步增加或根据协议规定生成。在HTTP/2中，每个流ID只能被一方分配，并根据连接对称确保唯一性：由客户端分配的流ID为奇数，由服务器分配的流ID为偶数。这些规则确保了安全性和同步性。

2024-12-23 16:14:10 153

原创四十八：Web中带带封表的关系：帧，消息与流

在Web开发中，帧、消息与流是三个互相支持的基本概念，它们通过添加对协议和应用程序的构建，为现代化网络应用提供了精简、高效的流程。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客二：基于ABNF语义定义的HTTP消息格式-优快云博客三:网络为什么要分层：OSI模型与TCP/IP模型-优快云博客四：HTTP的诞生：它解决了哪些网络通信难题？-优快云博客五：评估Web架构的七大关键属性-优快云博客六：从五种架构风格推导出HTTP的REST架构-优快云博客。

2024-12-13 11:47:27 280

原创四十七：h2c：在TCP上从HTTP/1升级到HTTP/2

HTTP/2是一种带来性能和效率重大提升的轮连协议，但在一些场景中，从HTTP/1升级到HTTP/2需要保持往处的吞和互操作。h2c是为解决这个问题而设计的无加密HTTP/2协议格式。这里将介绍如何在TCP上通过h2c完成升级。

2024-12-12 16:02:49 907 1

原创四十六：如何使用Wireshark解密TLS/SSL报文？

通过Wireshark解密TLS/SSL流量可以帮助开发人员和安全分析师深入了解网络通信。本文介绍了三种解密方法，其中使用TLS密钥日志文件是一种通用且推荐的方式。希望本文能为您的调试工作提供帮助。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客二：基于ABNF语义定义的HTTP消息格式-优快云博客三:网络为什么要分层：OSI模型与TCP/IP模型-优快云博客四：HTTP的诞生：它解决了哪些网络通信难题？-优快云博客。

2024-12-12 15:56:14 3012

原创四十五：HTTP/2特性概述

作为HTTP/1.1的继任者，HTTP/2旨在解决HTTP/1.1的性能瓶颈，同时保持对原有语义的兼容性。这种特性非常适用于网页资源的预加载，例如，服务器可以在发送HTML页面时，主动推送相关的CSS和JavaScript文件，从而减少客户端的加载延迟。二进制分帧机制将数据划分为更小的帧，这些帧可以独立传输和重组，使得协议解析更高效，同时减少了文本解析时可能产生的歧义。通过动态表和静态表的结合，HTTP/2能够有效地压缩重复性高的头部字段，特别是在频繁的小请求中表现尤为明显。

2024-12-11 10:34:40 523

原创四十四：HTTP/1.1发展中遇到的问题

然而，随着互联网的迅速发展和应用场景的不断扩展，HTTP/1.1在设计和实现过程中暴露出了一些问题。然而，这种组合依赖于额外的配置，未加密的HTTP通信仍然广泛存在，暴露于中间人攻击和数据窃取的风险中。每个HTTP/1.1请求都需要完整的头部信息，即使多个请求共享相同的上下文，这种重复会增加带宽消耗，特别是在传输小文件或频繁请求时尤为显著。HTTP/1.1的设计在灵活性上存在一定限制，例如，扩展功能时需要引入新的请求方法或头字段，但这些修改常常与现有实现不兼容，导致兼容性问题。

2024-12-11 10:31:57 545

原创四十三：Web如何保持会话心跳

会话心跳是一种机制，用于定期向服务器发送信号（通常是HTTP请求），以表明用户仍然在线或活跃。服务器接收到心跳信号后，可以重置会话超时时间或执行其他逻辑，确保会话继续有效。通过合理设计会话心跳机制，可以有效提升用户体验并确保会话的持续性。无论是通过AJAX、WebSocket还是HTTP/2，开发者都需要根据应用场景选择合适的实现方式，并兼顾性能和安全性。一：浏览器发起 HTTP 请求的典型场景_浏览器如何发送用户名密码的请求-优快云博客二：基于ABNF语义定义的HTTP消息格式-优快云博客。

2024-12-09 11:49:43 312

原创四十四：Web如何关闭会话

会话关闭是Web应用中不可忽视的一部分，它不仅能提高系统的安全性，还能优化资源使用。结合适当的触发条件和实现方法，可以实现高效、可靠的会话管理。

2024-12-09 11:40:50 257

原创四十二：掩码及其所针对的代理污染攻击

掩码（Masking）是数据保护和隐私安全中的一个重要概念，通常用于隐藏或模糊化敏感信息，确保数据传输过程中的隐私性和安全性。在网络中，掩码可以用于隐藏IP地址、用户身份或者其他敏感信息，从而避免数据被未经授权的第三方获取或篡改。掩码技术最常见的应用之一是在IP地址中使用子网掩码。子网掩码允许网络管理员将网络地址与主机地址分开，从而控制不同IP地址段的访问权限。通过掩码，系统可以决定哪些IP地址属于同一网络，哪些是外部的。

2024-12-07 11:30:30 153

原创四十一：Web传递消息时的编码格式

在Web开发中，数据的编码格式直接关系到数据的传递效率与准确性。常见的编码格式包括URL编码、UTF-8编码、Base64编码、JSON编码和表单数据编码等。每种编码格式有其独特的使用场景，开发者需要根据具体需求选择合适的编码方式，以确保Web应用的顺利运行。随着Web应用的不断发展，理解和掌握这些编码格式，对于处理和交换数据变得尤为重要。在开发过程中，选择合适的编码格式不仅能提高数据传输的效率，还能保障跨平台、跨语言的数据兼容性。

2024-12-07 11:29:21 390

原创四十：如何从HTTP升级到WebSocket

WebSocket是一种基于TCP协议的全双工通信协议，能够在客户端和服务器之间提供持久的、低延迟的通信通道。一旦建立连接，WebSocket可以支持实时的双向数据传输，而无需每次请求都重新建立连接。与HTTP协议不同，WebSocket更适合用于即时消息推送、在线游戏、实时股票行情等场景。从HTTP协议升级到WebSocket协议是实现实时通信的关键步骤。通过握手过程，客户端和服务器能够顺利转换协议，建立持久的、双向的通信通道，进一步实现低延迟、实时的数据交换。

2024-12-06 11:46:31 1016

原创三十九：WebSocket协议：实时通信的未来

WebSocket是一种网络通信协议，基于TCP协议，在客户端和服务器之间建立一个持久的全双工通信通道。它由IETF于2011年发布，标准化为RFC 6455。与传统的HTTP协议不同，WebSocket允许在客户端和服务器之间进行双向的实时通信，而无需不断地建立和关闭连接，从而减少了通信的延迟。WebSocket协议通过在HTTP协议的基础上进行一次握手来建立连接。一旦建立连接，双方可以在同一个连接上交换数据，直到其中一方主动关闭连接。

2024-12-06 11:43:00 121

原创三十八：WebSocket的约束

WebSocket作为一种高效的实时通信协议，在许多场景中提供了巨大的价值，但其使用也受限于兼容性、安全性、网络条件和维护成本等多方面的约束。相比传统的HTTP请求，开发者无法直接查看每次请求和响应的详细日志，需要使用专用的工具（如Chrome DevTools）来监控WebSocket流量。对于需要处理大量用户的场景，如果没有适当的资源优化，可能导致服务器过载。WebSocket不具备HTTP的复杂认证机制（如基于cookie或token的认证），需要额外实现自定义认证方案，以确保连接的合法性。

2024-12-05 10:29:41 518

原创三十七：WebSocket解决什么问题？

WebSocket是一种计算机网络协议，提供了全双工通信通道，允许客户端和服务器在单一的TCP连接上进行双向通信。它定义在RFC 6455中，并通过Web浏览器的API来实现。与HTTP不同，WebSocket协议在建立连接后可以持续存在，而不需要每次传输数据时都重新建立连接。WebSocket作为一种现代的双向通信协议，解决了传统HTTP协议在实时数据交互中的诸多问题。它通过持久连接、低延迟、双向通信以及服务器主动推送等特性，极大地提高了实时性和效率。

2024-12-05 10:28:34 770

全面的合成皮肤病数据.zip

数据集说明： Askin Disease Dataset 是一个合成数据集，用于支持与皮肤病相关的机器学习和数据分析任务。它包含 34,000 行和 10 列，涵盖了皮肤病、患者人口统计学、治疗史和疾病严重程度的各个方面。为什么选择这个数据集？皮肤病是一个普遍的健康问题，影响着全球数百万人。准确的诊断和有效的治疗计划对于改善患者预后至关重要。该数据集提供了各种皮肤病状况的全面表示，使其成为：分类任务：预测疾病类型或严重程度。预测建模：估计治疗效果。数据可视化：分析人口统计模式。探索性数据分析（EDA）：了解分布和相关性。医疗保健分析：深入了解治疗效果和疾病患病率。数据集内容：数据集包含以下 10 列： Patient_ID：每个患者的唯一标识符（例如，P00001）。年龄：患者年龄（范围：18 至 90 岁）。性：患者的性别（男性/女性）。 Skin_Color：患者的肤色（白/中/深色）。 Disease_Type：诊断出的皮肤病（湿疹、牛皮癣、痤疮、酒渣鼻、白癜风、黑色素瘤）。严厉：疾病的严重程度（轻度、中度、重度）。期间：病程（月）（范围：1 至 120）。 Affected_Area：受疾病影响的身体部位（面部、手臂、腿部、背部、胸部、头皮）。 Previous_Treatment：指示患者之前是否接受过治疗（Yes/No）。 Treatment_Effectiveness：先前治疗的有效性（高、中、低）。主要特点：均衡分布：该数据集是综合生成的，以确保疾病类型和严重程度的均衡分布。全面覆盖：多个功能可捕获患者人口统计数据、疾病特征和治疗结果。多功能应用：适用于分类、预测、聚类和数据可视化任务。数据完整性：合成数据消除了隐私问题，同时保留了真实世界数据的结构和特征。可能的用例：疾病分类：使用机器学习对皮肤

2025-06-03

元素摄入量上限.zip

背景描述元素摄入量上限数据说明关于 Dataset 该数据集包含不同生命阶段和性别群体的各种元素的摄入量上限（UL）。数据来自美国国家科学院、工程院和医学院的食品和营养委员会。该数据集为以下元素提供 UL 值：砷硼钙铬铜氟化物碘铁镁锰钼镍磷钾硒硅硫酸盐钒锌钠氯化物这些值针对各种生命阶段组给出，包括：婴儿（0-6 个月和 7-12 个月）儿童（1-3 岁和 4-8 岁）男性和女性（9-13 岁、14-18 岁、19-30 岁、31-50 岁、51-70 岁和 70 岁以上）怀孕女性（14-18 岁、19-30 岁和 31-50 岁）哺乳期女性（14-18 岁、19-30 岁和 31-50 岁）该数据集对于营养学家、营养师、研究人员以及任何有兴趣了解不同生命阶段和性别的安全元素摄入量上限的人来说都很有价值。请注意：这些是一般性建议，可能不适用于有特定健康状况或特殊营养需求的个人。不同的元素使用不同的测量单位。数据集中的“ND”代表“未确定”，因为缺乏数据或没有证据表明最高摄入量有不利影响。

2025-06-03

全球血型分布全球数据集.zip

数据说明关于 Dataset 该数据集提供了有关全球各个国家和地区血型（ABO 和 Rh）分布的详细信息。血型，也称为血型，是根据红细胞（RBC）表面是否存在特异性抗体和抗原进行分类。血型系统包括 A、B、AB 和 O 型，每种类型都可以是 Rh 阳性（+）或 Rh 阴性（-）。这些分布在不同人群之间差异很大，按国家/地区划分的血型分布（维基百科）该数据集是通过汇总和清理此维基百科页面上提供的信息来编译的，确保它包含来自各种公共来源的最相关和最新的信息。缺失值：此数据集中的多个国家/地区具有缺失的血型值。这些国家/地区的数据不完整或缺少某些血型的报告。以下是数据集中缺失值的国家/地区，以及缺失的特定血型：埃及：缺失血型：O-、A-、B-、AB- 蒙古：缺失血型：AB+ 如何使用数据集：该数据集可用于各个领域，例如：医学研究：用于了解血型分布的区域和全球趋势，这有助于改进献血策略和医疗保健计划。流行病学：研究血型分布如何与遗传和环境因素（包括疾病易感性）相关。医疗保健规划：政府和医疗机构可以使用这些数据来更好地规划献血活动，确保不同地区特定血型的充足供应。教育目的：向学生和研究人员传授血型分布及其对健康和遗传学的影响。目标受众：研究人员：希望分析全球或区域血型分布及其影响的遗传学、流行病学和公共卫生领域的研究人员。卫生组织：世界卫生组织（WHO）、国家卫生服务机构或致力于全球医疗保健改进和应急计划的非政府组织等组织。政府机构：需要血型数据进行应急管理和血库规划的公共卫生部门和决策机构。教育机构：研究遗传学、流行病学或人类生物学的学校、学院和大学。医疗专业人员和医院：从事献血和输血服务的血库、医院和诊所。舒沃·库马尔·巴萨克。（2023）. Scenarios_BloodGroup256x256 [数据集]。卡格尔。

2025-06-03

临床帕金森数据集. zip

背景描述临床帕金森数据集帕金森病的临床数据集数据说明关于 Dataset 此数据集包含来自帕金森病患者和非帕金森病患者的语音测量和临床数据。该数据集对于致力于早期帕金森病诊断和进展跟踪的机器学习模型的研究人员和数据科学家非常有用。列概述： recording_id：每个语音样本的唯一标识符。 fundamental_freq_hz、max_freq_hz min_freq_hz：与频率相关的语音功能。抖动（各种类型）：频率扰动（变化）的测量。微光（各种类型）：振幅扰动（变化）的测量。 nhr， hnr：噪声与谐波和谐波与噪声比，表示语音质量。 parkinson_status：二元指标（1 = 帕金森氏症，0 = 健康）。 rpde、dfa、spread_1、spread_2、detrended_fluctuation、ppe：非线性动态语音特征。 subject_id、年龄、性别：主题的人口统计信息。 test_time：自主题第一次测试以来经过的时间。 motor_updrs_score、total_updrs_score：基于运动和总统一帕金森病评定量表（UPDRS）的临床严重程度评分。潜在用途：使用语音功能进行帕金森病分类。使用 UPDRS 分数进行进度跟踪。用于生物医学信号处理的特征选择。

2025-06-03

诊断病理学检查结果.zip

背景描述诊断病理学检查结果通过知识为患者赋能数据说明关于 Dataset 该数据集包含基于九个关键生物标志物（包括血糖、HbA1C、血压、胆固醇水平和血红蛋白）预测健康状况的诊断测试结果。它通过将个人分为五种情况来帮助开发用于疾病风险评估、预防性医疗保健和保险承保的 AI 模型：健康、贫血、高血压、糖尿病和高胆固醇。医疗保健分析随着 AI 和数据驱动的洞察而发展，从而能够及早发现疾病并提供个性化的治疗建议。该数据集提供了个体的真实诊断测试结果，重点关注九个关键医疗参数。目标是根据这些测试值预测潜在的健康状况，使该数据集与医学研究和诊断高度相关。该数据集的结构旨在帮助机器学习从业者、医疗保健专业人员和数据科学家开发常见健康状况（如糖尿病、贫血、高血压和高胆固醇）的预测模型。通过分析诊断值的模式，该数据集可用于： • 健康风险评分和预测 • 预防性医疗保健研究 • 医学测试结果中的异常检测随着人工智能在医疗保健领域的日益普及，该数据集成为开发有助于风险评估和疾病预测的分类模型的宝贵资源。数据集功能： • 自变量（医学测试结果）： o 血糖 – 测量血糖水平。 o HbA1C – 长期血糖水平的指标。 o 收缩压 – 测量血压的最高值。 o 舒张压 – 测量血压的底部值。 o LDL – 低密度脂蛋白（坏胆固醇）。 o HDL – 高密度脂蛋白（好胆固醇）。 o 甘油三酯 – 血液中的一种脂肪。 o 血红蛋白 – 测量红细胞的携氧能力。 o MCV（平均红细胞体积） – 测量平均红细胞大小。 • 目标变量（健康状况预测）： o 拟合 – 未检测到重大健康问题。 o 贫血 – 血红蛋白或红细胞计数低。 o 高血压 – 高血压状况。 o 糖尿病 – 高血糖和 HbA1C 水平。 o 高胆固醇 – 低密度脂蛋白和甘油三酯升高。应用和用例：健康风险预测 - 使

2025-06-03

印度健康与生活方式数据集.zip

数据说明 Kaggle 上的“生殖健康”数据集提供了影响不同人群生殖健康的各种因素的深入视图。它包括人口统计信息，例如年龄、婚姻状况和教育背景，以及与健康相关的数据，例如避孕药具的使用、医疗状况和生育史。此数据集对于旨在了解生殖健康趋势并确定生活方式、病史和生殖健康结果之间的模式或关联的数据分析师、研究人员和公共卫生专业人员特别有用。该数据集使用户能够探索生殖健康中的关键问题，例如社会经济因素如何影响计划生育选择或健康状况与生育能力有何关联。它可以应用于各种类型的分析，包括统计建模、机器学习算法和预测分析。例如，分析师可以使用此数据集构建预测避孕药具使用的分类模型，或探索回归模型以了解影响生殖健康结果的因素。该数据集包括与个人健康状况档案相关的多个属性，例如个人以前是否经历过怀孕、他们的避孕方法和其他相关的健康状况。它还提供了有价值的人口统计细节，可以支持交叉分析，研究年龄、教育和收入水平等不同因素如何影响生殖健康决策。借助此数据集，您还可以进行探索性数据分析（EDA），构建可视化，并确定健康状况、生活方式选择和生殖结果等变量之间的相关性。此外，它可以作为进行假设检验的基础，以验证有关生殖健康模式的假设。对于那些对公共卫生研究或从事健康数据科学项目感兴趣的人，该数据集为分析生殖健康问题提供了全面的基础。对于专注于改善获得计划生育服务、提高对生殖健康问题的认识或为医疗保健干预创建预测工具的项目，它可能特别有益。 “生殖健康”数据集对于在生殖健康背景下参与数据驱动型公共卫生研究、机器学习或统计建模的任何人来说都是宝贵的资源。初学者和高级数据科学家都可以使用它，为分析和见解提供了多种可能性，这些分析和见解可能会对公共卫生政策和干预措施产生实际影响。

2025-06-03

大学生数据集分享.zip

## **数据说明** 数据集描述：大学生表现此数据集包含不同学年、机构和专业的 5000 名大学生的详细记录。它旨在探索和分析影响学生毕业可能性的学术、行为和课外因素。列： Student_ID （字符串）每个学生的唯一标识符。 Year （integer）数据所属的学年（例如，2020 年、2021 年等）。大学（字符串）学生就读的大学的名称（例如，Harvard、Stanford、MIT）。专业（字符串）学生的学习领域（例如，商业、经济学、医学）。 GPA（浮点）学生的平均绩点，通常从 0.0 到 4.0。 Attendance_Percentage （float）学生参加的课程百分比，表示学术学科。 Extracurricular_Score （float）表示学生参与课外活动的数字分数。 Graduation_Status （string）指示学生是否毕业（“Graduated”）或 “Not Graduated” （“未毕业”）的目标变量。使用案例：预测建模：使用这些功能构建机器学习模型来预测毕业结果。教育分析：识别与学术成功或失败相关的趋势和模式。政策洞察：帮助大学制定政策，通过数据驱动的洞察提高毕业率。

2025-06-03

近五年(2019-2024)上海市天气记录数据.csv

2019-2024 日期最高温最低温天气风向风力空气质量指数空气质量指数标签

2025-05-30

病毒式社交媒体趋势和参与度分析.zip

## **背景描述** 病毒式社交媒体趋势和参与度分析分析热门主题标签、参与度和特定于平台的内容表现 ## **数据说明** 关于 Dataset 该数据集捕捉了 TikTok、Instagram、Twitter 和 YouTube 上病毒式社交媒体趋势的脉搏。它提供了对最流行的主题标签、内容类型和用户参与度的见解，提供了有关趋势如何跨平台展开的全面视图。该数据集包含区域数据和影响者驱动的内容，非常适合：趋势分析情绪建模了解网红营销深入了解是什么让内容传播开来，推动参与的行为，以及趋势如何在全球范围内演变！ **Viral_Social_Media_Trends.csv 此文件包含 TikTok、Instagram、Twitter 和 YouTube 上病毒式社交媒体帖子的 5,000 条记录。它包括关键的参与度指标，例如观看次数、点赞数、分享量和评论数，以及热门主题标签和内容类型。主要特点：覆盖多个社交媒体平台包括热门话题标签和内容类型为数据驱动的洞察提供互动指标适用于数据可视化、情绪分析和趋势预测

2025-05-29

城市热岛（UHI）监测数据集.zip

数据说明数据集描述该数据集对城市热岛效应（UHI）进行了深入分析，该效应是指与周围的农村地区相比，城市地区的温度更高。这些数据旨在帮助研究人员、城市规划者和环境科学家了解城市化如何影响当地气候、能源消耗、空气质量和公共卫生。通过结合温度、土地覆盖、人口密度和环境因素，该数据集提供了有关世界各地城市如何受气候变化影响的见解。用法城市规划：帮助城市设计更具可持续性和气候适应性的基础设施。气候变化研究：研究城市化对全球温度模式的影响。公共卫生：分析城市热量与与高温相关的健康问题之间的关系。能源管理：优化城市的能源消耗策略。环境政策：支持数据驱动的政策决策，打造更健康、更绿色的城市。关于此文件建议编辑此数据集包括以下列：城市名称：城市的名称。纬度和经度：城市的地理坐标。海拔（m）：海拔高度。温度（°C）：城市的平均温度。土地覆被：城市中的土地利用类型（城市、工业、绿地、水）。人口密度（人/平方公里）：城市的人口密度。能耗（kWh）：平均能耗（以千瓦时为单位）。空气质量指数（AQI）：城市的空气质量水平。城市绿化率（%）：城市绿地百分比。健康影响（死亡率/100k）：与高温相关的健康影响。风速（km/h）：城市的平均风速。湿度（%）：平均湿度水平。年降雨量（mm）：年总降雨量。人均 GDP （USD）：城市的人均经济产出。

2025-05-29

全球住房市场分析（2015-2024 年）.zip

## **背景描述** 全球住房市场分析（2015-2024 年）了解各国的住房市场趋势 ## **数据说明** 关于 Dataset 该数据集提供了对全球住房市场的见解，涵盖了 2015 年至 2024 年的各种经济因素。它包括有关多个国家/地区的房地产价格、租金收益率、利率和家庭收入的详细信息。此数据集非常适合房地产分析、财务预测和市场趋势可视化。列描述列名称描述 Country 记录住房市场数据的国家/地区 Year 观察之年 Average House Price ($) 房屋的平均价格（美元） Median Rental Price ($) 房产的月租金中位数（美元） Mortgage Interest Rate (%) 平均按揭利率百分比 Household Income ($) 家庭平均年收入（美元） Population Growth (%) 一年中人口增长的百分比 Urbanization Rate (%) 居住在城市地区的人口百分比 Homeownership Rate (%) 拥有房屋的人数百分比 GDP Growth Rate (%) 年度 GDP 增长百分比 Unemployment Rate (%) 失业者在动力中的百分比

2025-05-29

美国的机器学习职位发布.zip

背景描述美国的机器学习职位发布来自美国科技公司的 1000 个近期 ML 职位描述数据说明该数据集包含美国各地 1000 个机器学习相关职位的招聘信息，时间跨度为 2024 年底至 2025 年初。数据直接从公司招聘页面和招聘网站收集，侧重于完整的职位描述和相关公司信息。列描述列描述 job_posted_date 职位的发布日期（格式：YYYY-MM-DD）。 company_address_locality 工作或公司所在的城市或地点。 company_address_region 作业所在的美国州或地区。 company_name 发布作业的公司名称。 company_website 公司的官方网站。 company_description 公司的简短描述或使命宣言。 job_description_text 原始发布中列出的完整职位描述文本。 seniority_level 所需的资历级别（例如，实习、入门级、中高级）。 job_title 发布中列出的完整职位名称。

2025-05-29

中东小麦产量数据（1961–2025）.zip

## **背景描述** 中东小麦产量数据（1961–2025） 1961-2025 年中东小麦趋势：各国农业洞察 ## **数据说明** 关于 Dataset 中东小麦产量数据（1961–2025）该数据集提供了 1961 年至 2025 年六个中东国家小麦生产趋势的详细历史视图。它包括生产价值、测量单位、估计标志和计算的同比（YoY）变化，使其成为时间序列分析、预测和农业政策研究的理想选择。包含的国家 - 约旦 - 以色列 - 伊拉克 - 土耳其 - 伊朗 - 沙特阿拉伯数据集维度总列数：9 - 总行数：325 列名称 -年份 — 记录的日历年 — 值 — 小麦产量 — 单位 — 计量单位（例如，吨） - 标志 — 指示值是估计值还是官方值 — 国家 — 记录数据的国家 — 项目 — 被测量的作物（小麦） - 域 — 数据域或部门（例如，生产） -度量 — 记录的度量类型（例如，生产） — 同比变化 — 生产年同比变化（%）主要特点从 1961 年到 2025 年的年度覆盖范围专注于小麦生产中东主要国家/地区的特定数据包括同比增长率经过清理并可用于分析的 CSV 格式使用案例时间序列预测农业和经济趋势分析机器学习模型训练探索性数据分析（EDA）区域政策评估联系信息：如果您希望抓取任何类型的数据，您可以联系我以获取更多数据集 -E_mail -领英 -卡格尔 -X

2025-05-29

用水量预测数据集.zip

此数据集包括每日和每月间隔的基于区域的耗水记录。它适用于 Prophet 和 ARIMA 等时间序列预测模型。

2025-05-29

各厂商电动汽车销售数据.zip

电动汽车品牌电动汽车产地电动汽车产量电动汽车销量电动汽车运行公里数电动汽车生产日期拥有者会员级别电动汽车原价电动汽车售价电动汽车利润电动汽车过户状态电动汽车厂商电池容量（kWh）续航里程（NEDC/CLTC）充电效率（快充/慢充）驱动形式（前驱/后驱/四驱）市场份额用户年龄用户性别用户职业用户使用习惯（日均里程/充电频率）电动汽车智能化水平（自动驾驶等级/OTA频率）

2025-05-27

生菜生长天数分析.zip

数据文档背景描述生菜生长天数分析该数据集为了解生菜植物的生命周期提供了独特的视角。数据说明关于 Dataset 该项目旨在研究温度、湿度、TDS 值、pH 值和生长期数之间的关系，以了解这些因素如何影响生菜的生长。该项目还旨在计算汇总统计数据，例如每个变量的平均值、中位数、四分位数和最小值/最大值，以深入了解数据的分布。植物标识符（Plant_ID）：分配给每个单独工厂的独特标识符。日期：观察的时间戳，标记增长过程中的关键里程碑。温度（°C）：以摄氏度为单位记录的温度，这是一个关键的环境变量。湿度（%）：表示湿度水平的百分比，影响植物的水分吸收。总溶解固体（TDS）值（ppm）：以百万分之一为单位的溶解固体的测量值，反映营养物质的可用性。 pH 值：环境 pH 值是影响营养吸收的关键因素。成长日：从初始生长阶段到植物完全成熟的持续时间（以天为单位）。

2025-05-27

生理和环境的多模态数据.zip

背景描述生理和环境的多模态数据用于预测的生理信号和环境因素数据说明关于 Dataset 该数据集旨在支持对生理反应与环境条件之间关系的研究。它由两个子集组成：生理数据 – 记录生物识别信号，例如心率、体温、血压、呼吸频率和皮肤电导率。这些特征提供了对个体在不同环境条件下的生理状态的洞察。环境数据 – 包括外部因素，例如温度、湿度、空气质量指数（AQI）、大气压力和噪音水平。这些变量有助于分析环境变化如何影响生理反应。数据集中的每条记录都标有目标列，这可能表示压力水平、健康状况、疲劳状态或其他感兴趣的结果。主要功能心率（BPM） – 测量每分钟的心跳次数。体温（°C） – 跟踪内部温度变化。血压（mmHg） – 捕获收缩压和舒张压水平。 Respiration Rate （Breaths per minute）（呼吸频率） – 表示呼吸频率。皮肤电导率（μS） – 反映汗腺活动，通常与压力水平有关。温度（°C） – 记录环境温度。湿度（%） – 测量空气中的水分含量。空气质量指数（AQI） – 代表环境中的污染水平。大气压力（hPa） – 检测气压的变化。噪音级别（dB） – 捕获周围环境中的声音强度。 Target Column （目标列） – 表示生理或心理状态（例如，压力水平、疲劳或健康状况）。此数据集可用于健康监测、压力分析、可穿戴设备研究以及个性化医疗保健和环境影响研究中的预测建模。

2025-05-27

2016 年全球生态足迹.zip

背景描述 2016 年全球生态足迹您所在国家消耗的资源是否超过一年产生的资源？数据说明上下文生态足迹衡量的是特定人口生产其消耗的自然资源（包括植物性食品和纤维产品、牲畜和鱼产品、木材和其他林产品、城市基础设施的空间）和吸收其废物（尤其是碳排放）所需的生态资产。该足迹跟踪了六类生产性表面积的使用情况：农田、牧场、渔场、建成区（或城市）土地、森林面积和土地上的碳需求。一个国家的生物承载力代表其生态资产的生产力，包括农田、牧场、林地、渔场和建筑用地。这些区域，尤其是如果不采伐，也可以吸收我们产生的大部分废物，尤其是我们的碳排放。生态足迹和生物承载力都以全球公顷表示，即具有全球可比性的标准化公顷数与世界平均生产力。如果一个种群的生态足迹超过该地区的生物承载力，则该区域就会出现生态赤字。它对其陆地和海洋所能提供的商品和服务的需求——水果和蔬菜、肉类、鱼类、木材、服装用棉花和二氧化碳吸收——超过了该地区生态系统可以更新的需求。生态赤字地区通过进口、变现自己的生态资产（如过度捕捞）和/或向大气中排放二氧化碳来满足需求。如果一个地区的生物承载力超过其生态足迹，它就拥有生态保护区。确认生态足迹测量是由不列颠哥伦比亚大学的 Mathis Wackernagel 和 William Rees 构思的。生态足迹数据由 Global Footprint Network 提供。灵感您的国家是否存在生态赤字，消耗的资源超过了每年的产量？哪些国家的生态赤字或保护区最大？他们的消费量是比普通国家少还是多？2017 年地球超载日，即日历上人类使用一年自然资源的日子，何时发生？

2025-05-27

琅琊海洋大模型权重文件.zip

琅琊海洋大模型权重文件

2025-05-27

喜马拉雅探险数据集.zip

1905 年至 2024 年喜马拉雅山 11,000+ 次探险记录数据说明数据集描述表格和功能：死亡 peak_id：峰的 ID peak_name：峰值名称 name：登山家姓名 yr_season：年份和季节 is_o2_used：如果已使用氧气峰 host_contries：可以攀登的国家 first_asc_yr：上升的第一年探险 peak_id：峰的 ID peak_name：峰值名称 nationality：探险队的主要国籍（主要国籍） year：探险年 season：探险季节 host_cntr：开始上升的国家 other_cntrs：参加考察的国家（成员国籍） sponsor：探险赞助商 leaders：探险队的队长/队长 rte_1_name：第一个路由名称（类似于具有相同前缀的其余要素） team_asc_1：团队为某个路线名称上升的次数（类似于具有相同前缀的其余要素） is_disputed：成功有争议或未经验证 is_claim：探险队声称登顶，然而，没有任何证据（可能是谎言） is_commercial_rte：如果探险是商业性的 is_standard_rte：如果路线是标准的（S Col-SE Ridge/N Col-NE Ridge/N Col） other_smts：其他登顶的山峰 approach：到达山上的主要探险中途点 bc_arrived：到达大本营的日期 bc_left：从大本营出发的日期 total_days：探险队花费的总天数 exp_result：探险的结果 is_traverse：如果已进行遍历（？） is_ski_snowboard：如果使用双板/单板滑雪进行下降 is_parapente：如果下降是使用 parapente 进行的 term_note：峰会

2025-05-27

排序算法性能评估.zip

数据说明关于 Dataset 一个基准数据集，比较大小为 1000 的数组上各种排序算法（冒泡排序、选择排序、插入排序、合并排序、快速排序、堆排序、奇偶排序）的执行时间、内存使用情况和比较计数。每个算法都使用随机输入运行 100 次，以确保统计显着性。数据集详细信息列 run：试验编号（每个算法 1-100）。 algorithm：排序算法名称。 array_size：固定大小 1000。 execution_time_ms：平均运行时间（毫秒）。 memory_usage_kb：占用的内存（以 KB 为单位）。 comparison_count：进行的比较次数。包含的算法冒泡排序选择排序插入排序归并排序快速排序堆排序奇偶排序存储桶排序 Shell 排序

2025-05-27

AI辅助医学科研发表训练营.zip

一个是完整数据集，用于简单的计算场景；一个删减数据集，用于复杂的计算场景性别年龄是否患有高血压是否患有心脏病是否有过婚姻工作类型住宅类型血糖水平 BMI 吸烟状况是否中风

2025-05-27

（05.14）中国省市县手机基站数据（2006-2025）.zip

一、数据介绍数据名称：中国省市县手机基站数据数据年份：2006-2025年3月数据范围：各省、市、区县数据格式：excel 数据来源：OpenCelliD 二、数据指标网络类型网络代数移动国家/地区移动网络代码区域代码小区标识单元标识坐标经度坐标纬度覆盖范围测量样本数坐标可变性平均信号强度创建日期更新日期省份城市区县安徽省.xlsx 澳门特别行政区.xlsx 北京市.xlsx 福建省.xlsx 甘肃省.xlsx 广东省.xlsx 广西壮族自治区.xlsx 贵州省.xlsx 海南省.xlsx 河北省.xlsx 河南省.xlsx 簾悵郓鵯舞换衘胃咆龙江省.xlsx 湖北省.xlsx 湖南省.xlsx 吉林省.xlsx 江苏省.xlsx 江西省.xlsx 辽宁省.xlsx 内蒙古自治区.xlsx 宁夏回族自治区.xlsx 青蓀海省.xlsx 山东省.xlsx 山西省.xlsx 陕西省.xlsx 上海市.xlsx 四川省.xlsx 幹很湾省.xlsx 天津市.xlsx 西藏自治区.xlsx 香港特别行政区.xlsx 新疆维吾尔自治区.xlsx 云南省.xlsx 浙江省.xlsx 重庆市.xlsx

2025-05-26

全球金融制裁数据库GSDB（1949-2023年）.zip

一、数据介绍数据名称：全球制裁数据库数据范围：全球时间范围：1950-2023年样本数量：15.9万条数据来源：全球制裁数据库更新时间：2025年5月二、数据指标 case_id 制裁案例编号 sanctioned_state 被制裁国家/目标国家 sanctioning_state 制裁发起国家/发送国家 begin 制裁开始年份 end 制裁结束年份 arms 武器制裁指示变量 military 军事援助制裁指示变量 trade 贸易制裁指示变量 descr_trade 贸易制裁类型 financial 金融制裁指示变量 travel 旅行制裁指示变量 other 其他制裁类型指示变量 target_mult 多边目标制裁指示变量 sender_mult 多边发起方制裁指示变量 objective 制裁目标 success 制裁成功度 sanctioned_state_iso3 被制裁国家ISO3字母代码 sanctioning_state_iso3 制裁发起国家ISO3字母代码 year 制裁生效年份

2025-05-26

上市公司-企业预期市场回报数据（ 2010-2023年）.zip

ER1：预期市场回报，等于当年销售额与过去两年销售额的均值的差，单位元 ER3：预期市场回报，等于当年销售额与过去两年销售额的均值的差，单位万亿元本数据包含：原始数据、代码do文件、最终结果(Excel和Dta)、参考文献。数据名称：上市公司-企业预期市场回报数据数据年份： 2010-2023年相关数据企业代码证券代码股票简称年份预期市场回报ER1 预期市场回报ER3 行业代码行业名称是否金融业。1是,0否是否发生ST或*ST或PT

2025-06-03

上市公司-政策不确定性数据（2006-2023年）.xlsx

fepu_word：不确定句子中不确定词语数量/MDA全文总词语数量*100 fepu_sentence：不确定句子数量/MDA全文总句数*100 数据名称：上市公司-政策不确定性数据数据年份：2006-2023年相关数据代码年份 fepu_word fepu_sentence

2025-06-03

2010到2022年中国光伏建设数据.zip

研究发现：（1）中国西部地区拥有更高的光伏总面积，但大型光伏发电站的密度较低；而东部和中部地区虽然总光伏面积较低，但小型光伏发站的密度较高（图2）；（2）中国光伏发站的面积从2010年的5.86平方公里增加到2022年的3712.1平方公里，年均增长285平方公里，西部地区年增长率最高，达到53%（图2）；（3）东部和中部地区的光伏发站主要建在农田上(占24.6%)，而西部地区的光伏安装主要部署在草地(28.3%)和未使用土地(27.5%)上（图3）；（4）从2017年到2022年，光伏电站建设对农田的占用量显著减少了48%，对草地的占用也呈现下降趋势（图3）。该研究提供了中国光伏电站扩张时空过程和土地占用的全面分析，对于促进我国可再生能源发展和制定碳减排政策具有重要意义。 PV power plants of China from 2010 to 2022.dbf PV power plants of China from 2010 to 2022.prj PV power plants of China from 2010 to 2022.sbn PV power plants of China from 2010 to 2022.sbx PV power plants of China from 2010 to 2022.shp PV power plants of China from 2010 to 2022.shp.xml PV power plants of China from 2010 to 2022.shx

2025-06-03

上市公司大数据应用指数（2001-2023年）.zip

本研究借鉴张叶青（2021）的研究方法，采用文本分析法对公司年报中的大数据应用程度进行量化评估。具体而言，通过统计年报中与大数据相关的关键词出现频次来构建衡量指标。在关键词选取方面，综合参考了学术文献、政府政策文件以及行业研究报告等多个权威来源。核心指标lnBigdata的计算方法为：首先统计每家公司在年报中提及预设大数据关键词的总次数，然后对该数值加1后取自然对数。考虑到大数据应用水平存在逐年上升的趋势，本研究对lnBigdata指标进行了年度调整处理，即按照”公司-年份”维度对数据进行1%分位数的缩尾处理（winsorize），以消除极端值的影响。文件包包括6.1万个样本，5600家企业，包括原始数据、计算do文件和最终计算结果。数据指标证券代码、证券简称、年份、stkcd、year、大数据相关关键词词频、大数据应用指数、行业代码、行业名称、所属省份、所属省份代码、所属城市、所属城市代码

2025-06-03

华政ESG评级年度中位数年度均值2009-2024年

本研究参考方先明（2023）在《经济研究》中采用的方法，对华证ESG评级体系进行量化处理。该评级系统包含9个等级：C、CC、CCC、B、BB、BBB、A、AA、AAA，我们将其依次赋值为1至9分，其中1分代表最低评级（C级），9分代表最高评级（AAA级）。基于此评分标准，我们已将上市公司ESG评级数据更新至2024年12月31日，并完成了各年度上市公司ESG评级得分的统计分析工作。数据指标年份、股票代码、证券代码、股票简称、证监会行业、省份、ESG得分-年均值、ESG得分-年中位数

2025-06-03

各省-教育支出水平2007-2023年

数据名称：各省-教育支出水平2007-2023年数据年份：2007-2023年相关数据指标行政区划代码地区年份地方财政一般预算支出(亿元) 地方财政教育支出(亿元) 教育支出水平

2025-06-03

省级工业三废面板数据1998-2023.xlsx

数据名称：省级-工业三废面板数据数据年份：1998-2023年相关数据指标工业废水排放量、工业SO2排放量、工业烟尘排放量、工业固体废物排放量、工业污染治理投资

2025-06-03

各国数字服务贸易进出口额2005-2023年.zip

数字服务贸易内容包括保险和养老金服务；知识产权使用权费用服务；金融服务；电信、计算机及信息服务；其他商业服务；个人文化和娱乐服务等6个方面，参考UNCTAD在2015发布的报告中数字服务贸易的分类。参照周念利等（2022）及陈松（2022）的方法，将涉及数字服务贸易的六个部门的服务出口额进行加总得到数字服务出口总数据。包含200多个国家和地区。原始数据来源：联合国贸发会议统计局（UNCTAD）数据名称：各国数字服务贸易进出口额2005-2023年数据指标及参考文献 Year Economy EconomyLabel SF出口额 SG出口额 SH出口额 SI出口额 SJ出口额 SK出口额数字服务贸易出口额（单位：百万；现价美元） Year Economy EconomyLabel SF进口额 SG进口额 SH进口额 SI进口额 SJ进口额 SK进口额数字服务贸易进口额数据概述：各国数字服务贸易出口额2005-2023年--Excel格式.xlsx 各国数字服务贸易出口额2005-2023年--stata格式.dta 各国数字服务贸易进口额2005-2023年--Excel格式.xlsx 各国数字服务贸易进口额2005-2023年--stata格式.dta 指标说明和数据来源.txt

2025-06-03

印度广泛的 A-Z 药物数据集.zip

背景描述印度广泛的 A-Z 药物数据集印度药物及其替代品、副作用和用途的详细数据集数据说明该数据集提供了 249,398 个独特条目的全面集合，涵盖了印度可用的各种药物。它包括有关药物成分、替代品、副作用和治疗用途的详细信息。该数据集旨在为医疗保健专业人员、研究人员和数据科学家提供支持，提供印度制药格局的结构化视图，促进深入分析和预测建模。注意：此数据集是印度 AZ 医学数据集和 Shudhanshu Singh 和 Vivek Tiwari 的 250k 药物使用、副作用和替代品的组合特征覆盖范围广：超过 249,000 种具有详细属性的独特药物。药物组成：关键活性成分及其各自的剂量。替代品：每种药物最多可列出 5 种替代品，以支持替代建议。副作用：每种药物的已知不良反应的综合列表。治疗类别：根据预期的医疗用途和作用机制进行分类。制造商详细信息：包括制造公司的名称，以便准确跟踪产品。停药状态：明确指示药物当前是否可用或已停产。

2025-06-03

所有 NIH 胸部 X 光图像的元数据.zip

背景描述所有 NIH 胸部 X 光图像的元数据数据说明元数据文件包含以下功能：图像索引查找标签随访# 患者 ID 患者年龄患者性别查看位置原始图像大小原始图像像素间距。

2025-06-03

中国342城市PM2.5年均浓度数据.xlsx

一、数据介绍数据名称：342个地级市-PM2.5年均浓度数据数据年份：2000-2024年数据范围：342个城市数据格式：面板数据二、数据指标地区年份 PM2.5年均浓度三、计算方法结合圣路易斯华盛顿大学采用地理加权回归（GWR）校准的全球PM2.5浓度栅格数据及中国空气质量监测站点数据，运用ArcGIS软件，使用分区统计工具提取各地级市区域内栅格的年均值，从而得到342个地级市2000-2024年PM2.5年均浓度数据

2025-05-29

食物的营养分解.zip

背景描述食物的营养分解包含热量值和营养成分的详细 CSV 数据集 - vit 数据说明该数据集提供了 3,500+ 种食物的全面营养细分，包括有关宏量营养素、微量营养素和热量值的详细信息。它非常适合用于数据科学、健康分析、饮食计划和专注于食品、营养和健康的机器学习项目。每种食品都标有以下营养价值：常量营养素：碳水化合物、糖、膳食纤维、脂肪、蛋白质微量营养素：钙、铁、钠、维生素 C、维生素 B11（叶酸）热量值（千卡）食物名称：原始和标准化版本，保持一致性这个清洁的营养数据集为各种印度和全球食品提供了每 100 克的标准化营养价值。它包括卡路里、常量营养素（碳水化合物、蛋白质、脂肪）和维生素和矿物质等关键微量营养素。

2025-05-29

科罗拉多州丹佛市的居民消费物价指数.zip

背景描述科罗拉多州丹佛市的居民消费物价指数 104 年的月度 CPI 数据数据说明关于 Dataset 上下文：消费者价格指数（CPI）计划每月生成有关城市消费者为一篮子具有代表性的商品和服务支付的价格变化的数据。这是比较经济随时间变化的有用方法。内容：该数据涵盖 1913 年 1 月至 2017 年 5 月，并标准化为“CPI-you 所有项目 1982-84=100，未经季节性调整”。字段包括测量时间和 CPI 分数。确认：这个数据集是通过科罗拉多州劳工与就业部（CDLE）代表劳工统计局（BLS）编制的，并在 data.colorado.gov 托管。灵感：哪些时间段的 CPI 最高/最低？通货膨胀什么时候最糟糕？你能预测现在的 CPI 吗？

2025-05-29

气候驱动的疾病传播.zip

数据说明关于 Dataset 数据集描述这个合成数据集结合了 24 年（2000-2023 年）来自 120 个国家的气候、环境、流行病学和社会经济数据。目的是分析气候变化、环境污染和传染病（疟疾、登革热、霍乱、莱姆病）传播之间的关系。这些数据适用于预测任务、异常检测和区域风险聚类。唯一性：第一个将长期气候趋势与医学和人口统计相结合的数据集。包括稀有参数：紫外线辐射指数、疾病媒介的迁移和预防成本。现实的异常情况（例如，到 2023 年欧洲的登革热疫情）。

2025-05-29

动物物种数据集.zip

动物物种数据包括有关动物、它们的特征和行为的基本信息。数据说明关于 Dataset 此数据集非常适合基本的探索性分析，允许用户识别模式并生成初步见解。它提供了各种动物物种的快照，侧重于关键的生物学特征和生态背景。虽然规模有限，但它提供了足够的多样性来支持行为、栖息地分布和保护状况等领域的基本分析。数据集概述 Animal Traits and Habitats 数据集包括精选的动物，可捕获类型、速度、体重、寿命和威胁级别等基本细节。它还包括有关地理分布和繁殖行为的信息。虽然规模不大，但该数据集适用于探索性研究和教育项目。特点条目总数：500 行，每行代表一种不同的动物。列：10 列，包括：动物类型 – 分类，如哺乳动物、鸟类、爬行动物等。动物名称 – 常用名称或学名。 Speed （速度） – 典型的移动速度。 Weight （体重） – 平均体重。 Continent （大洲） – 按大洲划分的大致位置。 Country （国家/地区） – 特定的栖息地国家/地区。 Lifespan （寿命） – 平均预期寿命。 Migration （迁移） – 物种是否迁移。繁殖 – 繁殖性状或方法。威胁级别 – 保护状态或风险级别。此数据集非常适合基本的探索性分析，允许用户识别模式并生成初步见解。

2025-05-29

加拿大的水污染监测数据集

背景描述加拿大的水污染监测加拿大各省的模拟水质数据（2022-2025 年）数据说明关于 Dataset 该数据集包含来自加拿大各个省份和水源的 3,000 条合成水质记录。它模拟了三年内收集的真实环境条件和污染监测数据。该数据集非常适合：污染检测和分析分类和异常检测污染物水平的时间序列预测环境政策模拟地理数据可视化每条记录代表一个水质样本，包括污染物类型和浓度、水源、pH值、浊度、温度、采样位置（纬度和经度）以及污染物水平是否超过推荐的安全阈值等属性

2025-05-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

全面的合成皮肤病数据.zip

元素摄入量上限.zip

全球血型分布全球数据集.zip

临床帕金森数据集. zip

诊断病理学检查结果.zip

印度健康与生活方式数据集.zip

大学生数据集分享.zip

近五年(2019-2024)上海市天气记录数据.csv

病毒式社交媒体趋势和参与度分析.zip

城市热岛 （UHI） 监测数据集.zip

全球住房市场分析（2015-2024 年）.zip

美国的机器学习职位发布.zip

中东小麦产量数据 （1961–2025）.zip

用水量预测数据集.zip

各厂商电动汽车销售数据.zip

生菜生长天数分析.zip

生理和环境的多模态数据.zip

2016 年全球生态足迹.zip

琅琊海洋大模型权重文件.zip

喜马拉雅探险数据集.zip

排序算法性能评估.zip

AI辅助医学科研发表训练营.zip

（05.14）中国省市县手机基站数据（2006-2025）.zip

全球金融制裁数据库GSDB（1949-2023年）.zip

上市公司-企业预期市场回报数据（ 2010-2023年）.zip

上市公司-政策不确定性数据（2006-2023年）.xlsx

2010到2022年中国光伏建设数据.zip

上市公司大数据应用指数（2001-2023年）.zip

华政ESG评级年度中位数年度均值2009-2024年

各省-教育支出水平2007-2023年

省级工业三废面板数据1998-2023.xlsx

各国数字服务贸易进出口额2005-2023年.zip

印度广泛的 A-Z 药物数据集.zip

所有 NIH 胸部 X 光图像的元数据.zip

中国342城市PM2.5年均浓度数据.xlsx

食物的营养分解.zip

科罗拉多州丹佛市的居民消费物价指数.zip

气候驱动的疾病传播.zip

动物物种数据集.zip

加拿大的水污染监测数据集

空空如也

城市热岛（UHI）监测数据集.zip

中东小麦产量数据（1961–2025）.zip