自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(199)
  • 收藏
  • 关注

原创 Meta分析(荟萃分析)

荟萃分析(Meta-analysis)是一种统计分析方法,统一的分析框架重新评估和合成数据。这种方法通常用于量化某个研究领域内的整体效应大小,解决单项研究因样本量小而导致的统计能力不足的问题。荟萃分析能够增强研究发现的统计效力,提供更加准确和全面的证据支持,因此在医学、心理学、教育等多个领域得到广泛应用。通过这种方式,研究者可以更有效地利用现有科学数据,对某些问题给出更有力的答案。

2024-10-27 20:03:17 3656

原创 一文搞懂TCP连接中的序号seq和确认应答号ack!(新手向)

在TCP(传输控制协议)中,序号(Sequence Number,简称seq)和确认应答号(Acknowledgment Number,简称ack)是协议头部非常关键的字段,它们共同确保了TCP的可靠性和数据按顺序传输的特性。

2024-03-16 21:21:18 8883 2

原创 学了Hadoop之后,如何快速理解Spark?

Apache Spark 是一个开源的分布式计算系统,由加州大学伯克利分校的AMPLab(现在的RISELab)最初开发,旨在。Spark 是为了克服 Hadoop MapReduce 模型在某些数据处理任务上的局限性(如迭代算法和交互式数据挖掘任务)而设计的。Spark 提供了一个强大的编程模型和丰富的生态系统,支持多种数据分析和机器学习任务。

2024-02-28 08:02:04 1823

原创 一文理解什么是贝叶斯优化的随机森林

1. 基本构成:决策树的集合随机森林是一种集成学习方法,由多个决策树组成。每棵树都是独立地基于数据的随机子集进行训练的。2. 数据的随机选择:Bootstrap抽样每棵决策树在训练时都使用一种称为Bootstrap抽样的技术,从原始数据集中随机选取样本(有放回地选择),从而形成新的训练集,这个训练集就是数据的随机子集,这是随机森林“随机”的起源之一。这意味着每棵树可能会使用到某些样本多次,而完全忽略其他样本。3. 特征的随机选择除了对数据进行随机抽样外,随机森林在每次分裂节点时还会随机选择一部分特征。

2023-10-30 11:10:53 3298 3

原创 一文记住什么是TP/TN/FP/FN?

这些工具和指标提供了评估和比较不同模型性能的方法,帮助研究者和工程师确定哪个模型在特定任务上的性能最好。而在实践中,根据应用的具体需求,可能需要关注某些指标多于其他指标。例如,医学测试中的 FN 可能比 FP 更为关键,因为遗漏一个病例的后果可能比误诊更严重。

2023-10-25 16:45:00 8769

原创 Junit单元测试之Maven项目集成Jacoco,查看覆盖率报告

Jacoco 是 Java 代码覆盖率的一个非常流行的工具,它可以用来测量项目中代码的覆盖率。作者在网上学习过程中发现一些问题:需要项目打包成jar包,然后启动一个agent监听。然后通过Postman这样的工具去测试,这里测试的应该是接口测试。Jacoco能不能看到单元测试的测试覆盖率呢?另外,如果使用Jacoco监听接口测试,需要把所有的测试都做一遍才能最后生成测试报表吧?使用JaCoCo是否需要打包成JAR不一定。

2023-10-15 11:29:04 7083

原创 CA与区块链之数字签名详解

系统的健壮性摘要比较提供了一个另外的安全层。这在系统设计中是一个常见的原则,即不完全依赖一个安全机制,而是使用多重机制。这可以抵御未知的攻击和缺陷。错误的检测:除了恶意攻击外,消息可能会因为其他原因(如传输错误)而被篡改。摘要的比较可以帮助检测这类错误。未来证明:摘要比较也为未来可能出现的新的攻击或漏洞提供了保护。尽管现有的签名算法可能是安全的,但未来可能会发现它的弱点。摘要的存在和验证提供了一个额外的安全层,使得对消息的完整性和来源的验证更加严格。简化验证过程对于某些系统来说。

2023-10-14 11:42:00 2993

原创 详细介绍区块链之挖矿

从某种角度来看,挖矿确实可以看作是模拟攻击的过程,因为它展示了篡改区块链所需的计算难度。但它们的目的和结果是不同的。挖矿是为了支持和维护区块链网络,而攻击则是为了获得非法利益。通过维持一定的挖矿难度,我们确实可以增加区块链的安全性,使其不容易受到攻击。(其实不一定对,因为这个是作者自己的想法)

2023-10-06 09:59:19 4734 2

原创 数学建模Matlab之数据预处理方法

判断缺失值和异常值并修复,顺便光滑噪音,渡边笔记clc,clear;close all;% 模拟缺失值% 模拟异常值%subplot在一个图窗中创建多个子图,然后使用plot函数将原始数据可视化title('原始数据');%% 判断数据中是否存在缺失值,并使用最省力法则% 假设testdata是一个n行m列的矩阵,每一列代表一个特征% 设置阈值,80%的总样本量% 遍历每一个特征% 计算每一列(特征)中非缺失值的数量% 如果非缺失值的数量少于阈值,则删除该列(特征)

2023-10-01 17:01:58 8918 5

原创 什么是 Stand Structure Index 林分结构指数?

是用于的一种指数,通常用来衡量树木的。简单来说,它反映了森林里树木的生长格局——是均匀排列的,还是高低错落的,或者是由不同树种混合组成的复杂结构。:表示林分结构复杂,树木高度、胸径(树干直径)等尺寸差异较大,或者树种混交程度较高。这种情况通常出现在或经过精心经营的混交林中。:意味着林分结构比较简单,树木大小接近,排列更均匀。这通常出现在或经过密集种植的单一树种森林中。这种林分可能在木材生产上更高效,但生态系统的稳定性较低,SSI 在森林管理、生态研究和可持续林业方面都有很重要的作用。总的来说,。

2025-03-22 16:58:02 757

原创 基于 Vue 3 的PDF和Excel导出

虽然即使不设置这些格式,基本的数据导出功能也可以正常工作,但设置格式后可以显著提升导出的 Excel 文件在外观和布局上的效果。以下是基于 Vue 3 Composition API 的完整实现,包括 PDF 和 Excel 导出。进行设置,目的是在生成的 Excel 文件中对表格显示效果进行优化,提升可读性和专业性,简单来说,这部分代码涉及对 Excel 文件中。

2025-03-22 16:57:09 701

原创 开发or产品经理?(第一节-b站热门资源整合-新手向)

产品经理:以用户的名义,用产品的手段,为客户和老板服务。本质上是服务业,toB:Boss/Business。即使是用户产品经理,也在考虑商业化,一切为了利益服务。权力、资源 与 工作不对等,需要的和实际有的不在同一数量级。

2025-03-04 17:03:51 883

原创 一文带你入门正射影像!

简单来说,就是的航空或卫星影像。一般来说,普通的航拍照片会有透视变形,地面上的物体,比如建筑物、树木,可能会有倾斜,而正射影像通过特殊的处理,把这些变形校正过来,使得整个影像就像一张真正的地图,。这种影像在很多领域都有用,比如地理信息系统(GIS)里经常用作,城市规划和土地管理部门也依赖它来进行土地调查和测绘。环境保护、农业、林业、灾害评估等场景也少不了正射影像,因为它能够提供精准的地理参考,帮助研究人员分析变化趋势,比如森林覆盖率的变化,洪水、地震等自然灾害的影响等等。

2025-03-04 16:57:36 744

原创 快速理解什么是 Fixed Effects 固定效应!

年份固定效应”和“单元固定效应”是统计模型中的一种控制变量方法,用于消除因时间和空间差异带来的潜在影响,以便更准确地评估自变量对因变量的真实影响。

2024-11-04 20:36:34 2228

原创 研究中的“异质性”、“异质性结果”是指?

异质性”这个词在统计学和研究中指的是,即不同个体、组别、区域或时间点的表现或特征并不相同。相对的概念是“同质性”,即所有个体或组别在某一方面表现相同或接近。

2024-11-04 19:52:41 1660

原创 一文理解平流层温度变化规律

臭氧层吸收了大部分来自太阳的紫外线辐射,使得这部分大气层变热,因此,在臭氧层内部确实可以观察到温度随高度上升而增高的情况。此外,平流层顶部接近中间层的地方,太阳辐射更为直接和强烈,即使臭氧较少,其他气体也可能吸收辐射并转化为热量,继续导致温度随高度上升。:臭氧层虽然吸收紫外线产生热量,但这种加热效果可能在垂直方向上并不均匀,尤其是臭氧分布在垂直和水平方向上的不均匀性导致了热量吸收的局部差异。:大气中的垂直和水平气流也会影响温度分布,例如,升降气流可以导致热量垂直传输,改变局部温度结构。

2024-10-28 20:07:09 1162

原创 什么是公民科学观测?

或eBird,这些平台允许用户上传他们的自然观察数据,包括植物、动物和其他自然现象。这些数据通常包括观测日期、位置、物种信息等,有时还伴有照片或其他描述。结合这两种数据源,可以极大增强研究的准确性和覆盖范围,尤其是在利用深度学习模型分析和预测植物分布变化时,两者的结合可以提供更为丰富和多维度的数据支持。公民科学观测(Citizen Science Observations)是指。在上文中,50万次公民科学观测可能是通过各种平台和项目收集的,如。在生态和环境科学领域,这种观测方法尤为常见,

2024-10-28 15:50:27 353

原创 《环境学基础》一、二章扩展概念

城市人口迅速增加,城市规模和结构布局也迅速扩大和变化。但由于城市基础设施落后,跟不上城市工业和人口发展的需要,一些工业发达的城市和工矿区的工业企业,排除大量废物污染环境,使得‘三废’成灾……”。什么是城市基础设施?为什么它的落后,会导致大量污染排放?这包括(如道路、铁路和桥梁)、(电网和天然气管道)、、以及(如学校、医院和垃圾处理设施)。城市基础设施的建设和维护对于保障城市环境的健康、促进经济发展和提高居民生活质量至关重要。

2024-10-24 12:03:48 1038

原创 一文理解什么是环境质量标准

科学性:基于广泛的科学研究和数据,包括毒理学、生态学和环境科学的研究成果。法律性这些标准通常由政府机构制定,具有法律效力,违反这些标准可能会导致法律后果。具体性:针对特定的环境介质(如空气、水、土壤)、特定地区、特定污染物制定。动态性:随着科学知识和技术的进步,环境质量标准会不断更新和调整。

2024-10-24 11:14:55 470

原创 卫星遥感数据及其购买指南

遥感影像:使用传感器或相机,记录地表的辐射能量,在环境科学中多用于检测植被覆盖变化、健康程度以及气候变化等。【基于光的物理特性和大气穿透性成像】空间分辨率和时间分辨率的选取,以及传感器的设计,共同决定了遥感影像的细节丰富度和更新频率。卫星遥感系统主要分为两大类:被动遥感和主动遥感。被动遥感依赖自然或人造光源,如太阳光,来观测地表特性;而主动遥感系统,如雷达卫星,发射自己的能量并接收回波,以生成影像。遥感影像的空间分辨率与光谱特性空间分辨率是指卫星影像中单个像素代表地面区域的大小,直接影响影像的细节清晰度。

2024-10-22 09:39:47 1154

原创 一文理解什么是环境因素的等值性

不好意思,我可能是全网第一个讲清楚“什么是环境因素的等值性”的人

2024-10-22 09:19:31 802

原创 大面积的地理空间数据拼接初步学习

数据拼接在GIS领域是一个常见的任务,尤其是当处理的是大面积的地理空间数据时。,这是因为这类软件提供了强大的工具来处理、分析和可视化地理信息。

2024-10-21 09:27:01 788

原创 深度学习入门(G):物种识别+框架选择

物种识别是一个应用机器学习和图像处理技术的过程。这个领域的目标是来自相机陷阱、卫星图像、无人机或其他传感器收集的。物种识别在中扮演着重要角色,因为它能提供快速而精确的数据来支持科学决策和保护措施。在进行物种识别时,核心学习要点包括理解图像数据的处理和分析,选择合适的机器学习模型进行训练以及优化这些模型以提高识别准确性。

2024-10-21 09:25:58 1228

原创 深度学习入门(F):通道、Head等常见概念

例如,在目标检测网络中,可能有一个head用于分类(识别对象的类别),另一个head用于回归(预测对象的边界框)。

2024-08-18 11:38:58 1621 1

原创 深度学习入门(E):逻辑回归与分类到底是啥关系?

逻辑回归和二分类任务的关系可以理解为一个特定的实现和一类问题的关系。逻辑回归只是其中的一种。

2024-08-18 11:38:09 514

原创 深度学习入门(D):TensorRT概念

TensorRT 是由 NVIDIA 开发的一个库,用于加速深度学习模型在 NVIDIA GPU 上的推理性能。它专为生产环境设计,通过优化网络配置和运算来实现快速和高效的推理。TensorRT 通过减少精度(如从单精度浮点转为半精度浮点),层和张量融合,内存优化等技术,显著提高了推理速度,同时尽可能保持结果的准确性。

2024-08-15 16:39:02 346

原创 深度学习入门(C):目标检测领域的挑战及解决方案(以YOLO为例)

YOLO是一种流行的实时对象检测系统,其优势在于速度快且在多个尺度上效果良好,这使其非常适合需要实时处理的应用,如视频监控和自动驾驶。,大大加快了处理速度。

2024-08-09 15:03:44 1341

原创 深度学习入门(七):处理流程注意点

比如取平均值或方差等定义形式。此外,确定这些特征是连续的还是离散的也非常重要。通常情况下,

2024-08-08 10:03:53 1095

原创 深度学习入门(六):无监督学习

K-means算法是一种常用的聚类算法,旨在将数据集划分成 k 个簇,使得每个簇中的数据点尽可能相似,而不同簇之间的数据点差异尽可能大。该算法是。

2024-08-08 10:02:18 1073

原创 深度学习入门(五):有监督学习

逻辑回归(Logistic Regression)是一种广泛使用的分类算法,以作者的理解,它是在线性回归的基础上添加了一个(通常是Sigmoid函数),以通过这种方式,逻辑回归将线性回归的输出转换为一个介于0和1之间的概率值,再通过阈值判断来实现分类任务。

2024-08-07 12:03:31 926

原创 深度学习入门(三):一些需要多加复习的知识

在机器学习和特别是在分类任务中,和是相对于某一分类目标而言的,通常在二分类问题(yes or no)中,

2024-08-07 12:03:14 937

原创 深度学习入门(二):常见概念(重点:泛化误差)

AutoDL、InsCoder和炼丹侠:这些平台提供的是算力市场服务,即用户可以根据自己的需要租用不同性能的GPU资源。例如,AutoDL提供自动化的深度学习训练环境,用户可以通过这种服务简化训练流程,更专注于模型的设计和优化。:这是NVIDIA推出的高性能GPU,专为深度学习、机器学习和高性能计算任务设计。它具有强大的处理能力,非常适合需要大规模并行计算的任务。

2024-08-06 17:02:18 1033

原创 深度学习入门(一):感知机与输入数据

单层感知机(Single-Layer Perceptron)和多层感知机(Multi-Layer Perceptron,简称MLP)是,用于执行各种机器学习任务,包括分类和回归。它们都基于,其核心在于模拟人脑中神经元的工作方式。

2024-08-06 16:03:58 1167

原创 深度学习入门(四):激活函数与LSTM

激活函数在神经网络中扮演着至关重要的角色。它们的主要功能是引入非线性因素,这使得神经网络能够学习和近似任何非线性函数,从而处理复杂的数据模式和决策边界。如果没有激活函数,即使网络拥有很多层,其表达能力仍然只限于线性函数,这大大限制了神经网络处理各种数据的能力。

2024-08-02 12:32:15 925

原创 深度学习入门(B):图像分割与图像(目标)监测

图像监测与图像分割是计算机视觉领域的两个重要应用,它们在众多领域如医疗影像分析、、自动驾驶车辆等都扮演着关键角色。

2024-08-02 10:47:02 900

原创 分支预测技术

分支预测是用来的一种技术。在现代计算机架构中,为了提高执行速度,处理器常常采用流水线技术来同时执行多条指令。当程序中出现条件分支(如 if-else 语句或循环)时,处理器必须等待分支条件的结果来确定下一条执行的指令路径。分支预测技术的引入是为了减少这种等待所造成的时间浪费,从而提高处理器的性能。

2024-08-01 21:59:33 920

原创 深度学习入门(A):SOTA、生成/判别模型

"SOTA" 是 "State of the Art" 的缩写,翻译成中文是“最先进的”,“尖端技术”或“行业领先”。在科技和研究领域,当提到某个产品、技术或模型是“SOTA”,意味着它,通常是性能最优或技术最新的。在深度学习和机器学习领域,一个被称为SOTA的模型指的是在某一个或多个标准数据集上,该模型展示了最优秀的表现,比如在准确度、速度、效率等方面超越了之前的模型。

2024-08-01 19:08:47 758

原创 LoRa无线通讯入门

LoRa(Long Range)是一种低功耗广域网(LPWAN)技术,主要设计用于连接低功率设备如传感器和定位器等,这些设备需要发送小数据包信息到相对较远的距离,而且通常工作在独立的电池上。

2024-05-06 18:00:31 2113 1

原创 计算机系统性能之并行墙与内存墙

在计算机科学和性能工程领域,术语“并行墙”(Parallelism Wall)和“内存墙”(Memory Wall)描述了两种影响计算机系统性能的重要瓶颈或限制。

2024-05-06 17:47:13 953

原创 计算机网络之CIDR

当你看到一个CIDR表示法,如,它。/32表示所有32位都是网络部分,没有主机部分,因此它指的是单一的IP地址。:当CIDR用来表示一个网络时,例如,这里的/24意味着前24位是网络地址,后8位是主机地址。这样的表示法实际上涵盖了从到的256个IP地址。

2024-04-15 22:45:11 1071

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除