hud 2473 Junk-Mail Filter

本文介绍了解决HDU 2473问题的一种高效并查集算法实现,通过引入虚拟节点简化了删除操作,并避免了在大数据集下可能出现的时间超限问题。文章详细阐述了算法的具体实现步骤,包括初始化、查找、合并等关键操作,并给出了完整的C++代码示例。

1.题目

http://acm.hdu.edu.cn/showproblem.php?pid=2473

2.分析

并查集删除点的做法:不是真正删除,而是将所有节点全部处理成非根节点,这样在做删除操作的时候,只用换一下根节点即表示删除了根节点。
如果在[0,N]中选择根节点,则不可避免的需要处理两种情况:删除非根节点;删除根节点;程序中如果直接建图添加这两种操作,则会导致TLE,因为数据量太大。
(自己做的时候用的就是直接建图添加考虑两种删除操作的思路,毫无疑问TLE)

参考网上的代码分析思路:将[0,N-1]中的所有点处理成并查集集合中的非根节点,这样在处理删除操作的时候只用换一下其对应的根节点即可,不用考虑删除该点之后会对其所处集合的影响(例如:删除非根节点怎么办?删除根节点怎么办?)    具体的处理过程为:初始化和合并的时候将[0,N-1]中的所有父节点处理成[N,2*N-1]中的节点;当需要删除节点的时候将其父节点修改为[2*N,3*N-1]中的点,保证[0,N-1] 都是集合中的非根节点。

3.复杂度

空间复杂度为O(N),建立一个集合的时间复杂度为O(1),N次合并M次查找的时间复杂度为O(MAlpha(N)),这里Alpha是Ackerman函数的某个反函数,在很大的范围内(人类目前观测到的宇宙范围估算有10的80次方个原子,这小于前面所说的范围)这个函数的值可以看成是不大于4的,所以并查集的操作可以看做是线性的。

4.涉及内容

数据结构:并查集

5.感想

如果碰到大数据题目发现超时,则可靠的做法是尽量不要存在遍历数据的操作,尽量用开辟大数组的方法来记录结果。(自己体会用空间换时间的思想,很深奥啊)

6.代码

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <algorithm>

long f2473[1200005],N,M,top;
long a2473[100005];

void makeset2473()
{
	for(long i=0;i<N;++i)
		f2473[i]=i+N;
	for(long i=N;i<1200005;++i)
		f2473[i]=i;
}

long find2473(long x)
{
	return f2473[x]==x?f2473[x]:f2473[x]=find2473(f2473[x]);
}

void union2473(long r1,long r2)
{
	long a=find2473(r1);
	long b=find2473(r2);
	if(a==b) return ;
	f2473[a]=b;
}

int main()
{
	freopen("in.txt","r",stdin);
	long k=0,A,B;
	char op[5];;
	while(1)//将scanf写到while循环中不是一个好主意,总会发生不可思议的事情
    {
		scanf("%ld%ld",&N,&M);
		if(N==0&&M==0) break;
		top=N+N;
        makeset2473();
        for(int i=0;i<M;++i)
        {
            scanf("%s",&op);
            switch(op[0])
            {
				case 'M':{
					scanf("%ld%ld",&A,&B);
					union2473(A,B);
					}break;
				case 'S':{
					scanf("%ld",&A);
					f2473[A]=top++;
					}break;
            }
        }
		for(long i=0;i<N;++i)
			a2473[i]=find2473(i);
		std::sort(a2473,a2473+N);
        A=1;
		for ( long i = 1; i < N; ++ i )
			if ( a2473[i] != a2473[i-1] ) A ++;
		printf("Case #%d: %d\n",++k,A);
	}
	return 0;
}

7.参考文献

http://blog.youkuaiyun.com/xingyeyongheng/article/details/8823300 在处理合并和删除的时候就记录剩下的集合数量,其中的删除操作也是通过添加虚拟点实现,和下面的思路相同
{
将合并的数据(来自集合[0,N-1])看做最终数据数组A,B的索引。数组A用于并查集内部的操作,数组B用于索引查找真正的根节点,其中包含新添加的节点。
这样当删除节点x之后,x节点对应的新的虚拟节点存在数组B中,当后面有处理和x相关的合并操作的时候,可以直接在B中查到新的节点来操作。
这样能够正确处理程序的原因是:每次在执行union操作的时候参数用的都是B数组中的数据(b包含新增加节点的数据),从而保证能正确删除
}

基于 NSFW Model 色情图片识别鉴黄 后面更新视频检测 项目背景: 随着互联网的快速发展,网络上的信息量呈现出爆炸式的增长。然而,互联网上的内容良莠不齐,其中不乏一些不良信息,如色情、暴力等。这些信息对青少年的健康成长和社会风气产生了不良影响。为了净化网络环境,保护青少年免受不良信息的侵害,我国政府加大了对网络内容的监管力度。在此背景下,本项目应运而生,旨在实现对网络图片和视频的自动识别与过滤,助力构建清朗的网络空间。 项目简介: 本项目基于 NSFW(Not Safe For Work)Model,利用深度学习技术对色情图片进行识别与鉴黄。NSFW Model 是一种基于卷积神经网络(CNN)的图像识别模型,通过学习大量的色情图片和非色情图片,能够准确地判断一张图片是否含有色情内容。本项目在 NSFW Model 的基础上,进一步优化了模型结构,提高了识别的准确率和效率。 项目功能: 色情图片识别:用户上传图片后,系统会自动调用 NSFW Model 对图片进行识别,判断图片是否含有色情内容。如果含有色情内容,系统会给出相应的提示,并阻止图片的传播。 视频检测:针对网络视频,本项目采用帧提取技术,将视频分解为一帧帧图片,然后使用 NSFW Model 对这些图片进行识别。如果检测到含有色情内容的图片,系统会给出相应的提示,并阻止视频的传播。 实时监控:本项目可应用于网络直播、短视频平台等场景,实时监控画面内容,一旦检测到含有色情内容的画面,立即进行屏蔽处理,确保网络环境的纯洁。
### 如何在本地部署 NSFW 模型或服务 要在本地环境中成功部署 NSFW(不适宜工作场合内容)检测模型或服务,以下是详细的说明: #### 准备环境 为了确保能够顺利运行模型和服务,需要安装必要的依赖项。这些工具和库包括但不限于以下几类: - **Python 环境**: 推荐使用 Python 3.7 或更高版本。 - **Transformers 库**: 提供加载预训练模型的功能[^1]。 - **PyTorch/TensorFlow**: 支持深度学习框架的计算需求。 - **Pillow (PIL)**: 处理图像文件并将其转换为适合输入模型的形式。 具体命令如下所示: ```bash pip install transformers torch Pillow ``` #### 加载模型与测试 通过 Hugging Face 的 `transformers` 工具包可以直接访问已有的 NSFW 图片分类模型。例如,可以采用名为 `"Falconsai/nsfw_image_detection"` 的公开模型来完成此任务[^1]。 下面是一个简单的代码片段展示如何加载该模型并对单张图片执行预测操作: ```python from PIL import Image from transformers import pipeline def classify_nsfw(image_path): # 打开指定路径下的图片文件 img = Image.open(image_path) # 初始化 image-classification 流水线对象,并指明使用的特定模型名称 classifier = pipeline("image-classification", model="Falconsai/nsfw_image_detection") # 对传入的图片调用流水线方法得到其类别标签及其置信度分数列表形式的结果 result = classifier(img) return result if __name__ == "__main__": test_img_path = "<your_test_image>" output_results = classify_nsfw(test_img_path) print(output_results) ``` 注意替换 `<your_test_image>` 成实际存在的图片绝对或者相对地址字符串值之前再尝试运行以上脚本。 #### 构建 RESTful API 服务 如果希望进一步扩展功能至 Web 应用程序层面,则可考虑利用 Flask/Django 这样的轻量级 web 开发框架构建起支持 HTTP 请求交互的服务端接口。这里给出基于 FastAPI 实现的一个简单例子作为示范用途: ```python import uvicorn from fastapi import FastAPI, File, UploadFile from PIL import Image from io import BytesIO from typing import List from pydantic import BaseModel app = FastAPI() class Prediction(BaseModel): label: str score: float @app.post("/predict/", response_model=List[Prediction]) async def predict(file: UploadFile = File(...)): try: contents = await file.read() pil_image = Image.open(BytesIO(contents)) clf_pipeline = pipeline('image-classification', model='Falconsai/nsfw_image_detection') predictions = clf_pipeline(pil_image) formatted_preds = [{"label": pred['label'], "score": round(pred['score'], 4)} for pred in predictions] return formatted_preds except Exception as e: raise ValueError(f"Error processing uploaded file {e}") if __name__ == '__main__': uvicorn.run(app, host='0.0.0.0', port=8000) ``` 启动服务器之后即可向 `/predict/` 路径发送 POST 请求附带上传待分析的目标图片获取返回结果了。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值