另一个角度来看:支持向量机(SVM)

本文探讨了线性分类模型中的决策边界如何受到标签信息的影响,并通过实例展示了不同标签设置下判别边界的差异。此外,还介绍了支持向量机(SVM)的最大边际思想及其与线性模型的关系。

2014.08.31 

注意:如果使用t={0,1},那么决策边界应该是 wx+w0=0.5,其他类推

不再对文章做出修改


此文,记述数月前,看PRML第四章-线性分类模型时的思考。


此模型得到的解析解为:


可以看到:标签信息影响最后的参数的值,进而影响判别边界,接着会对预测产生影响。


示例:可以看到相同的数据,使用不同的标签信息,得到不同的判别边界。


训练完参数,使用其做预测,那么:不同的标签选择+各个类的点数Ni,就会有不同的判别边界,从而影响预测。

如预测下图三个*点是正类<+>还是负类<o>:

那么什么样的标签是好的呢?<对预测数据,得到的判别“合理”>

从判别边界来看,应该让判别边界“居中”,那么新来的预测点在靠近判别边界的地方,也能得到“合理”的判断。

由此可以看到:SVM最大边际的思想!!!

当时,在这个地方思考了两三天,推导了部分边际的内容。觉得这个问题应该有人做过,就继续往下看了,后来看到SVM,觉得不谋而合了。

付代码:

clear, close all, clc
x0 = [1 4]';
x1 = [5 1]';
randn('seed',1)
N0 = 20; N1 = 40;
X0 = repmat(x0,1,N0) + rand(2,N0);
X1 = repmat(x1,1,N1) + rand(2,N1);
X = [X0 X1]';
X = [ones(N0+N1,1) X];

plot(X0(1,:),X0(2,:), 'ko', 'MarkerFaceColor', 'y', 'MarkerSize', 7);
hold on
plot(X1(1,:),X1(2,:), 'k+','LineWidth', 2, 'MarkerSize', 7);
axis([0 6 -3 8])

%% 1
T0 = zeros(N0,1);T1 = ones(N1,1);T = [T0;T1];
w = inv(X'*X)*X'*T;
k = -w(2)/w(3); b = -w(1)/w(3);
h = refline(k,b); %已知斜率w 截距b 画直线
set(h, 'LineWidth', 1.5),text(1,k+b-0.3, 't=\{0,+1\}')
axis([0 6 -3 8])
hold on

%% 2
T0 = -ones(N0,1);T1 = ones(N1,1);T = [T0;T1];
w = inv(X'*X)*X'*T;
k = -w(2)/w(3); b = -w(1)/w(3);
h = refline(k,b); %已知斜率w 截距b 画直线
set(h, 'LineWidth', 1.5, 'Color', 'r'),text(2,k*2+b, 't=\{-1,+1\}')
axis([0 6 -3 8])

%% 3
T0 = (N0+N1)/N0*ones(N0,1);T1 = -(N0+N1)/N1*ones(N1,1);T = [T0;T1];
w = inv(X'*X)*X'*T;
k = -w(2)/w(3); b = -w(1)/w(3);
h = refline(k,b); %已知斜率w 截距b 画直线
set(h, 'LineWidth', 1.5, 'Color', 'g'),text(3,k*3+b, 't=\{+N/N0,-N/N1\}')
axis([0 6 -3 8])

hold on 
plot(2, 2, 'r*',3,2, 'b*', 4, 1, 'c*')

学习SVM的一个好的中文资料 李航著的《统计学习方法》第七章;讲得很好、很到位;列了不少参考资料。

+维基





基于 NSFW Model 色情图片识别鉴黄 后面更新视频检测 项目背景: 随着互联网的快速发展,网络上的信息量呈现出爆炸式的增长。然而,互联网上的内容良莠不齐,其中不乏一些不良信息,如色情、暴力等。这些信息对青少年的健康成长和社会风气产生了不良影响。为了净化网络环境,保护青少年免受不良信息的侵害,我国政府加大了对网络内容的监管力度。在此背景下,本项目应运而生,旨在实现对网络图片和视频的自动识别与过滤,助力构建清朗的网络空间。 项目简介: 本项目基于 NSFW(Not Safe For Work)Model,利用深度学习技术对色情图片进行识别与鉴黄。NSFW Model 是一种基于卷积神经网络(CNN)的图像识别模型,通过学习大量的色情图片和非色情图片,能够准确地判断一张图片是否含有色情内容。本项目在 NSFW Model 的基础上,进一步优化了模型结构,提高了识别的准确率和效率。 项目功能: 色情图片识别:用户上传图片后,系统会自动调用 NSFW Model 对图片进行识别,判断图片是否含有色情内容。如果含有色情内容,系统会给出相应的提示,并阻止图片的传播。 视频检测:针对网络视频,本项目采用帧提取技术,将视频分解为一帧帧图片,然后使用 NSFW Model 对这些图片进行识别。如果检测到含有色情内容的图片,系统会给出相应的提示,并阻止视频的传播。 实时监控:本项目可应用于网络直播、短视频平台等场景,实时监控画面内容,一旦检测到含有色情内容的画面,立即进行屏蔽处理,确保网络环境的纯洁。
### 如何在本地部署 NSFW 模型或服务 要在本地环境中成功部署 NSFW(不适宜工作场合内容)检测模型或服务,以下是详细的说明: #### 准备环境 为了确保能够顺利运行模型和服务,需要安装必要的依赖项。这些工具和库包括但不限于以下几类: - **Python 环境**: 推荐使用 Python 3.7 或更高版本。 - **Transformers 库**: 提供加载预训练模型的功能[^1]。 - **PyTorch/TensorFlow**: 支持深度学习框架的计算需求。 - **Pillow (PIL)**: 处理图像文件并将其转换为适合输入模型的形式。 具体命令如下所示: ```bash pip install transformers torch Pillow ``` #### 加载模型与测试 通过 Hugging Face 的 `transformers` 工具包可以直接访问已有的 NSFW 图片分类模型。例如,可以采用名为 `"Falconsai/nsfw_image_detection"` 的公开模型来完成此任务[^1]。 下面是一个简单的代码片段展示如何加载该模型并对单张图片执行预测操作: ```python from PIL import Image from transformers import pipeline def classify_nsfw(image_path): # 打开指定路径下的图片文件 img = Image.open(image_path) # 初始化 image-classification 流水线对象,并指明使用的特定模型名称 classifier = pipeline("image-classification", model="Falconsai/nsfw_image_detection") # 对传入的图片调用流水线方法得到其类别标签及其置信度分数列表形式的结果 result = classifier(img) return result if __name__ == "__main__": test_img_path = "<your_test_image>" output_results = classify_nsfw(test_img_path) print(output_results) ``` 注意替换 `<your_test_image>` 成实际存在的图片绝对或者相对地址字符串值之前再尝试运行以上脚本。 #### 构建 RESTful API 服务 如果希望进一步扩展功能至 Web 应用程序层面,则可考虑利用 Flask/Django 这样的轻量级 web 开发框架构建起支持 HTTP 请求交互的服务端接口。这里给出基于 FastAPI 实现的一个简单例子作为示范用途: ```python import uvicorn from fastapi import FastAPI, File, UploadFile from PIL import Image from io import BytesIO from typing import List from pydantic import BaseModel app = FastAPI() class Prediction(BaseModel): label: str score: float @app.post("/predict/", response_model=List[Prediction]) async def predict(file: UploadFile = File(...)): try: contents = await file.read() pil_image = Image.open(BytesIO(contents)) clf_pipeline = pipeline('image-classification', model='Falconsai/nsfw_image_detection') predictions = clf_pipeline(pil_image) formatted_preds = [{"label": pred['label'], "score": round(pred['score'], 4)} for pred in predictions] return formatted_preds except Exception as e: raise ValueError(f"Error processing uploaded file {e}") if __name__ == '__main__': uvicorn.run(app, host='0.0.0.0', port=8000) ``` 启动服务器之后即可向 `/predict/` 路径发送 POST 请求附带上传待分析的目标图片获取返回结果了。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值