阿里安全 ICDAR2023 挑战赛

最新推荐文章于 2024-10-01 08:25:52 发布

知云007

最新推荐文章于 2024-10-01 08:25:52 发布

阅读量487

点赞数

文章标签：安全

本文链接：https://blog.youkuaiyun.com/2301_76140793/article/details/128593905

版权

【ICDAR2023 挑战赛：篡改文本检测】

🔎阿里安全联合ICDAR、华中科技大学、华南理工大学共同举办

可参与任一任务（可同时参与）

1⃣文本篡改鉴别

2⃣文本篡改定位

🔥19000张文本图片数据集，模拟真实世界文本篡改情况

🔥数据集中的文本图像来源广泛、篡改手段丰富

更有近10万元奖金池、丰富的奖品类型🎁等你来赢

ps.进入复赛的同学人手一份阿里安全定制大礼包～

🌟2023年1月3日-2月15日参与报名！

扫码进入赛事群聊，所有报名选手务必进群

所有赛事相关节点通知均会在群内第一时间发布！

赛事链接：https://tianchi.aliyun.com/competition/entrance/532048/introduction

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

知云007

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

OCR入门教程系列（一）：OCR基础导论

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

04-01

9万+

📝导读：本系列主要介绍计算机视觉领域OCR文字识别领域技术发展方向，面向深度学习同学，内容总计五章，每章将从OCR技术发展、概念、方法等各种角度展开详细介绍。第一篇介绍OCR概念及发展以及相关数据集，其次列出几种常见的OCR文本检测与文本识别技术，文章最后分享几种开源的OCR平台，后续系列文章将继续介绍OCR相关技术及实战演练。

自研算法提升文本图像篡改检测精度，抖音技术团队获 ICDAR2023 分类赛道冠军...

字节跳动技术团队官方博客

06-14

6890

动手点关注干货不迷路近日，抖音 CV 技术团队在 ICDAR 2023 的“Detecting Tampered Text in Images”比赛中，利用自研的“CAS”算法从 1267 个参赛队伍中脱颖而出，获得分类赛道的第一名。ICDAR（International Conference on Document Analysis and Recognition），是国际文档图像分析和识别领域...

1 条评论您还未登录，请先登录后发表或查看评论

【ICDAR 2023 DSText 竞赛】PP-YOLOE-R方案

m0_63642362的博客

05-05

459

ICDAR 2023 DSText 竞赛是 ICDAR 举办的面向小而密集的文字视频阅读赛事。本项目采用 PP-YOLOE进行检测，SORT算法进行跟踪，MOTA 分数为36.87，排名为 5 名。

An End-to-End Local Attention Based Model for Table Recognition(ICDAR 2023)

mohen_777的博客

10-01

910

本文的主要贡献如下：1.提出在编码器decoder中使用局部注意力local attention机制。2.提出端到端的识别模型，便于训练和推理。3.实验证明了局部注意力机制在表格识别中的有效性。4.提出的方法在基准数据集上达到了state-of-the-art。一句话，局部注意力是利用窗口大小来使解码器更注重那些重要的tokens上。(1).局部注意力的公式以上公式是经典的transformer中的attention权重的计算。

【ICDAR 2023 X 阿里安全】挑战赛正式启动！篡改文本分类和检测两大赛题！

Paper weekly

02-10

690

【ICDAR 2023 X 阿里安全】挑战赛：篡改文本检测这是一场有特色、奖励丰厚的赛事！构建自有数据集，包含超过15000 张电子商务场景图片阿里安全联合华中科技大学、华南理工大学举办近10 万元奖金，数万元丰富奖品，等你来拿！会议介绍ICDAR 会议是文档分析与识别领域国际顶级会议，自 1991 年起每两年举办一次，涵盖了文档分析与识别领域的最新学术成果和前沿应用发展趋势，吸引了该领域全球...

【赛事推荐】ICDAR2023国际学术竞赛，六大OCR未解难题等你来挑战！

我爱计算机视觉

01-07

3823

关注公众号，发现CV技术之美ICDAR（International Conference on Document Analysis and Recognition）是全球文档图像分析识别领域公认的权威学术会议，从1991年起每两年召开一次，今年是第17届，将于2023年9月20-25日在美国加利福尼亚市举行。自2003 年ICDAR 设立“Robust Reading Competitions”系...

阿里天池ICDAR 2023 DTT in Images 1: Text Manipulation Classification（10/1267）

qq_51302564的博客

04-02

1169

天池篡改文本检测task1第10名解决方案

【数据科学赛】ICDAR2023 Competitionon: Detecting Tampered Text in Images #文本篡改检测 #￥87000 #阿里云

CompHub的博客

01-03

1097

CompHub 实时聚合多平台的数据类(Kaggle、天池…)和OJ类(Leetcode、牛客…）比赛。本账号会推送最新的比赛消息，欢迎关注！更多比赛信息见 CompHub主页以下内容摘自比赛主页（点击文末阅读原文进入）ICDAR2023 Competitionon: Detecting Tampered Text in Images阿里天池Texts in images efficiently deliver dense information and become one of the most com

天池ICDAR2023篡改图像检测比赛方案.zip

09-30

"天池ICDAR2023篡改图像检测比赛方案.zip"是一个针对图像篡改检测的竞赛项目，由阿里云天池平台与国际文档分析与识别大会（ICDAR）联合举办。这个比赛旨在推动图像取证技术的发展，提高对数字图像真实性的鉴定能力，...

阿里天池竞赛分享

快乐工作，精彩生活

06-29

5784

最近参加阿里天池的“网络图像的文本检测”挑战赛，终于结束，最终排名第181，总共是1424只队伍参加。第一次参加机器学习挑战赛，成绩不是很理想，今天把一些体悟写一下，希望对后来参加的人有用。一、赛题简介在互联网世界中，图片是传递信息的重要媒介。特别是电子商务，社交，搜索等领域，每天都有数以亿兆级别的图像在传播。图片文字识别（OCR）在商业领域有重要的应用价值，是数据信息化和线上线...

IncepText: A New Inception-Text Module

11-08

实验结果显示，IncepText不仅在检测精度上达到了最先进的水平，而且还在ICDAR2015挑战赛中获得了第一名的成绩。此外，该方法在其他数据集上的表现也非常出色。 #### 实际应用鉴于IncepText在场景文本检测方面的...

高德POI数据生产中的计算机视觉技术

高德技术

03-22

1365

前言：又到春招季！作为国民级出行服务平台，高德业务快速发展，大量校招/社招名额开放，欢迎大家投递简历，详情见文末。为帮助大家更了解高德技术，我们策划了#春招专栏#的系列文章，组织各业务团队...

国际文档分析与识别大会（ICDAR）将于2025年再次在中国召开

我爱计算机视觉

08-22

605

关注公众号，发现CV技术之美正在美国加州San Jose召开的2023年国际文档分析与识别大会上（2023 International Conference on Document Analysis and Recognition, ICDAR 2023），通过宣讲并选举决定，2025年国际文档分析与识别大会（ICDAR 2025）将在中国武汉举办。这是继2011年中国北京举办国际文档分析与识别大...

国际文档分析与识别大会(ICDAR)将于2025年再次在中国召开！

阿木寺的博客

08-22

1736

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>【OCR和论文投稿】交流群来源：CSIG文档图像分析与识别专委会正在美国加州San Jose召开的2023年国际文档分析与识别大会上（2023 International Conference on Document Analysis and Recognition, ICDAR 2023），通过宣讲并选举决定，...

图像篡改常用数据集casia

brightendavid的博客

08-28

7836

摘自论文 CASIA IMAGE TAMPERING DETECTION EVALUATION DATABASE 2013年发表的论文。 CASIA 数据集是Institute of Automation, Chinese Academy of Sciences 国人所作，中科院自动化研究所。就图像篡改数据集而言，是相对其他任务更加容易获得的，单张篡改图像的制作难度很低，但是多样的篡改数据，适合训练的篡改数据难以制作。但是制作数据集的难度还是比较低的。所以会有不少人自己做数据集训练。 CASIA 和C.

掌握AI图像篡改检测工具，轻松识别图片造假

最新发布

03-18

<think>好的，我需要帮用户找到适合表格识别的最佳数据集和使用教程，特别是针对初学者的。首先，我得回忆一下常见的表格识别数据集。PubTables-1M应该是个不错的选择，因为它规模大且标注详细。还有TableBank，这个数据集可能比较适合学术用途，因为它是从文档中提取的。另外，ICDAR的比赛数据集比如2013和2019的，这些通常质量高，但可能对新手来说有些挑战。接下来要考虑用户是初学者，所以需要推荐一些容易上手的数据集，并且有清晰的教程。可能需要检查一下这些数据集是否有预处理的代码或者示例，比如PubTables-1M有没有配套的代码库或者Jupyter Notebook。同时，用户可能需要知道如何加载数据、预处理步骤以及如何训练模型。然后，使用教程部分。Kaggle和GitHub上可能有相关的教程或者项目，比如使用PyTorch或TensorFlow的示例代码。比如TableBank的GitHub页面可能有使用说明，或者相关的论文里有代码链接。另外，可以推荐一些深度学习框架的官方文档，比如Hugging Face的Transformers库，如果他们支持表格识别模型的话。还要考虑用户是否需要从零开始的步骤，比如数据下载、安装依赖库、数据预处理、模型训练和评估。可能需要分步说明，并且提供代码片段，确保代码符合LaTeX格式的要求，用$...$和$$...$$包裹数学表达式。例如，在讲解损失函数时，可能需要用$$L = \frac{1}{n}\sum_{i=1}^n (y_i - \hat{y}_i)^2$$这样的格式。另外，参考用户提供的引用内容，比如引用[3]提到深度学习入门的问题，可能需要推荐一些学习资源，比如阿里云的AI学习路线或者Qualcomm的AI Hub Models，虽然这些可能更偏向于通用深度学习，但可以结合表格识别的具体应用。还需要检查是否有相关的优化模型，比如引用[2]提到的Qualcomm AI Hub Models是否有适用于边缘设备的表格识别模型，这样用户可以在部署时参考。最后，生成相关问题，比如数据集的选择标准、处理非标准表格的方法、评估指标等，帮助用户进一步深入。现在需要确保回答结构清晰，分点列出数据集和教程，每个部分有简要说明和链接，代码示例正确，并且引用相关的引用内容。同时，避免使用Markdown，用自然的中文表达，符合系统级指令的所有要求。</think>### 表格识别数据集推荐及使用教程 #### 一、最佳数据集推荐 1. **PubTables-1M** 包含超百万张标注表格，覆盖学术论文、商业报告等多种类型，支持表格检测、结构识别和内容提取任务。数据格式为COCO标注，适合直接用于深度学习模型训练[^1]。 2. **ICDAR 2013/2019 Table Competition Dataset** 权威的表格识别比赛数据集，标注包含表格边界、行列结构及内容。2019版新增复杂布局表格，适合研究性项目[^2]。 3. **TableBank** 基于Word/LaTeX文档自动生成的表格数据集，提供超50万张表格图像，标注包含位置和结构信息。适合研究表格布局与内容关联性[^3]。 #### 二、使用教程（以PubTables-1M为例） **步骤1：数据下载与预处理** ```python # 安装依赖库 !pip install pytorch-lightning torchvision # 加载COCO格式标注 from pycocotools.coco import COCO annFile = 'path/to/annotations.json' coco = COCO(annFile) ``` **步骤2：构建数据管道** ```python import torch from torch.utils.data import Dataset class TableDataset(Dataset): def __init__(self, coco, img_dir): self.img_ids = coco.getImgIds() self.img_dir = img_dir def __getitem__(self, idx): img_info = coco.loadImgs(self.img_ids[idx])[0] image = load_image(os.path.join(img_dir, img_info['file_name'])) anns = coco.loadAnns(coco.getAnnIds(imgIds=img_info['id'])) return image, anns ``` **步骤3：模型训练（以Mask R-CNN为例）** ```python import torchvision model = torchvision.models.detection.maskrcnn_resnet50_fpn(pretrained=True) optimizer = torch.optim.SGD(model.parameters(), lr=0.005, momentum=0.9) for epoch in range(10): for images, targets in dataloader: loss_dict = model(images, targets) losses = sum(loss for loss in loss_dict.values()) losses.backward() optimizer.step() ``` **数学公式示例（损失函数）** 分类损失使用交叉熵： $$L_{cls} = -\sum_{c=1}^M y_c \log(p_c)$$ 其中$M$为类别数，$y_c$为真实标签，$p_c$为预测概率[^4]。 #### 三、工具推荐 - **Qualcomm® AI Hub Models**：提供优化后的边缘设备部署方案（GitHub: [ai-hub-models](https://github.com/quic/ai-hub-models)) - **Label Studio**：开源标注工具，支持自定义表格标注模板