推荐开源项目:Anansi - TV游戏节目爬虫

推荐开源项目:Anansi - TV游戏节目爬虫

pabkvizgenerator Anansi is a computer vision (cv2 and FFmpeg) + OCR (EasyOCR and tesseract) python-based crawler for finding and extracting questions and correct answers from video files of popular TV game shows in the Balkan region. pabkvizgenerator 项目地址: https://gitcode.com/gh_mirrors/pa/pabkvizgenerator

Anansi-logo

项目介绍

Anansi 是一个基于Python的开源项目,利用计算机视觉(cv2和FFmpeg)和OCR技术(EasyOCR和tesseract)从巴尔干地区流行的电视游戏节目视频文件中提取问题和正确答案。该项目特别针对“Slagalica”和“Pot(j)era”这两档热门电视游戏节目,能够高效地识别并提取出节目中的问题和答案,并将其整理成易于使用的CSV格式。

项目技术分析

核心技术

  1. 计算机视觉(cv2和FFmpeg)

    • 通过OpenCV库处理视频帧,识别特定游戏环节的开始和结束。
    • 使用FFmpeg进行视频文件的读取和处理。
  2. OCR技术(EasyOCR和tesseract)

    • 利用EasyOCR和tesseract对视频帧中的文字进行识别,提取问题和答案。

算法流程

  1. 打开视频文件:读取目标视频文件。
  2. 寻找游戏开始:通过模板匹配或颜色掩码识别游戏环节的开始。
  3. 识别问题和答案帧:监测帧中的变化,找到包含问题和答案的帧。
  4. 预处理和OCR:对识别到的帧进行预处理,并通过OCR提取文字。
  5. 数据清洗:对提取的文字进行清洗和格式化。
  6. 保存结果:将提取的问题和答案保存为CSV文件。

项目及技术应用场景

  1. 知识库构建:为Pub Quiz等知识竞赛提供丰富的题库资源。
  2. 教育应用:用于教育领域的知识测试和学习材料。
  3. 数据分析:对电视节目内容进行数据分析,了解热门话题和知识点。
  4. 娱乐应用:开发基于电视节目的互动游戏或应用。

项目特点

  1. 高效自动化:自动识别和提取视频中的问题和答案,节省人工时间。
  2. 数据丰富:已提取超过24,000个“Slagalica”问题和3,000个“Pot(j)era”问题。
  3. 技术先进:结合计算机视觉和OCR技术,识别准确率高。
  4. 易于使用:提供详细的安装和使用指南,用户可轻松上手。
  5. 开源免费:完全开源,用户可自由使用和修改。

具体实现

Slagalica节目处理
  • 游戏规则:在“Slagalica”的“Ko zna zna”环节中,选手需回答10个常识问题。
  • 识别游戏开始和结束:通过模板匹配识别游戏环节的开始和结束。
  • 帧处理和OCR:监测帧中的蓝色掩码和矩形,提取问题和答案。
Pot(j)era节目处理
  • 游戏规则:在“Pot(j)era”的第二个游戏环节中,选手回答问题。
  • 识别正确答案:通过绿色框识别正确答案。
  • 帧处理和OCR:提取问题和答案并进行OCR处理。

总结

Anansi项目以其高效、准确的技术手段,为用户提供了丰富的电视游戏节目问题和答案资源。无论是用于知识竞赛、教育应用还是数据分析,Anansi都展现了其强大的实用性和广阔的应用前景。欢迎广大开发者和技术爱好者使用和贡献此开源项目,共同丰富知识库资源。

更多详情和使用指南请访问项目GitHub页面


通过本文的介绍,希望能吸引更多用户关注和使用Anansi项目,共同推动开源技术的发展和应用。

pabkvizgenerator Anansi is a computer vision (cv2 and FFmpeg) + OCR (EasyOCR and tesseract) python-based crawler for finding and extracting questions and correct answers from video files of popular TV game shows in the Balkan region. pabkvizgenerator 项目地址: https://gitcode.com/gh_mirrors/pa/pabkvizgenerator

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

费琦栩

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值