python基于PaddleOCR的文本识别GUI程序
1.PaddleOCR 的组成
PaddleOCR 包含多个模块,主要分为两部分:
文本检测:检测图像中的文本区域。
文本识别:识别文本区域中的具体文字。
此外,PaddleOCR 还支持多语言识别、表格识别、方向分类等功能。
2. 模型规模
PaddleOCR 提供了多种预训练模型,模型规模从小到大都有:
2.1 轻量级模型:如 PP-OCRv3,模型较小,适合移动端或嵌入式设备。
2.2 高精度模型:如 PP-OCRv3-server,模型较大,适合对精度要求较高的场景。
这些模型的规模远小于典型的“大模型”(如 GPT、BERT 等),但它们针对 OCR 任务进行了优化,能够在较小的模型规模下实现较高的精度。
3. 本程序GUI界面
功能 1:
可以整个图片进行文字识别。
功能 2 :
对图片所选区域进行识别文字
4. 核心代码
(https://download.youkuaiyun.com/download/java_marvel/90291417)[数据包]
class ImageRecognition(QtWidgets.QMainWindow):
def __init__(self):
super(ImageRecognition, self).__init__()
# imagePath
self.filePath = ''
self.all_screens = []
self.shot_screens = []
self.resize(1200, 800)
self.setWindowTitle("A+ KPD Image-recognition Tool")
self.setWindowIcon(QtGui.QIcon("🍳"))
# central widget
centralwidget = QtWidgets.QWidget(self)
self.setCentralWidget(centralwidget)
# central widget 里面的 主 layout
mainLayout = QtWidgets.QVBoxLayout(centralwidget)
# UI Up page
topLayout = QtWidgets.QHBoxLayout()
self.label_ori_image = QtWidgets.QLabel(self)
self.label_treated_image = QtWidgets.QLabel(self)
self.label_ori_image.setMinimumSize(520, 400)
self.label_treated_image.setMinimumSize(520, 400)
self.label_ori_image