调用开源LaTex OCR的一个简单实现(很实用)

注意事项

  1. 根据以下链接进行配置,具体的使用情况可以看我的分享【免费开源的LaTex OCR软件分享(latex-ocr和texify使用分享)】

LaTeX-OCR: https://github.com/lukas-blecher/LaTeX-OCR

texify: https://github.com/VikParuchuri/texify

  1. 配置环境可能存在某些库版本太新,导致安装出现异常;
  2. 下面剪贴板的路径修改为自己存在的路径;
  3. 使用F5刷新界面来获取新的识别内容;

texify调用

# 调用命令
streamlit run .\texify_app.py
import os
from PIL import Image, ImageGrab
import streamlit as st
from texify.inference import batch_inference
from texify.model.model import load_model
from texify.model.processor import load_processor

# how to use
# streamlit run .\texify_app.py

# 注释掉的部分可以调用文件上传,但感觉对我不是很实用

# if __name__ == '__main__':
#     streamlit.set_page_config(page_title='Texify OCR')
#     streamlit.title('Texify OCR')
#     streamlit.markdown(
#         'Convert images of equations to corresponding LaTeX code.\n\nThis is based on the `texify` module.')

#     uploaded_file = streamlit.file_uploader(
#         'Upload an image an equation',
#         type=['png', 'jpg'],
#     )

#     if uploaded_file is not None:
#         image = Image.open(uploaded_file)
#         streamlit.image(image)
#     else:
#         streamlit.text('\n')

#     if streamlit.button('Convert'):
#         if uploaded_file is not None and image is not None:
#             with streamlit.spinner('Computing'):
#                 try:
#                     latex_code = batch_inference([image], model, processor)
#                     streamlit.code(latex_code, language='latex')
#                     streamlit.markdown(f'$\\displaystyle {latex_code}$')
#                 except Exception as e:
#                     streamlit.error(e)
#         else:
#             streamlit.error('Please upload an image.')


if __name__ == '__main__':
    st.set_page_config(page_title='LaTeX-OCR')
    st.title('LaTeX OCR')
    st.markdown('Convert images of equations to corresponding LaTeX code.')
    image_container = st.empty()
    im = ImageGrab.grabclipboard()
    import time
    time.sleep(0.1)
    
    flie_path = "D:\\Miniconda\\envs\\texocr\\doc\\clipboard\\grab_clipboard.jpg"
    if isinstance(im, Image.Image):
        print("Image: size : %s, mode: %s" % (im.size, im.mode))
        image_container.image(im)
        im.save(flie_path)
    else:
        print("clipboard is empty")
    
    if os.path.exists(flie_path):
        if st.button('Convert'):
            with st.spinner('Computing'):
                try:
                    model = load_model()
                    processor = load_processor()

                    image = Image.open(flie_path)
                    latex_code = batch_inference([image], model, processor)
                    # print(latex_code)
                    st.code(latex_code[0], language='latex')
                    st.markdown(latex_code[0])
                except Exception as e:
                    st.error('Failed Convert!')
    else:
        st.info('Please copy an image to your clipboard first, then click "Use Clipboard"')

latex ocr调用

# 运行命令
streamlit run .\ocrtex_app.py
import os
from PIL import Image, ImageGrab
import streamlit as st
from pix2tex.cli import LatexOCR
from munch import Munch

args = Munch({'config': 'settings/config.yaml',
              'checkpoint': 'checkpoints/weights.pth',
              'no_resize': False})

if __name__ == '__main__':
    st.set_page_config(page_title='LaTeX-OCR')
    st.title('LaTeX OCR')
    st.markdown('Convert images of equations to corresponding LaTeX code.')
    image_container = st.empty()
    im = ImageGrab.grabclipboard()
    import time
    time.sleep(0.1)
    
    flie_path = "D:\\Miniconda\\envs\\texocr\\doc\\clipboard\\grab_clipboard.jpg"
    if isinstance(im, Image.Image):
        print("Image: size : %s, mode: %s" % (im.size, im.mode))
        image_container.image(im)
        im.save(flie_path)
    else:
        print("clipboard is empty")
    
    if os.path.exists(flie_path):
        if st.button('Convert'):
            with st.spinner('Computing'):
                try:
                    model = LatexOCR(args)
                    image = Image.open(flie_path)
                    latex_code = model(image)
                    print(latex_code)
                    cp_content = '$$ ' + latex_code + ' $$'
                    st.code(cp_content, language='latex')
                    st.markdown(f'$\\displaystyle {latex_code}$')
                except Exception as e:
                    st.error('Failed Convert!')
    else:
        st.info('Please copy an image to your clipboard first, then click "Use Clipboard"')

文本OCR

图片示例如下,背景简单没问题,稍微复杂的背景可能不太行,一般是建议使用微信,几乎大家都有,使用简单。

https://github.com/deanmalmgren/textract

按照上述同样#1#2的原理可以很容易实现下面效果:
在这里插入图片描述

注意:需要单独下载支持中文的语言包,还要安装支持的库,这个已经被作者封装好exe,直接安装就行。


import os
import textract
from PIL import Image, ImageGrab
import streamlit as st

if __name__ == '__main__':
    st.set_page_config(page_title='Text-OCR')
    st.title('Text OCR')
    st.markdown('Convert images of equations to corresponding LaTeX code.')
    image_container = st.empty()
    im = ImageGrab.grabclipboard()
    import time
    time.sleep(0.1)
    
    flie_path = "D:\\Miniconda\\envs\\texocr\\doc\\clipboard\\grab_clipboard.jpg"
    if isinstance(im, Image.Image):
        print("Image: size : %s, mode: %s" % (im.size, im.mode))
        image_container.image(im)
        im.save(flie_path)
    else:
        print("clipboard is empty")
    
    if os.path.exists(flie_path):
        if st.button('Convert'):
            with st.spinner('Computing'):
                try:
                    full_text = textract.process(
                                    flie_path,
                                    method='tesseract',
                                    language='chi_sim',
                                ).decode('utf-8')
                    # print(full_text)
                    st.code(full_text, language='txt')
                    st.markdown(full_text)
                except Exception as e:
                    st.error('Failed Convert!')
    else:
        st.info('Please copy an image to your clipboard first, then click "Use Clipboard"')

### 回答1: 要将图片转换为LaTeX格式,你可以使用一些开源的Java库和工具。 首先,你可以使用Java图像处理库,如Java Advanced Imaging (JAI)或OpenCV来加载和处理图像。这些库可以帮助你读取图像文件,并对其进行预处理,如调整大小、降噪、增强对比度等。这些步骤可以提高最终转换结果的质量。 接下来,你需要将处理后的图像转换为二进制图像,这可以通过将颜色图像转换为灰度图像来实现,或者使用阈值化技术来提取包含文本的二进制区域。你可以使用Java图像处理库来执行这些操作。 然后,你可以使用开源OCR(Optical Character Recognition,光学字符识别)库,如Tesseract,来识别图像中的文本。这些库通常提供Java绑定,并具有很高的识别准确度。你可以将处理后的二进制图像传递给OCR库,然后获得识别结果。 最后,你可以将OCR识别的文本转换为LaTeX格式。你可以使用Java字符串处理功能来清理和格式化识别结果,并使用LaTeX命令和语法来表示文本、公式和其他特殊字符。 总结起来,要将图片转换为LaTeX格式,你需要使用Java图像处理库将图像加载、预处理和转换为二进制图像。然后,使用OCR库来识别图像中的文本,最后将识别结果转换为LaTeX格式。这个过程需要使用一些开源库和技术,但可以通过Java编程实现。 ### 回答2: Java可以通过使用开源库或API来将图片转换为LaTeX格式。以下是一种可能的方法: 首先,我们需要使用Java中的图像处理库(如Java图像处理库ImageJ)加载要转换的图片。这可以通过使用Java的文件读取和图像处理功能来实现。 然后,我们可以将加载的图像转换为灰度或黑白图像,以便更容易进行后续处理。这可以通过应用图像处理算法(如二值化)来实现。 接下来,我们可以使用Java字符识别库(如Tesseract OCR)识别图像中的字符。这可以通过将图像分割为小块并对每个块执行字符识别来实现。标准的LaTeX字符和符号可以在字符识别过程中进行比对,从而确定哪些字符在图像中呈现。 最后,我们可以将识别的字符转换为LaTeX代码,并以LaTeX文件的形式保存。在生成的LaTeX文件中,我们可以使用适当的排版和格式设置来确保图像在呈现为Latex时具有良好的质量和可读性。 需要注意的是,由于图像处理和字符识别都是复杂的任务,因此可能需要进行一些试验和调整,以选择合适的参数和算法来实现最佳的结果。 通过以上步骤,我们可以使用Java将图片转换为LaTeX格式。这种方法可以帮助用户将手写的公式或图表转换为LaTeX代码,以便在科学出版物、学术论文或技术文档中使用。 ### 回答3: Java是一种广泛应用于软件开发的编程语言,而图片转化为LaTeX则是一种将图片转化为LaTeX代码的技术。LaTeX是一种排版系统,常用于科技文献的撰写。 在Java中,可以通过使用开源的库或者API来实现将图片转化为LaTeX的功能。首先,需要读入待转化的图片文件,可以使用Java提供的图片处理库,如javax.imageio包中的ImageIO类来读取图片。然后,可以使用图片处理库中的方法将图片转化为二进制数组或者像素数组。接下来,可以根据转化后的图像数据,将其转化为LaTeX代码。 具体的转化过程可以根据需求进行设计,一种常见的方式是将图片转化为矢量图形,然后通过解析矢量图形数据生成对应的LaTeX代码。这可以通过使用Java中的矢量图形处理库,如Apache Batik来实现。另一种方式是将图片转化为灰度图像或者二值图像,然后将每个像素点的信息转化为LaTeX代码中对应的文本字符。 在进行图片转化为LaTeX的过程中,可能需要考虑到一些细节,如字体,尺寸,对比度等问题。可以通过在转化过程中设置相关的参数来控制这些细节。另外,需要注意选择合适的LaTeX模板来确保转化后的LaTeX代码能够正确地排版出来。 总结来说,要实现将图片转化为LaTeX,可以利用Java的图片处理库,将图片数据转化为LaTeX代码。具体的实现方式可以根据需求进行设计,常用的方法包括将图片转化为矢量图形或者灰度/二值图像,然后将相应的数据转化为LaTeX代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值