-
Marker工具目前支持pdf、docx、pptx、xlsx格式转markdown(包含图像)
-
搭建基础镜像环境
docker pull ubuntu:22.04
apt-get update
apt-get install sudo
sudo apt install python3.10
sudo apt install python3-pip
sudo ln -s /usr/bin/python3 /usr/bin/python
apt install vim
apt install net-tools
sudo apt install iputils-ping
pip install marker-pdf[full]
pip install -U uvicorn fastapi python-multipart
sudo apt install libvips-dev
docker commit <containerID> markdown-server:v1.0.0
- 使用Dockerfile包装以上镜像
FROM markdown-server:v1.0.0
# 设置时区
ENV TZ=Asia/Shanghai
RUN ln -snf /usr/share/zoneinfo/$TZ /etc/localtime && echo $TZ > /etc/timezone
ENV WORK_DIR=/workspace
# 避免在安装过程中出现交互式提示
ARG DEBIAN_FRONTEND=noninteractive
# 安装 locales 包,并生成 en_US.UTF-8 编码
RUN apt-get install -y locales && \
locale-gen en_US.UTF-8
# 设置环境变量,指定系统编码为 en_US.UTF-8
ENV LANG en_US.UTF-8
ENV LC_ALL en_US.UTF-8
# 声明工作目录
WORKDIR $WORK_DIR
# 声明容器监听端口
EXPOSE 8080/tcp