用python创建epub文件的一些知识点

原创

于 2025-01-12 17:11:45 发布 · 660 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#python #爬虫

概述

Alt

读取json配置文件，然后把几个xhtml文件合并为epub的python库。配置文件里包含了书名、作者、封面图像路径、各个章节的路径和章节名称。本文用到的库：

from ebooklib import epub

内容包括：

书脊 spine
封面 set_cover

要点

书脊的概念 spine

书脊这个词用的真的好，确实和实体书脊是一样的。但是应该把书横放在桌子上，书脊对着自己，这样观察就特别容易理解。如果把书立起来，顺序就会变成从右往左，这样很不舒服。一本书，从上往下（和写代码的顺序一样，看起来像一个列表）依次是：

封面
简介
目录页（你把它当成一个名字为“目录页”的章节即可，以免和后面的目录专用概念混淆）
第一章
第二章（略）
结束语
引用
感谢
封底
以上这些并不都是必须的，就算只有一章也没关系，仿佛一页A4纸打印好了扔在那里。

以下的函数，动态地创建了一个前言页面intro.xhtml。然后把’nav’和这个前言页面，加入到书脊。具体解释详见程序的注释

def add_intro_page(self):
    # title是页面的<title></title
    intro_page = epub.EpubHtml(title='-前言-', file_name='intro.xhtml', lang='zh')
    intro_page.content = '<p><h2>不可商用</h2></p><p>自学自用, 请勿传播</p>'
    self.book.add_item(intro_page)
    # spine 是 EPUB 书籍的主要内容部分, 它是一个列表, 包含了书籍的各个部分。这里我们先把前言部分添加到 spine 中
    # 每个spine的元素都是一个 EpubHtml 对象, 它代表了一个 HTML 页面,包含了页面的标题、内置文件名和内容等信息
    # 当 nav 出现在 spine 列表中时，通常表示导航文档（Navigation Document）。在 EPUB 3 规范中，导航文档是 nav.xhtml，
    # 它为读者提供了一种在电子书中进行导航的方式，类似于目录。
    self.spine = ['nav', intro_page]

封面 set_cover

就是一本书的封面的图像
alt

def set_book_cover(self, cover_image_path):
    # 如果封面图像路径为空, 使用默认封面图像
    if not cover_image_path:
        cover_image_path = "bg.png"
    # set_cover 函数用于设置书籍的封面图像。它接受三个参数:
    # 第一个参数是封面图像的文件路径,第二个参数是封面图像的二进制内容,
    # 第三个参数 False 是 create_thumbnail 参数。它是一个布尔值，
    # 用于指示是否要为封面图片创建缩略图。缩略图可以用于在app的书架里使用
    self.book.set_cover(cover_image_path, open(cover_image_path, 'rb').read(), False)

目录 toc

这个目录 toc，不是nav.xhtml那个页面，而是整个epub文档的内部逻辑。
主要靠epub.link来实现。
举个例子：
你家住在“长安街8号院8号楼808室”这是个内部逻辑，是派出所登记这个房子的一个编码。
而你家房门上有个牌子,上面写着8-808, 这只是一个牌子.即便它掉下来了,没有了,也不影响派出所里的逻辑

def add_toc(self):  # toc 目录
    # 先连接上前言部分, 然后再连接上各个章节
    toc = [epub.Link(href

最低0.47元/天解锁文章