python excel转为markdown（包含合并行/列填充）

原创已于 2025-07-24 17:33:10 修改 · 88 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #excel #开发语言

于 2025-07-18 16:34:45 首次发布


import openpyxl
import openpyxl.worksheet
import openpyxl.worksheet.worksheet
import pandas as pd


def unmerge_and_fill_cells(worksheet: openpyxl.worksheet.worksheet.Worksheet):
    all_merged_cell_ranges = list(worksheet.merged_cells.ranges)
    for merged_cell_range in all_merged_cell_ranges:
        merged_cell = merged_cell_range.start_cell
        worksheet.unmerge_cells(range_string=merged_cell_range.coord)
        for row_index, col_index in merged_cell_range.cells:
            cell = worksheet.cell(row=row_index, column=col_index)
            cell.value = merged_cell.value
            
def sheet_to_dataframe(sheet):
    # 读取sheet最大范围的单元格数据
    data = []
    for row in sheet.iter_rows(values_only=True):
        data.append(list(row))
    df = pd.DataFrame(data)
    return df



def unmerge_cell_and_convert_to_markdown(filename):
    # excel分开合并单元格并填充，然后转为markdown
    wb = openpyxl.load_workbook(filename)
    result = {}
    for sheet_name in wb.sheetnames:
        sheet = wb[sheet_name]
        unmerge_and_fill_cells(sheet)
        df = sheet_to_dataframe(sheet)
        # 转为markdown格式，index=False去掉行号
        md = df.to_markdown(index=False, tablefmt="github")
        result[sheet_name] = md

    return result



if __name__ == '__main__':
    markdown_dict = unmerge_cell_and_convert_to_markdown("example.xlsx")
    for sheet, md_text in markdown_dict.items():
        # print(f"### Sheet: {sheet}\n")
        with open(file="t.md", mode="w", encoding="utf8") as f:
            f.write(md_text)

        # print("\n\n")