python文件的截取以及转存

该博客介绍了如何使用Python读取IMDb数据集,通过'read_imdb3'函数逐行处理文本序列,并将它们保存到指定目录。重点在于文件操作和数据结构的处理,适合初学者理解文本数据处理流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

def read_imdb3(data_dir):
    """读取数据集文本序列和标签"""
    data, labels = [], []
    tag=0
    new_file='F:\\sampledatakb\\train\\pos'
    for file in os.listdir(data_dir):
        filenamedir=os.path.join(data_dir, file)
        with open(filenamedir, 'rb') as f:
            # join用来做路径拼接
            review = f.read()
            data=review[0:1024]
            print(data[0:4])
            # print(data[2])
        file_name = os.path.join(new_file, file)
        with open(file_name, 'w+', encoding='utf-8') as f:
            for data1 in data:
                # print(data1)
                f.write(chr(data1))
            f.close()
        print("成功写入文件")
            # print(review[0])
data_dir='F:\\smapledata\\train\\pos'

### Linux 下使用 Python 实现截图并生成 Excel 的方法 要在 Linux 环境下通过 Python 实现截图功能并将结果存储到 Excel 中,可以结合多个库来完成这一目标。以下是具体的技术方案: #### 使用的工具和库 1. **Pillow**: 用于图像处理和保存截图。 2. **pyautogui**: 提供屏幕截图的功能。 3. **openpyxl 或 xlsxwriter**: 用于生成 Excel 文件。 --- #### 屏幕截图部分 `pyautogui` 是一个跨平台的库,支持在 Linux 上截取屏幕的一部分或整个屏幕。以下是一个简单的代码示例展示如何捕获屏幕并保存为图片文件: ```python import pyautogui # 截取全屏 screenshot = pyautogui.screenshot() # 保存截图到本地 screenshot.save('screenshot.png') ``` 如果需要截取特定区域,则可以通过传递坐标参数实现: ```python # 截取指定区域 (左上角x,y 和宽度高度w,h) region_screenshot = pyautogui.screenshot(region=(0, 0, 500, 500)) region_screenshot.save('region_screenshot.png') ``` 上述代码片段展示了如何在 Linux 平台上执行基本的屏幕捕捉操作[^1]。 --- #### 图片转存至 Excel 部分 为了将截图嵌入到 Excel 文档中,可以选择 `openpyxl` 或者更轻量化的 `xlsxwriter` 来构建工作表。这里提供两种方式的例子: ##### 方法一:使用 OpenPyxl 嵌入图片 OpenPyxl 支持直接向单元格插入图片对象。如下所示: ```python from openpyxl import Workbook from openpyxl.drawing.image import Image # 创建一个新的工作簿 wb = Workbook() ws = wb.active # 加载图片 img = Image('screenshot.png') # 插入图片到 A1 单元格位置 ws.add_image(img, 'A1') # 保存 Excel 文件 wb.save('output_with_image.xlsx') ``` 此脚本会创建一份新的 Excel 工作簿,并把名为 `screenshot.png` 的图片放置于第一个单元格上方[^2]。 ##### 方法二:使用 XlsxWriter 添加图形 XlsxWriter 同样允许我们定义复杂的布局设计,比如调整大小或者旋转角度等特性。下面是另一个例子演示这些高级选项的应用场景之一——保持原始比例的同时缩小显示尺寸: ```python import xlsxwriter workbook = xlsxwriter.Workbook('output_with_graphic.xlsx') worksheet = workbook.add_worksheet() # 设置列宽以便更好地适应图片内容 worksheet.set_column('B:B', 40) # 将 PNG 格式的图片加入文档内;注意路径需正确无误 options = {'x_scale': 0.5, 'y_scale': 0.5} worksheet.insert_image('B2', 'screenshot.png', options) workbook.close() ``` 以上两段程序分别介绍了基于不同需求选用合适工具的方法论[^3]。 --- #### 综合应用案例 假设现在有一个任务是要定期自动抓拍桌面状况然后记录下来形成报告形式发送出去审核的话,那么就可以按照上面提到的知识点组合起来编写完整的解决方案流程图如下: 1. 调用 PyAutoGUI 获取最新画面; 2. 利用 Pillow 对所得影像做初步裁剪优化预览效果; 3. 把处理后的成果借助 OpenPYXL/XLSWRITER 导出成易于分享查看的标准格式报表文件(.xls/.xlsx). 这样不仅提高了工作效率还增强了可读性和美观度[^4]. --- ### 注意事项 - 如果涉及敏感信息安全保护方面考虑加设密码锁定机制则需要用到额外第三方插件如JPype配合Java类库共同作用才能达成目的[^5]. - 不同操作系统间可能存在兼容性差异因此建议提前测试确认环境配置正常后再正式投入使用. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值