文件-一个简单的任务

本文介绍了一种从单一记录文件中分离对话的方法,通过Python脚本实现,可以将不同角色的对话内容分割并保存到独立的文本文件中。适用于需要对文本对话进行分类处理的场景。

2016.12.16

 

一般文件分为输入,处理和输出三个部分。

下面是有关文件的一张表。


 

如何打开文件

handle = open(file_name,access_mode='r')

file_name变量包含我们希望打开的文件的字符串名字,access_mode中‘r’表示读取,‘w’表示写入,‘a’表示添加。‘+’表示读写,‘b’表示二进制访问。如果未提供access_mode,默认值为‘r’.如果open成功,一个文件对象句柄会被返回。当一个文件被返回之后,我们就可以访问它的一些方法,比如readlines()和close().

任务:将文件(record.txt)中的数据进行分割并按照以下规律保存起来:
小甲鱼的对话单独保存为boy_*.txt的文件(去掉“小甲鱼:”)
小客服的对话单独保存为girl_*.txt的文件(去掉“小客服:”)

 

文件中总共有三段对话,分别保存为boy_1.txt, girl_1.txtboy_2.txt, girl_2.txt, boy_3.txt, gril_3.txt6个文件(提示:文件中不同的对话间已经使用“==========分割

 

关于一个文件,编写一个程序如下:

def save_file(boy, girl, count):
    file_name_boy = 'boy_' + str(count) + '.txt'
    file_name_girl = 'girl_' + str(count) + '.txt'

    boy_file = open(file_name_boy, 'w')
    girl_file = open(file_name_girl, 'w')

    boy_file.writelines(boy)
    girl_file.writelines(girl)

    boy_file.close()
    girl_file.close()


def split_file(file_name):
    f = open('record.txt')

    boy = []
    girl = []
    count = 1

    for each_line in f:
        if each_line[:6] != '======':
            (role, line_spoken) = each_line.split(':', 1)
            if role == '小甲鱼':
                boy.append(line_spoken)
            if role == '小客服':
                girl.append(line_spoken)
        else:
            save_file(boy, girl, count)

            boy = []
            girl = []
            count += 1

    save_file(boy, girl, count)

    f.close()


split_file('record.txt')

 运行后能够在同一个文件中生成几个txt形式的文件。注意代码生成的地方要和文件的地方在一起。这样就可以打开和读取文件了。

 

在任一OS(Window或者Dos;也可以是在Linux下,但要求能将结果演示给老师看)下,建立一个文件,把它假象成一张盘,在其中实现一个简单的模拟OS文件系统。 1、在现有机器硬盘开辟10M(共10000个盘块,每盘块大小为1k)的硬盘空间(生成一个10M的用户文件SDisk.dat即可),作为设定硬盘空间。 2、编写一管理程序SDisk,对此空间进行管理,以模拟OS文件系统,要求: ⑴、盘块大小1k ⑵、空闲盘块的管理:采用位示图法 ⑶、文件空间管理:采用FAT(文件分配表),每个盘块号占2个字节 ⑷、目录项管理: ①、每个目录项占用32字节,其中前8个字节(0-7)为文件名,之后跟3个字节(8-10)的扩展名,26-27字节,存放文件的第一个盘块号,最后四个字节(28-31),存放文件长度(如果目录项对应的是下一级子目录(文件),其文件长度部分为0) ②、目录按文件方式管理,每个目录仅用一个盘块(即1k,最多装32个目录项) ③、第0个目录项为本目录,即“.”,第0个字节为“.”,即0x2E,第26-27字节指明本目录所在盘块。 ④、第1个目录项为父目录,即“..”,第0,1个字节为“..”即0x2E,0x2E,第26-27字节指明父目录所在盘块。 ⑤、每个目录实际能放下文件或子目录30项。 ⑸、文件系统空间分配: ①、第0个盘块(1k)存放磁盘信息(可以设定为格式说明“FAT32”、盘块大小,盘块数等内容) ②、第1个盘块起,至125盘块,共125个盘块(125k)存放FAT内容 ③、第126、127(2个)盘块,存放位示图 ④、从第128盘块至10000盘块,皆为数据(区)盘块,其逻辑编号从0开始,至9872号数据盘块,即第0数据盘块为128号盘块,第1数据盘块为129号盘块,… ⑤、第0数据盘块(即128号盘块),存放根目录(同样只用一个盘块作根目录),由于第0、1目录项为“.”(本目录), “..”(父目录),因此根目录下同样只能存放30个文件或目录,并且从第2个目录项开始。 ⑥、文件或子目录数据,放在第1数据盘块及以后的数据盘块中,由用户按需要使用。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值