【python】小说素材收集器

本文介绍了一个使用Python实现的小说素材收集器。虽然没有利用爬虫和代理IP,但仍然提供了一种简陋但实用的方法来收集小说素材。通过分析和处理,可以提升小说创作的效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景:

文笔不够,技术来凑。其实应该配合爬虫,把文章爬到本地,再批量分析,效果会更好。但是代理ip要钱,之前免费站点没了。所以先做了一个简陋版。

 

目录结构:

 

代码:

import re
import copy
import os

#  ================================ 变量 ============================================
"""
公共变量
"""
#文件夹目录
path = "./doc"

#得到文件夹下的所有文件名称
files= os.listdir(path)

#key(按下面的分组,对应的关键字去收集)
keyList = [
    ['眼','眸','瞳','眼底'],
    ['嘴','唇'],
    ['眉'],
    ['脸颊']
]


#变量存储
# eye = []
# mouth = []
result =[];
resultList = [[] for i in range(len(keyList))];
#  ================================ 函数 ============================================

"""
返回删除所有空值后的arr
"""
def get_real_arr(arr):
    arr_copy = copy.deepcopy(arr)
    arr_copy = list(filter(None, arr_copy))
    while '' in arr_copy:
        arr_copy.remove('')
    return arr_copy


"""
遍历文件,过滤字符
"""
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值