使用Python进行FME的批处理

本文介绍如何利用Python脚本结合FME进行批处理,处理百度热搜榜文本数据。首先,从百度云盘获取数据,然后通过String Searcher提取搜索指数和热搜词汇,接着使用FeatureMerger挂接数据,并进行条件赋值输出。脚本主要使用os包,遍历文件并调用FME模板执行批处理任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 前言

本文所需数据及相关文件共享于百度云盘:

链接:http://pan.baidu.com/s/1dFKSlmp

密码:yo3p

2. 数据来源

数据为百度热搜榜的几段文本,分别放在不同的路径下,如下图所示:


3. 模板概览


4. 思路

a)  读入txt文本,先使用String Searcher对搜索指数进行提取,对提取后的指数进行编号,待用;

b)  a步骤中的非指数部分含有热搜词汇,再使用一个StringSearcher进行提取,编号,待用;

c)  使用FeatureMerger对热搜词汇与指数进行挂接;

d)  对挂接后的数据进行条件赋值,输出。

5. 脚本

Py脚本使用了os包&#

### 如何运行或启动Python脚本 #### 使用FME平台中的Python集成环境 在FME环境中,可以通过导航至“导航器”> “工作区参数” > “脚本” > “启动Python脚本”的路径来执行Python代码。此过程允许用户直接在FME的工作区内嵌入并调用Python逻辑[^1]。 #### 常见的Python脚本运行方式概述 对于独立于任何特定软件之外的一般情况来说,Python程序作为`.py`结尾的文件存在,这些文件能够通过多种途径被执行起来。这包括但不限于利用命令行工具、IDE内置的功能按钮或是其他第三方应用程序提供的接口[^2]。 #### 设置开机自动加载Python脚本 如果希望某个名为 `auto.py` 的Python脚本能随着系统的启动而自动运行,则可以在Linux系统上以管理员身份修改 `/etc/rc.local` 文件,在其中加入相应的指令以便完成这一目的[^3]。 #### 利用Anaconda管理环境下的批量操作 当采用Anaconda作为Python包管理和环境构建工具时,创建一个批处理(.bat)文件可简化进入指定虚拟环境的过程,并进一步支持在此环境下运行目标Python脚本的操作。具体做法是在该.bat文件的第一行写入用于激活所需Conda环境的命令[^4]。 #### 定期调度任务配置 为了安排周期性的Python脚本执行计划,可以借助Unix/Linux系统自带的任务调度服务Cron。在此之前先检查当前已有的定时作业列表是一项明智的选择,可通过输入`crontab -l`命令获取现有设置的信息[^5]。 ```bash # 示例:显示所有现存的cron任务条目 crontab -l ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值