大数据 - 文本文件数据提取工具根据设置条件从大文本数据中内导出我们勾选的列文本内容

博客介绍了一款“大数据 - 文本文件数据提取工具”,它能按分割符号拆分数据列,还可根据日期范围、数值大小、文本前缀后缀、货币值范围等条件导出数据,支持多次分类导出,帮助用户从大数据中提取所需分类数据。

1. 如果你想按某个分割符号去把长长的一整列数据拆分成多列;

2. 如果你想导出拆分后数据,你希望勾选那一列就导出那一列数据,勾选多列就导出多列数据;

3. 如果你想让某列按日期范围导出数据,就能按某列的日期范围导出数据;

4. 如果你想按某列的数值大小范围导出数据,就能按某列的数值范围导出数据;

5. 如果你想按某列文本前缀包含什么内容,就能按设定的前缀条件导出数据;

6. 如果你想按某列文本后缀包含什么内容,就能按设定的后缀条件导出数据;

7. 如果你想按某列文本前缀包含什么内容,后缀同时必须包含什么内容 ,就能按设定的前缀和后缀条件导出数据;

8. 如果你想按某列文本前缀包含什么内容,中间偏后的部分包含什么内容 ,就能按设定的前缀和中间偏后的设定的条件导出数据;

9.如果你想按某列文本后缀包含什么内容,中间偏前的部分包含什么内容 ,就能按设定的后缀和中间偏前的设定的条件导出数据;

10. 如果你想按某列货币值的范围导出数据,就能按设定的货币范围导出数据;

11. 如果你想按某列等于或者不等于什么内容导出数据,就能按照你希望结果导出数据;

总结:我们可以每次导出一类数据,分多次导出,想想看,是不是就能实现从大数据里分类导出我想要的分类数据,

以上描述的功能这款 “大数据 - 文本文件数据提取工具” 都能帮你轻松完成!如果你想现在立刻就拥有它,赶快来联系我吧,

早一天拥有!你就早一天受益!请你先认真阅读一遍我的博客,看看是不是你一直在等待的大数据软件!

范例1 根据设置列数据的时间范围提取(导出)数据

支持的日期格式(包括时间格式)如下:

            "HH:mm",
            "HH:mm:ss",
            "yyyy/MM",
            "yyyy/MM/dd",
            "yyyy/MM/dd HH:mm",
            "yyyy/MM/dd HH:mm:ss",
            "yyyy-MM",
            "yyyy-MM-dd",
            "yyyy-MM-dd HH:mm",
            "yyyy-MM-dd HH:mm:ss",
            "yyyy.MM",
            "yyyy.MM.dd",
            "yyyy.MM.dd HH:mm",
            "yyyy.MM.dd HH:mm:ss",
            "yyyyMM",
            "yyyyMMdd",
            "yyyyMMddHHmm",
            "yyyyMMddHHmmss",
            "yyyy年MM月",
            "yyyy年MM月dd日",
            "yyyy年MM月dd日 HH时mm分",
            "yyyy年MM月dd日 HH时mm分ss秒"

 

范例2   根据货币值范围导出文本数据(支持全世界各国货币汇率换算)

范例3   根据百分比大小范围导出文本数据 

范例4   根据字符串前缀和后缀导出文本数据  

 

<think>我们已经在之前的讨论中明确了需求:在Excel中按照时间分组并对值求平均值。用户现在明确要求使用Excel实现,因此我们将重点放在Excel解决方案上。 根据引用[2]中的示例,我们可以使用Excel的Power Query(获取和转换)或数据透视表来实现,但更直接的方法是通过SQL查询(适用于Excel 2010及以上版本)或者使用公式。然而,考虑到用户可能更倾向于使用Excel的内置功能而非编写SQL,我们将提供两种常用方法: 方法1:使用数据透视表(推荐,因为操作直观) 方法2:使用Power Query(适合处理较大数据量或需要自动刷新的情况) 方法3:使用函数公式(适合小规模数据,但可能较复杂) 下面详细介绍每种方法。 方法1:使用数据透视表按时间分组并求平均值 步骤: 1. 确保数据有两:一是时间,一是值。时间可能包含重复的时间点(一个时间对应多个值)。 2. 选中数据区域中的任意单元格。 3. 点击【插入】选项卡,选择【数据透视表】。 4. 在创建数据透视表对话框中,选择放置数据透视表的位置(新工作表或现有工作表)。 5. 在数据透视表字段表中: - 将“时间”字段拖到“行”区域。 - 将“值”字段拖到“值”区域。 6. 默认情况下,值字段的汇总方式可能是“求和”,我们需要改为“平均值”: - 在“值”区域中,点击值字段的下拉箭头,选择“值字段设置”。 - 在“值字段设置”对话框中,选择“平均值”,然后点击“确定”。 7. 如果时间包含完整的日期时间(如“2023-01-01 10:00”),而我们希望按小时、日、月等分组,可以右键单击数据透视表中的任意时间单元格,选择“分组”。在分组对话框中,选择所需的时间单位(如月、日、小时等),然后确定。 这样,数据透视表就会按时间分组(按你选择的时间单位)并计算每组的平均值。 方法2:使用Power Query(获取和转换数据) 步骤: 1. 选中数据区域中的任意单元格。 2. 点击【数据】选项卡,选择【从表格/区域】(如果数据是表格形式,否则先转换为表)。 3. 在Power Query编辑器中: - 选中时间,点击【转换】选项卡,选择【日期/时间】中的【时间】分组(例如,按小时、分钟等),或者使用【日期】分组(按年、月、日等)。注意:这里的分组操作会将时间转换为指定时间单位,然后对每个组内的数值求平均值。 - 但是,Power Query的分组操作更直接:点击【开始】选项卡的【分组依据】。 + 在“分组依据”对话框中,选择“高级”选项。 + 在第一个下拉框中选择要分组的(时间)。 + 然后点击下方“添加分组”,可以按多个分组,但我们这里只按时间分组。 + 在“新名”中输入一个名称(如“平均值”),在“操作”中选择“平均值”,在“”中选择数值。 + 点击确定。 4. 这样,我们就得到了按时间分组的平均值。然后点击【开始】选项卡的【关闭并上载】,将结果加载到工作表中。 注意:如果原始时间是日期时间格式,而我们希望按小时分组,可以在分组前先添加一个时间小时:在Power Query编辑器中,选中时间,点击【添加】选项卡,选择【时间】->【小时】,然后按这个新分组。 方法3:使用函数公式(数组公式) 如果我们希望在一个单独的区域出所有唯一的时间(按所需时间单位),然后计算平均值,可以使用以下步骤: 步骤: 1. 提取唯一的时间(按所需时间单位)。例如,如果我们希望按小时分组,我们可以先创建一个辅助,将时间转换为小时(如使用公式:=TEXT(A2, "yyyy-mm-dd hh")),假设时间在A。 2. 在另一出所有唯一的小时值(可以使用“删除重复项”功能,或者使用公式提取唯一值)。 3. 使用AVERAGEIF函数计算每个时间组的平均值。例如: =AVERAGEIF(辅助, 唯一时间值, 数值) 但是,如果原始时间是日期时间格式,我们想按小时分组,那么: - 辅助公式:=TEXT(A2, "yyyy-mm-dd hh") 或者按小时:=TEXT(A2, "hh") - 然后,在另一个区域(如D出所有唯一的小时值(可以用高级筛选或复制辅助后删除重复项)。 - 在E使用:=AVERAGEIF(B:B, D2, C:C) 其中B是辅助,C是数值。 但是,这种方法可能无法处理跨天的小时(比如同是10点,但不同天),所以辅助最好包含日期和小时。 总结: 对于多数用户,推荐使用数据透视表,因为它操作简单且功能强。如果数据量很或需要自动化刷新,则推荐Power Query。 注意:引用[2]中使用了SQL查询的方法,但该方法需要连接数据源,步骤相对复杂,且需要Excel支持(通过“数据”选项卡中的“从其他来源”->“来自Microsoft Query”)。如果用户熟悉SQL,也可以采用这种方法,但这里我们不再展开,因为数据透视表和Power Query更常用。 如果用户有进一步的需求,比如按特定时间间隔(如15分钟)分组,可以在数据透视表的分组对话框中设置“步长”为15分钟,或者在Power Query中使用时间取整函数(如Time.Round)后再分组。 相关问题: 1. 在Excel中如何按15分钟间隔对时间分组并求平均值? 2. 如何用Excel数据透视表同时计算平均值和总和? 3. 在Power Query中分组后如何将结果合并回原始数据表?</think>### 在Excel中按时间分组并对值求平均的方法 在Excel中实现时间分组求平均,主要有以下三种方法,根据您的数据量和需求选择: --- #### 方法1:使用数据透视表(推荐) **适用场景**:处理任意规模数据,操作直观高效 **步骤**: 1. **准备数据**:确保时间是标准日期/时间格式(若不是,选中数据 → 分 → 选择日期格式) 2. **创建透视表**: - 选中数据区域任意单元格 - 插入 → 数据透视表 → 选择放置位置 3. **设置分组**: - 行区域:拖入时间 - 值区域:拖入数值 - 右键点击时间 → 创建组 → 选择分组单位(日/月/季度/年等) 4. **计算平均值**: - 值区域中点击数值 → 值字段设置 → 选择"平均值" - 设置数字格式为数值(可选小数位数) **优势**:实时更新,支持动态分组(如按小时/分钟)[^2] --- #### 方法2:使用Power Query(适合大数据清洗) **适用场景**:数据清洗需求强或需自动化处理 **步骤**: 1. **导入数据**: - 数据 → 从表格/区域 → 勾选"表包含标题" 2. **时间格式处理**: - 右键时间 → 更改类型 → 日期时间 - 添加 → 日期 → 选择提取单位(年/月/日等) 3. **分组求平均**: - 选中提取的时间和数值 - 转换 → 分组依据 → 新名输入"平均值",操作选"平均值",选数值 4. **导出结果**: - 主页 → 关闭并上载 **优势**:处理百万行数据不卡顿,支持复杂清洗[^1] --- #### 方法3:使用函数公式(适合小规模数据) **适用场景**:快速计算简单分组 **公式示例**: ```excel =AVERAGEIFS(数值, 时间, ">="&E2, 时间, "<"&E2+1) // 按日分组 =AVERAGEIFS(数值, 时间, ">="&DATE(2023,MONTH(E2),1), 时间, "<"&EOMONTH(E2,0)+1) // 按月分组 ``` **操作说明**: 1. 在空白建立分组时间点(如E输入2023-01-01等) 2. 在F2输入上述公式并下拉填充 3. 使用ROUND函数控制小数位数:`=ROUND(平均值公式, 2)` **优势**:无需创建新表,公式直观可见[^1][^2] --- ### 关键注意事项 1. **时间格式统一**: - 混合格式时用`分`功能统一转换 - 文本型日期用`=DATEVALUE()`转换 2. **空值处理**: - 透视表默认忽略空值 - 公式中可用`=AVERAGEIFS(..., "<>0")`排除0值 3. **动态更新**: - 透视表:右键 → 刷新 - Power Query:右键 → 刷新 > **推荐工作流**: > 中小数据数据透视表(3分钟完成) > 大数据+定期更新 → Power Query(一次设置永久使用) --- ### 示例截图 | 原始数据(A时间,B值) | 透视表结果(按日平均) | |----------------------------|------------------------| | ![原始数据](https://via.placeholder.com/150?text=Time+Value) | ![透视表结果](https://via.placeholder.com/150?text=Daily+Avg) | [点击查看详细动画教程](https://support.microsoft.com/zh-cn/office/视频-创建数据透视表并对其进行分组-8c9e119b-1d4a-4a57-9142-2261e9d5f8c2)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值