<Excel> 数据分析之数据采集

本文详细介绍了如何使用Excel的数据菜单和Power Query进行数据采集,包括从文本、网站、Access数据库以及各种文件格式导入数据的方法,特别讨论了Power Query在处理CSV文件(包括乱码问题)和从Access数据库及WEB获取数据的技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

image_1cqj3pv2k82epcq4rt1ad9q382t.png-36.1kB

从EXCEL数据菜单中直接导入数据-自文本

EX自文本.gif-1301.4kB

从EXCEL数据菜单中直接导入数据-自网站

EX自网站.gif-2366.6kB

从EXCEL数据菜单中直接导入数据-自Access

EX自Access.gif-851.7kB

利用Powe

<table><thead><tr><th data-spm-anchor-id="5176.28103460.0.i429.22481db8KRCfLK">序号</th><th data-spm-anchor-id="5176.28103460.0.i441.22481db8KRCfLK">功能模块</th><th>描述</th></tr></thead><tbody><tr><td>1</td><td>RFID</td><td>- 通过modbus tcp/rtu协议同RFID通讯</td></tr><tr><td></td><td data-spm-anchor-id="5176.28103460.0.i440.22481db8KRCfLK"></td><td>- 基于工位RFID做调度和跟踪每个工段的料盒、托盘流向</td></tr><tr><td></td><td></td><td>- 记录相关库存,并处理异常</td></tr><tr><td>2</td><td>设备管理</td><td>- 统一管理设备元数据</td></tr><tr><td></td><td></td><td>- 通过modbus tcp/rtu协议同PLC通讯监控设备状态(四种运作状态:运行(1)、待机(2)、异常(3)、维护(4))</td></tr><tr><td></td><td></td><td>- 在前端界面展示,提供异常报警抛出</td></tr><tr><td data-spm-anchor-id="5176.28103460.0.i431.22481db8KRCfLK">3</td><td>实时库存管理</td><td>- 设置缓存分档规则</td></tr><tr><td></td><td></td><td>- 在相关工位读取rfid调mes获取绑定分档信息,调度料盒进缓存立库</td></tr><tr><td>4</td><td>报警管理</td><td>- 设置报警规则,报警等级</td></tr><tr><td></td><td></td><td data-spm-anchor-id="5176.28103460.0.i439.22481db8KRCfLK">- 定时监控PLC和相关点位数值,超出阈值时记录报警,提供报警接口</td></tr><tr><td>5</td><td>数据采集</td><td>- 设置设备的关键采集点位</td></tr><tr><td></td><td></td><td>- 根据配置的点位从plc等采集设备数据</td></tr><tr><td></td><td></td><td data-spm-anchor-id="5176.28103460.0.i438.22481db8KRCfLK">- 时序点位数据进入时序数据库方便统计</td></tr><tr><td>6</td><td>工厂耗用</td><td>- 监控智能电表数据</td></tr><tr><td></td><td></td><td>- 按时间维度存储到时序数据库</td></tr><tr><td></td><td></td><td>- 折线图展示耗用情况</td></tr><tr><td>7</td><td>工艺产能</td><td>- 设置工艺工段元数据,工段标准产能,班次元数据</td></tr><tr><td></td><td></td><td>- 采集工段产能数据统计每2小时产能</td></tr><tr><td></td><td></td><td data-spm-anchor-id="5176.28103460.0.i403.22481db8KRCfLK">- 设定班次结束定时统计当班产能数据</td></tr><tr><td>8</td><td>OEE</td><td data-spm-anchor-id="5176.28103460.0.i405.22481db8KRCfLK">- 定时采集设备运行状态</td></tr><tr><td></td><td></td><td>- 统计记录设备正常运行时间、待机时间、异常时间、维护时间、报警次数、实际产出等</td></tr><tr><td></td><td></td><td data-spm-anchor-id="5176.28103460.0.i407.22481db8KRCfLK">- 折线图展示设备有效利用率、产能达成率、时间开动率(开动时间 / 负荷时间)、性能开动率、合格品率</td></tr><tr><td>9</td><td>时间同步服务</td><td data-spm-anchor-id="5176.28103460.0.i436.22481db8KRCfLK">- plc和上位机使用ntp协议</td></tr></tbody></table> 转为csv
最新发布
05-16
### 将HTML表格转换为CSV格式的方法 要将包含功能模块及其描述的HTML表格(涉及RFID、设备管理、实时库存管理等模块)转换为CSV文件格式,可以通过以下几种方法实现: #### 方法一:使用Python脚本自动化处理 通过Python中的`pandas`库和`BeautifulSoup`库可以从HTML中提取表格数据,并将其导出为CSV文件。 以下是具体代码示例: ```python from bs4 import BeautifulSoup import pandas as pd # HTML字符串或从文件读取的内容 html_content = """ <table> <thead><tr><th>序号</th><th>功能模块</th><th>描述</th></tr></thead> <tbody> <tr><td>1</td><td>RFID</td><td>- 通过modbus tcp/rtu协议同RFID通讯...</td></tr> <tr><td>2</td><td>设备管理</td><td>- 统一管理设备元数据...</td></tr> <!-- 更多功能模块 --> </tbody> </table> """ # 解析HTML内容 soup = BeautifulSoup(html_content, 'html.parser') table = soup.find('table') # 查找表格元素 # 使用pandas读取表格数据 df = pd.read_html(str(table))[0] # 导出到CSV文件 csv_output_path = 'output.csv' df.to_csv(csv_output_path, index=False, encoding='utf-8-sig') print(f"Data has been successfully exported to {csv_output_path}") ``` 这种方法能够自动解析复杂的HTML表格结构,并生成标准化的CSV文件[^1]。 --- #### 方法二:手动复制粘贴至Excel再另存为CSV 如果不想编写代码,可以直接在浏览器中选中整个HTML表格区域,右键点击“复制”,然后切换到Microsoft Excel软件,在单元格A1处执行“粘贴”。接着,保存工作簿时选择“CSV (逗号分隔)”格式作为输出选项。这适合简单的场景,但对于大型或嵌套表格可能不够精确[^2]。 注意:由于HTML表格可能带有额外样式或其他隐藏字段,因此推荐先验证导出的结果是否完全匹配预期。 --- #### 方法三:利用在线工具进行转换 许多免费的在线服务允许用户上传HTML文件或将网页地址直接提交给它们,从而自动生成对应的CSV版本。这类工具通常简单易用,无需安装任何软件即可完成任务。然而,在共享敏感业务逻辑(如RFID通信细节或OEE计算公式)时需谨慎对待隐私问题[^3]。 例如,可以选择像Tabula这样的开源桌面应用程序来识别PDF或HTML文档里的表格布局并轻松转储成平面文件形式供后续分析之用。 --- ### 注意事项 无论是采用何种手段实施迁移作业之前都应该做好充分准备,包括但不限于备份源材料以防万一出现问题无法恢复原状造成损失;另外还要考虑跨平台兼容性以及字符编码一致性等问题以免因小失大影响整体进度安排[^4]。 最后提醒一点就是确保最终形成的CSV文档内部各列顺序排列合理清晰便于后期进一步开发利用价值最大化的同时也减少了不必要的麻烦环节出现可能性大大提升工作效率水平达到事半功倍的效果[^5]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值