
AI-数据挖掘
AI-数据挖掘
OceanEyes.GZY
算法策略
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python数据挖掘——数据预处理
Python数据挖掘——数据预处理 数据预处理 数据质量 准确性、完整性、一致性、时效性、可信性、可解释性 数据预处理的主要任务 数据清理 数据集成 数据归约 维归约 数值归约 数据变换 规范化 数据离散化 概念分层产生 数据清理(试图填充缺失的值,光滑噪声并识别离群点,纠正数据的不一致) 缺失值 忽略元组 人工填写缺失值 使用一个全局常量填充缺失值 使用属性的...原创 2020-01-15 09:48:52 · 311 阅读 · 0 评论 -
Python数据挖掘——数据概述
Python数据挖掘——数据概述 数据集由数据对象组成; 数据的基本统计描述 中心趋势度量 均值 中位数 众数 中列数 数据集的最大值和最小值的平均 度量数据分布 极差 最大值与最小值的差 四分位数 方差 四分位数极差 数据基本统计描述的图形显示 一元分布 分位数图 分位数-分位数图(q-q图) 直方图 二元分布 散点图 数据可视化 1、基于像素...原创 2020-01-15 09:48:11 · 176 阅读 · 0 评论 -
Python数据挖掘——基础知识
Python数据挖掘——基础知识 数据挖掘又称从数据中 挖掘知识、知识提取、数据/模式分析 即为:从数据中发现知识的过程 1、数据清理 (消除噪声,删除不一致数据) 2、数据集成 (多种数据源 组合在一起) 3、数据选择 (从数据库中提取和分析任务相关的数据) 4、数据变换 (通过汇总或聚焦操作,把数据变换和统一成适合挖掘的形式) 5、数据挖掘 (基本步骤,使用智能化方法提取数据) 6、模式评...原创 2020-01-15 09:47:29 · 305 阅读 · 0 评论 -
Python数据挖掘——概要
一、数据挖掘过程 1.数据选择 分析业务需求后,选择应用于需求业务相关的数据:业务原始数据、公开的数据集、也可通过爬虫采集网站结构化的数据。明确业务需求并选择好针对性的数据是数据挖掘的先决条件。 2.数据预处理 通常选择好的数据会有噪音,不完整等缺陷,需要对数据进行清洗,缺失项处理,集成,转换以及归纳: python字符串处理(相当方便)、正则式匹配、pandas、beautifulsoup处理H...转载 2020-01-15 09:46:47 · 359 阅读 · 0 评论 -
数据挖掘--应用篇
转载,原文链接:https://gitbook.cn/gitchat/geekbook/5c67b4207fa9074fde996ecd/topic/5c6cf4fe7fa9074fde9c8bcd 第四章 应用篇 数据挖掘技术从一开始就是面向应用的。目前,在很多领域数据挖掘都是一个很时髦的词,尤其是在如零售业、旅游业、物流业、医学等领域,数据挖掘技术的使用,可以大大提高行业效率和行业质量。 4....转载 2019-02-27 01:24:00 · 839 阅读 · 0 评论 -
数据挖掘--趋势篇
转载;原文地址:https://gitbook.cn/gitchat/geekbook/5c67b4207fa9074fde996ecd/topic/5c6d0b9e7fa9074fde9d6481 第六章 趋势篇 6.1 发展趋势 AMiner 根据数据挖掘领域的相关论文画了分别绘制了数据挖掘领域的近期热点、全局热点和早期热点图,旨在基于历史的科研成果数据的基础上,对数据挖掘各个时间段的热度甚至...转载 2019-02-27 01:27:44 · 3921 阅读 · 0 评论