
数据挖掘
文章平均质量分 73
阿泽财商会
作品主页https://mbd.pub/o/m/azcsh,高级人工智能算法训练工程师,人工智能应用工程师,高级工程师,高级信息系统项目管理师,软件设计师,CSM敏捷教练,csdn20周年直播嘉宾,高级健康管理师,会计师。
清华大学出版社《MongoDB游记》数据库教程书作者。专注于人工智能,数据挖掘技术与大数据,云计算与存储等技术的学习与研究。擅长人工智能算法训练,系统响应式开发、数据采集数据清洗和数据分析,分布式云存储运算等技术。熟悉后台系统、云存储计算平台的搭建,擅长解决架构过程中遇到的疑难问题。常用开发语言:java、python、c#、perl、sql。
展开
-
数据分析和数据挖掘的区别在哪
目标:数据分析侧重于解释数据,数据挖掘侧重于发现模式。方法:数据分析主要使用统计和可视化技术,数据挖掘使用算法和模型。应用场景:数据分析侧重于业务报告和运营优化,数据挖掘侧重于发现新知识和新模式。数据规模:数据分析处理中小规模数据,数据挖掘处理大规模数据。结果的可解释性:数据分析的结果通常更易于解释。虽然它们有所区别,但在实际应用中,数据分析和数据挖掘常常结合使用,以提供全面的洞察和解决方案。原创 2024-11-11 00:57:49 · 1452 阅读 · 0 评论 -
数据挖掘(七) -----在python程序中使用hail
我们在之前的文章中已经尝试安装了hail和简单的使用数据挖掘(五) -----基于Spark的可伸缩基因数据分析平台开源存储运算架构hail全面了解和安装但是 我们发现 这种hail的运行方式 是需要进入到conda的hail的虚拟环境中才能运行的。我们业务一般来说 都是在外层执行,还有其他的业务逻辑,所以最好还是在python的py程序中就能调用hail,而不是进入到conda的虚拟环境中...原创 2020-02-22 13:19:52 · 2068 阅读 · 0 评论 -
数据挖掘(五) -----基于Spark的可伸缩基因数据分析平台开源存储运算架构hail全面了解和安装
hail简介hail是一个开源的、通用的、面向python数据类型的处理基因数据专用的分析库和方法解决方案。hail的存在是 为了 支持 多维度的复杂的数据结构,比如 全基因组关联数据研究(GWAS).GWAS Tutorialhail的底层是通过python,scala,java和apache spark来实现的。hail官网官方文档hail的官方论坛维护hail的团队是 Nea...原创 2020-02-21 18:32:29 · 2079 阅读 · 0 评论 -
数据挖掘----基础--conda安装---miniconda
conda简介Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。 Conda 是为 Python 程序创建的,适用于 Linux,OS X 和Windows,也可以打包和分发其他软件。安装condaconda分为anaconda和miniconda。anaconda是包含一些常用包的版本(这里的常用不代表你常用 微笑.jpg),...转载 2020-02-14 17:19:26 · 1529 阅读 · 0 评论