
数据科学
文章平均质量分 65
亚图跨际
跨学科视角展现 -- 计算思维
展开
-
Python和R概率统计算法建模评估气象和运动
1. 气象学: 1. 计算和可视化::dart:全球陆地-海洋平均年平均表面温度::pen:直方图温度异常,:pen:显示分位数-分位数,:pen:绘制线性趋势线,:pen:绘制温度空间图,:pen:温度空间图的全景图,:pen:一维空间一维时间数据和霍夫莫勒图,:pen:三维空间和一维时间文件及其地图绘制。:pen:ChatGPT生成全球温度。 2. 概率统计计算和绘制::dart:气象变量::pen:日降水量,:pen:干旱期的概率分布函数和累计分布函数,二项分布和正态分布、:pen:气候数原创 2024-04-14 13:27:43 · 830 阅读 · 0 评论 -
Python可视化概率统计和聚类学习分析生物指纹
1. 使用构面将图表拆分为多个子图表 - 水平、垂直或环绕,下拉菜单的附加功能(允许多项选择、添加占位符文本等)。:dart:使用散点图探索变量并使用滑块过滤子集。:dart:使用 Markdown 探索地图并丰富仪表板,等值线地图,利用动画帧向绘图添加新图层,使用地图回调函数,创建 Markdown 组件,地图投影,用散点图绘图,Mapbox 地图,纳入交互式地图。:dart:计算数据频率并构建交互式表格,创建直方图,修改直方图的 bin 和使用多个直方图来自定义直方图,向直方图添加交互性,创建 2D 直原创 2024-04-02 11:30:06 · 1102 阅读 · 0 评论 -
Python命令行终端分析后勤物资分配-音乐-机场-酒店评论数据
csvkit 包是一组基于 Python 的工具,用于处理 CSV 文件:修复和清理、不同分隔和引用之间的转换、grep,甚至查询数据。插入标题行的快速方法是使用 --no-header-row 选项。这将插入一个模拟标题,其中包含名为“a,b,c…在许多情况下,我们必须处理损坏的 CSV 文件。我们可以使用 -K 2 删除前两行,或使用任何数字删除前 N 行。要将 CSV 转换为制表符分隔 (TSV) 文件。原创 2024-01-14 20:39:52 · 849 阅读 · 0 评论 -
Python条形图热图直方图可视化精神健康状态(医学数据集)
目标是比提供的基本报告更深入地挖掘,并了解更多属性之间的相互作用,这可以为所描述的决策者提供信息。原创 2024-01-06 17:03:20 · 521 阅读 · 0 评论 -
Pandas 数据变形和模型分析
Pandas数据变换计算和模型建立原创 2023-09-17 21:25:26 · 403 阅读 · 1 评论 -
Python时间序列模型使用河流-地下水-泵水数据计算地下水位下降
时间序列模型表示对观察井中不同应力对水头的作用的独立估计, 应用多模型方法来确定哪些水文应力与描述观测井中的水头动力学相关。降水过剩、河流水位和地下水抽取被列为潜在相关的水文压力。每个头部时间序列测试了八种不同的模型结构。最简单的模型仅考虑降水过剩,由降水和潜在蒸发量计算得出。下一个模型将河流阶段添加为压力。在接下来的三个模型中,最多添加三个井场作为潜在应力,从最近的井场开始向最远的井场移动。最后三个模型重复这最后一步,忽略河流作为压力。最好的模型结构是从每个观测井的可靠模型集中选出的。原创 2023-01-12 09:48:19 · 1008 阅读 · 0 评论 -
Python电网静态和准静态分析及自动化优化
基于表格数据结构,其中每个元素类型都由一个包含特定元素所有参数的表和一个包含不同分析方法的元素特定结果的结果表表示。最重要的是,它包括一个元素和每个元素类型的结果表,例如线路、变压器、开关等。国内安装设计的设计理念不需要任何数学,也不需要任何先进的软件,只关心一个场所内的照明和电源布线的分布。电力系统分析的目的是确保设备协同工作,以便以规定的电压和频率将所需的电力输送到负荷中心,并且网络中没有组件过载,并且没有故障条件危及系统。为了使所有总线和线路的创建更简单,我们将创建总线和线路的过程包装到一个函数中。.原创 2022-07-20 19:51:19 · 888 阅读 · 0 评论 -
Python统计模型探索性数据分析(EDA)系统(单变量-双变量-相关性-缺失值)
单变量分析旨在更深入地了解单个列。 它创建该列的各种统计数据和可视化。 例如,要深入了解特征 year_built,要计算year_built 的最小值、最大值、不同计数、中值、方差,并创建一个箱线图来检查异常值,一个正常的 Q-Q 图将其分布与正态分布进行比较。双变量分析是为了理解两列之间的关系(例如,一个特征和目标)。 有许多可视化来促进理解。 例如,要了解 year_built 和 price 之间的关系,创建一个散点图来检查它们是否具有线性关系,并创建一个 hexbin 图来检查价格在不同年份范围原创 2022-07-07 10:45:49 · 1062 阅读 · 0 评论 -
Python探索性数据分析(EDA)统计数据和建模
在统计学中,探索性数据分析是一种分析数据集以总结其主要特征的方法,通常使用统计图形和其他数据可视化方法。 可以使用或不使用统计模型,但主要是 EDA 用于查看数据可以告诉我们超出正式建模的内容,从而对比传统的假设检验。EDA 不同于初始数据分析 (IDA),更侧重于检查模型拟合和假设检验所需的假设,并根据需要处理缺失值和进行变量转换。 EDA 包含 IDA。EDA 的目标是:EDA 中使用的典型图形技术有:降维:典型的定量技术有:EDA可视化辅助概要:折线图 条形图 散点图 面积图和堆积图 饼图 表格图原创 2022-07-07 10:18:37 · 1070 阅读 · 0 评论 -
R降维预测癌症良性或恶性
详细解释了选择主成分分析 (PCA) 等降维技术的原因。 构造一个线性判别函数来预测新的观察结果。使用这个测量细胞核大小和形状的 32 个变量的数据集,目标是创建一个模型,使我们能够预测乳腺癌细胞是良性还是恶性。特征是根据乳房肿块的细针抽吸 (FNA) 的数字化图像计算的。 它们描述了图像中存在的细胞核的特征。 我们的数据集由 569 个观测值和 32 个变量组成。 有一个 ID 变量、一个显示它们是良性还是恶性的诊断变量,以及 30 个详细描述细胞核大小和形状的测量变量。 诊断是一个分类变量,是我们的响应原创 2022-07-07 10:16:59 · 328 阅读 · 0 评论 -
R生物信息学统计分析
用 edgeR 估计差异表达 | 用 edgeR 估计差异表达 | 使用 powsimR 进行功效分析 | 使用 GRanges 对象查找未注释的转录区域 | 使用bumphunter从头开始查找显示高表达的区域 | 微分峰分析 | 使用 SVA 估计批次效应 | 使用 AllelicImbalance 寻找等位基因特异性表达 | 绘制和呈现 RNAseq 数据使用 VariantTools 在序列数据中查找 SNP 和插入缺失 | 预测长参考序列中的开放读取框 | 使用 karyoploteR 在遗传图谱原创 2022-06-06 11:38:09 · 636 阅读 · 0 评论 -
R分析可视化实用数据(航班_教育_餐厅_租户_变迁_寿命_安全)
描述性统计 | 频率和列联表 | 相关性和协方差 | t-测试 | 非参数统计通过 sapply() 进行描述性统计使用 by() 分组的描述性统计回归拟合和解释线性模型 | 评估模型假设 | 在竞争模型中进行选择使用 R 对基本实验设计进行建模 | 拟合和解释 ANOVA 类型模型 | 评估模型假设确定样本量要求 | 计算效应大小 | 评估统计功效可视化双变量和多变量关系 | 使用散点图和折线图 | 理解 corrgram | 使用马赛克图和关联图理解置换测试的逻辑 | 将置换检验应用于线性模型 |原创 2022-06-05 21:55:19 · 177 阅读 · 0 评论 -
简单线性回归R和Python预测身高体重国内生产总值二氧化碳排放量
简单线性回归是一种统计技术,用于显示一个因变量和一个自变量之间的关系。 因变量表示为 Y,而自变量表示为 X。变量 X 和 Y 线性相关。 简单线性回归可用于: (a) 描述一个变量对另一个变量的线性相关性; (b) 根据另一个变量的值预测一个变量; © 修正一个变量对另一个变量的线性相关性。简单线性回归模型的形式为:Yi=β0+β1Xi+εiY_{i}=\beta_{0}+\beta_{1} X_{i}+\varepsilon_{i}Yi=β0+β1Xi+εi其中 β0\beta_{0}β0原创 2022-06-03 16:39:45 · 875 阅读 · 0 评论 -
R和Python主成分分析(PCA)线性判别分析(LDA)及其K-最近邻分类器和病理预测
在此,我们将使用此机器学习存储库中的数据集作为我们的数据。如下,加载:上面的代码将简单地加载数据并命名所有 32 个变量。 ID、诊断和十个不同 (30) 特征。现在我们已经加载了我们的数据并发现自己有 30 个变量(不包括我们的响应“诊断”和不相关的 ID 变量)。当我们尝试使用 PCA 的线性组合来描述数据中的差异时,我们发现“良性”和“恶性”病理之间存在一些非常明显的聚类和分离! 这为基于我们的特征开发分类模型提供了一个很好的案例!PCA 的另一个主要“功能”,是它实际上可以直接提高模型的性能。PC原创 2022-06-02 10:53:31 · 514 阅读 · 0 评论 -
Python自回归移动平均和自回归综合移动平均及快速预测每月飞机乘客
理解并在 Python 中实现 ARMA 和 ARIMA 模型以进行时间序列预测。ARMA(自回归移动平均)模型回想一下,ppp阶的自回归过程定义为:yt=c+ϕ1yt−1+ϕ2yt−2+…+ϕpyt−p+ϵty_{t}=c+\phi_{1} y_{t-1}+\phi_{2} y_{t-2}+\ldots+\phi_{p} y_{t-p}+\epsilon_{t}yt=c+ϕ1yt−1+ϕ2yt−2+…+ϕpyt−p+ϵt其中,ppp是阶数,ccc是常数,ϵ\epsilonϵ是噪原创 2022-05-30 22:19:22 · 488 阅读 · 0 评论 -
监控系统和网络入侵Python流式数据异常检测
流式处理方法可以有效地处理实际应用程序的有限内存和处理时间要求。这些方法只存储和处理一个实例或最近实例的一个小窗口。近年来,已经为异常检测和流数据开发了各种免费和开源软件 (FOSS)。然而,这些软件包要么缺乏对异常检测的关注,要么是为批量数据而设计的。我们将现有框架分类为 (i) 流框架和 (ii) 异常检测框架。流式框架的重点不仅在于异常检测,还在于流数据上的其他机器学习任务,例如分类和回归。因此,由于需要同时为其他任务维护不同的方法,它们的专用流异常检测方法数量有限。我们特别专注于流异常检测并引入了一原创 2022-05-19 19:53:59 · 705 阅读 · 0 评论 -
Python探索性数据分析(EDA)暴力密码猜测攻击网站登录异常检测策略
探索性数据分析(EDA)探索性数据分析 (EDA) 分析和调查数据集并总结其主要特征,通常采用数据可视化方法。 它有助于确定如何最好地操纵数据源以获得所需的答案,从而更容易发现模式、发现异常、检验假设或检查假设。EDA 主要用于查看在正式建模或假设检验任务之外可以揭示哪些数据,并提供对数据集变量及其之间关系的更好理解。 它还可以帮助确定您正在考虑用于数据分析的统计技术是否合适。您可以使用 EDA 工具执行的特定统计功能和技术包括:聚类和降维技术,有助于创建包含许多变量的高维数据的图形显示。原始数原创 2022-05-13 20:51:40 · 511 阅读 · 0 评论 -
Python蒙特卡洛模拟工作或任务轻重缓急策略
像很多人一样,我的待办事项列表中有很多事情。 这就引出了一个明显的问题:如果待办事项列表上有多个任务,你应该先做哪一个?名单上的首要任务式是哪个?最容易做到的是哪个?重要的事情是哪个?或者说你需要使用哪种更复杂的方法来解决它们?当然,若您有足够的时间来完成任务,一切都会变得轻松。若您没有足够的时间,随之而来的问题是您应该首先解决哪些,以及使用什么策略来优化您的时间?显然,这在很大程度上取决于您要优化的目标:您是否想完成尽可能多的任务?还是尽可能多地完成高优先级任务?还是尽可能及时的完成任务?建模工具原创 2022-05-12 10:58:14 · 269 阅读 · 0 评论 -
Python交互式D3.js可视化应用样板
可视化数据可能是项目成功的关键,因为它可以揭示数据中隐藏的洞察力,并提高理解力。 说服人们的最好方法是让他们看到他们的数据并与之交互。 尽管 Python 中提供了许多可视化包,但制作精美的独立和交互式图表并不总是那么简单,这些图表也可以在您自己的机器之外工作。D3 的主要优势在于它适用于 Web 标准,因此除了浏览器之外,您不需要任何其他技术来使用 D3。 重要的是,交互式图表不仅可以帮助告诉读者一些事情,还可以让读者看到、参与和提出问题。 本文中,我将概述如何使用 Python 构建自己的独立、交互式原创 2022-05-09 21:47:16 · 1530 阅读 · 2 评论 -
Python灰度共生矩阵OpenCV和scikit-image图像特征分析和K-最近邻算法
我们可以通过观察在视觉上区分图像的纹理:图案环空间分布颜色排列和强度下图是一张图像上的纹理图,其分布为 50% 黑色和 50% 白色平均值、中值、标准差等统计计算将无法区分上面的 3 张图像。 上面的三幅图像具有相同的颜色排列和像素强度,但具有不同的空间模式和分布,这些空间模式和分布无法通过平均值、中值或标准差等统计计算来识别,因此灰度共生矩阵 (GLCM) 为了解决这个问题而出现。灰度共生矩阵(GLCM)是图像纹理分析技术。 GLCM表示具有灰度强度,距离和角度的2个相邻像素之间的关系。原创 2022-05-09 10:09:19 · 1011 阅读 · 0 评论 -
Python共生矩阵对比奇异值分解 (SVD)和词嵌入
词嵌入词嵌入是转换成数字的文本。同一文本可能有不同的数字表示。许多机器学习算法和几乎所有深度学习架构都无法处理原始形式的字符串或纯文本。 它们需要数字作为输入来执行任何类型的工作,从广义上讲是分类、回归等。不同类型的词嵌入可以大致分为两类:基于频率的嵌入我们在这一类下遇到的向量一般有三类:计数向量、TF-IDF向量、具有固定上下文窗口的共生矩阵。基于预测的嵌入我们在这个类别下通常会遇到两种类型的向量:连续的词袋(CBOW)、Skip-Gram。本文,我们将关注具有固定上下文窗口的共生矩阵。原创 2022-05-02 16:13:02 · 1079 阅读 · 0 评论 -
Python数据处理 Excel 表
Excel 表特征结构对象简述:对应于Python处理方式方法简述:对应于Python处理方式属性简述:对应于Python处理方式常数和宏简述:对应 Python处理方式示例简述:使用 Python处理上述特征。自动化 Excel 工作表复制工作表并粘贴到工作簿简述:Python 将一个工作表从一个工作簿复制/组合到另一个现有工作簿。Python 使用下面的 Excel 索引属性(Excel 对象、方法和属性),创建一个更可持续的功能来组合来自多个工作簿的工作表。复制工作表的数据原创 2022-03-06 09:48:48 · 248 阅读 · 0 评论 -
Python探索性数据分析畅销书
探索性数据分析探索性数据分析(EDA)是一种分析和调查数据集以了解数据特征的方法。数据集查看数据集示例,有许多与 2009 年至 2019 年在销售的畅销书的标题和作者相关的信息。 除了标题和作者之外,数据中还有其他元素,例如用户评分、评论、价格、年份和书籍类型。PriceReviewsUser RatingCount550550550Mean13.111953.284.61Std10.8411731.130.22Min0373.3原创 2022-03-06 09:46:51 · 258 阅读 · 0 评论 -
使用 Plotly 和 ChartJS 图形库创建 Flask 仪表板
使用 Altair 和 Plotly,我只需要将绘图转储到 JSON 变量中,然后将其解析为我们的 .HTML 文件。 如果你不熟悉 Altair(Plotly 与 Seaborn 或 Matplotlib 非常相似),他们在这里有一个很好的演示存储库。Chart.js 怎么样? 就个人而言,我认为 Chart.js 非常简单(用于基本目的),即使您不了解 Javascript 或像我一样讨厌它。 此外,通过使用所有这些绘图库,我希望涵盖命令式可视化(Matplotlib、Seaborn、Plotly 等原创 2021-10-09 15:08:44 · 468 阅读 · 0 评论 -
SpaCy 和 Flask API 构建 Python 命名实体自动提取器
如果数据可以被结构化,那么当今可用的大量非结构化文本数据提供了丰富的信息来源。 命名实体识别 (NER)(也称为命名实体提取)是从半结构化和非结构化文本源构建知识的第一步。只有在 NER 之后,我们才能至少揭示信息包含的内容和内容。 因此,数据科学团队将能够在语料库中看到所有人员、公司、地点等名称的结构化表示,可作为进一步分析和调查的出发点。在 自然语言工具包(NLTK)和 SpaCy 构建 Python 命名实体识别 文章中,我们学习并实践了如何使用 NLTK 和 spaCy 构建命名实体识别器。 为原创 2021-09-26 17:52:27 · 414 阅读 · 0 评论 -
D3交互式可视化Python自然语言工具包命名实体识别
命名实体识别 (NER) 可能是信息提取的第一步,旨在将文本中的命名实体定位和分类为预定义的类别,例如人名、组织、位置、时间表达、数量、货币价值、百分比 等。 NER 在自然语言处理 (NLP) 的许多领域都有使用,它可以帮助回答许多现实世界的问题,例如:新闻文章中提到了哪些公司?投诉或评论中是否提到了特定产品?本文介绍如何使用 NLTK 和 SpaCy 构建命名实体识别器,识别原始文本中的人、组织或位置等事物的名称。内容自然语言工具包导入库信息提取介绍及 Python 脚本分块及其原创 2021-09-26 17:50:08 · 732 阅读 · 1 评论 -
Plotly 和 Dash 构建 Python 交互式仪表板类 App
特点借助 Plotly 的 Dash 框架,Python 程序员现在可以比以往更轻松地开发完整的数据应用程序和交互式仪表板Dash 应用程序可供非技术受众使用,这将使更广泛的人群可以进行数据分析概述了 Dash 生态系统、其主要包以及对构建和构建应用程序的不同部分至关重要的第三方包学习如何创建一个基本的 Dash 应用程序并为其添加不同的功能在应用程序中集成下拉菜单、复选框、滑块、日期选择器等控件,然后将它们链接到图表和其他输出根据可视化的数据,还将添加多种类型的图表,包括散点图、折线图、条形原创 2021-09-26 17:48:24 · 1976 阅读 · 0 评论 -
Wolfram Mathematica 动手实践
特点Mathematica 的介绍,目标是提供介绍 Mathematica 广度的实践经验,重点是易用性内容完整概述基础知识Mathematica 中的示例项目输入和输出文字处理和排版幻灯片演示Wolfram 语言基础使用单个程序创建交互式模型命令共享 Mathematica Notebooks寻求帮助扩展知识2D 和 3D 图形可视化数据样式和自定义图形使用图形原语创建图形和图表代数操作和方程求解微积分微分方程线性代数概率和统计导入和导出数据数原创 2021-09-14 17:40:04 · 702 阅读 · 0 评论 -
Matplotlib和第三方库实现数据可视化(更新 2023.11.24)
特点展示如何使用 Matplotlib 创建有吸引力的图形、图表和绘图快速了解第三方软件包、Seaborn、Pandas、Basemap 和 Geopandas,并了解如何将它们与 Matplotlib 结合使用在 GTK 3、Qt 5 和 wxWidgets 等第三方工具中嵌入和自定义您的绘图内容Matplotlib 简介Matplotlib 入门用绘图样式和类型装饰图形用绘图样式和类型装饰图形控制颜色线条和标记样式更多原生 Matplotlib 绘图类型文本和注释使用样原创 2021-09-04 17:59:34 · 392 阅读 · 0 评论 -
Excel构建决策分析模型
特点探讨使用 Excel 构建决策模型的价值和重要性,以及对 Excel 复杂性的非常详细和深入的解释使用 Excel 的图形功能来有效地呈现定量数据(比率和间隔)来通知和影响目标对象利用 Excel 的内置数据可视化和操作功能准备数据以供最终分析探索数据透视表和数据透视图报告的用途:内置的 Excel 功能允许快速轻松地进行交叉制表分析,有时也称为交叉表分析,用于确定一组数据中的两个或多个变量如何相互作用从样本中找到的网页偏好进行总体推断如何使用模型以及构建它们创建一个过程模型从单元格函原创 2021-09-04 17:55:15 · 1214 阅读 · 0 评论 -
Python自动化和数据分析Excel
特点无需丰富的编程知识即可使用 Python开始使用现代工具,包括 Jupyter 笔记本和 Visual Studio 代码使用 Pandas 获取、清理和分析数据并替换典型的 Excel 计算自动执行繁琐的任务,例如合并 Excel 工作簿和生成 Excel 报告使用 xlwings 构建使用 Python 作为计算引擎的交互式 Excel 工具将 Excel 连接到数据库和 CSV 文件,并使用 Python 代码从 Internet 获取数据使用 Python 作为单一工具来替换 V原创 2021-09-04 09:31:39 · 330 阅读 · 0 评论 -
Python和OpenCV视觉图像处理
特点OpenCV 3 是用于计算机视觉、机器学习和图像处理的原生跨平台库。 OpenCV 方便的高级 API 隐藏了非常强大的内部结构,旨在提高计算效率,可以利用多核和 GPU 处理学习如何通过操作像素来处理图像并使用直方图分析图像展示如何应用图像滤镜来增强图像内容并利用图像几何结构来中继图片场景的不同视图探索实现相机校准和执行多视图分析的技术。学习从图像重建 3D 场景,将低级像素信息转换为高级概念,以用于对象检测和识别等应用程序了解如何处理来自文件或相机的视频以及如何检测和跟踪移动物体熟原创 2021-09-03 16:47:09 · 243 阅读 · 0 评论 -
C++实践OpenCV视觉项目
特点通过实际示例和活动理解 OpenCV 概念和算法的指南了解如何使用复杂的计算机视觉和机器学习算法以及人脸检测从图像和视频中提取最大量的信息学习使用光流分析和背景减法来增强视频和图像了解新的和改进的深度学习模块的基础知识掌握文本分割和识别掌握常用的计算机视觉技术来从零开始构建 OpenCV 项目内容OpenCV 入门OpenCV 基础介绍学习图形用户界面深入研究直方图和滤镜自动光学检测、对象分割和检测学习对象分类检测人脸部分并叠加蒙版视频监控、背景建模和形态学操作学习原创 2021-09-03 16:45:47 · 1925 阅读 · 0 评论 -
实践Qt 5和OpenCV视觉项目
特点OpenCV 和 Qt 已被证明是开发跨平台计算机视觉应用程序的成功组合创建具有直观图形用户界面 (GUI) 和高性能功能的强大应用程序学习有关图像处理、面部和文本识别、对象检测和高性能计算的各种实际项目创建一个图像查看器应用程序,通过添加菜单、执行基于按键的操作以及应用其他功能从头开始构建用户界面使用 OpenCV 图像处理和修改功能来编辑具有过滤器和转换功能的图像探索复杂的运动分析和面部标志检测算法,使用它们来构建安全和面部检测应用程序学习在 OpenCV 和 GPU 中使用预训练的原创 2021-09-03 16:44:24 · 1041 阅读 · 0 评论 -
Anaconda_Python视觉项目TensorFlow_scikit-learn和OpenCV及其Raspberry Pi雾计算
特点设计和开发用于解决现实世界问题的生产级计算机视觉项目学习如何使用用于计算机视觉的尖端第三方库为主要操作系统设置 Anaconda 和 Python学习用于对图像进行分类、查找和识别人体姿势以及检测视频中的人脸的最先进技术使用 OpenCV、Dlib 和 TensorFlow 等强大的机器学习工具来构建激动人心的项目,例如对手写数字进行分类、检测面部特征等等还涵盖了一些高级项目,例如使用 Google 的 Tesseract 软件从真实世界图像中读取车牌文本,以及使用 TensorFlow 中原创 2021-08-30 13:53:34 · 193 阅读 · 0 评论 -
R 与甲骨文数据挖掘
特点使用 Oracle Data Miner 和 Oracle R Enterprise 自动化预测分析过程深入了解企业中常用的各种统计模型,以及如何使用各种 SQL、PLSQL、ORE、ODM 和本机 R 包将它们自动化以进行预测分析了解 ODM 工作流程中用于驾驶自动化的各种可用选项了解使用 PLSQL 集成 ODM 包、ORE 和本机 R 包以实现流程自动化的各种方法使用 Oracle Data Miner 和 Oracle R Enterprise 进行数据科学自动化首先介绍了业务分析,原创 2021-08-26 17:43:34 · 127 阅读 · 0 评论 -
Python 和 R 营销数据分析
特点学习实施数据科学技术,以了解营销活动成功和失败背后的驱动因素了解和预测客户行为,并制定更有针对性的个性化营销策略。执行从简单到高级的任务,从数据中提取隐藏的见解并使用它们做出明智的业务决策了解是什么推动了销售并增加了产品的客户参与度学习实施机器学习来预测哪些客户更有可能与产品互动并具有高生命周期价值展示如何使用机器学习技术来了解不同的客户群,并为每个客户推荐合适的产品。学习使用探索性分析深入了解消费者行为内容简介和环境设置数据科学与营销描述性分析与解释性分析关键绩效指标和可原创 2021-08-26 17:41:10 · 142 阅读 · 0 评论 -
Python 和 R 数据编程及分析
特点使用 Python 和 R 的数据科学是为没有分析或编程经验的普通读者编写的提供使用 Python 和 R 解决数据科学问题的分步说明和演练涵盖的主题包括数据准备、探索性数据分析、准备数据建模、决策树、模型评估、错误分类成本、朴素贝叶斯分类、神经网络、聚类、回归建模、降维和关联规则挖掘。包括随机森林和一般线性模型等新主题内容数据分析介绍Python 和 R 基础知识数据准备探索性数据分析准备对数据建模决策树模型评估朴素贝叶斯分类神经网络聚类回归建模降维广义线性模原创 2021-08-26 17:39:44 · 198 阅读 · 0 评论 -
数据整理中统计方法
特点从统计学领域中提取的技术和理论; 计算机科学,最重要的是机器学习、数据库、数据可视化等。它从简单的统计开始,然后转向数据科学算法中使用的统计方法。解释统计计算的 R 程序与逻辑学习各种数学概念,例如方差、标准差、概率、矩阵计算等将只学习在数据科学任务(例如数据清理、挖掘和分析)中实施统计所需的内容您将学习执行线性回归、正则化、模型评估、提升、SVM 和使用神经网络等任务所需的统计技术内容从数据开发人员过渡到数据科学家目标开发人员的数据清理方法数据挖掘和数据库开发人员数据库开原创 2021-08-26 17:37:11 · 168 阅读 · 0 评论 -
数据科学编程技能
特点使用数据科学技术,您可以将原始数据转化为可操作的见解,适用于从城市规划到精准医学的各个领域。 数据科学编程技能汇集了您入门所需的所有基础技能,即使您没有编程或数据科学经验。指导安装和配置解决专业级数据科学问题所需的工具,包括广泛使用的 R 语言和 Git 版本控制系统解释了如何将数据整理成易于使用、分析和可视化的形式,以便其他人可以看到您发现的模式将逐步掌握强大的 R 编程技术和故障排除技能,以便以新方式和更大规模地探测数据学会安装完整的数据科学环境,包括 R 和 RStudio学会高效管原创 2021-08-26 17:35:40 · 220 阅读 · 0 评论