
数据分析
文章平均质量分 91
无水先生
擅长数学,能熟练应用泛函分析、统计学、随机过程、逼近论、微分几何、非欧几何(双曲、共形)等数学理论,有数学建模能力。从事图像处理二十年以上,从事人工智能行业10年以上;在船舶、通信、铁路、教育等行业开发软件产品。
展开
-
数据科学和机器学习中的多重共线性:隐藏的威胁及其解决方法
在数据科学和机器学习中,理解变量之间的关系对于构建准确且可解释的模型至关重要。多重共线性,即两个或多个预测变量之间的高相关性,如果不加以控制,会对模型的准确性和可解释性产生负面影响。在本文中,我们将探讨什么是多重共线性、它为什么重要、如何检测它,最重要的是,如何用现实世界的例子和代码来解决它。让我们开始吧!原创 2024-12-07 12:32:49 · 2014 阅读 · 0 评论 -
数据科学项目工作流程结构化初学者指南
除了致力于发现和探索之外,要想在数据科学项目中取得成功,您必须了解数据科学工作流程并对其进行优化,以确保结果可靠,并且项目易于遵循、维护和修改。 而实现这一点的最佳和最快的方法是使用模板来构建您的项目。原创 2024-07-28 14:10:50 · 2491 阅读 · 0 评论 -
辛普森悖论:当数据讲述两个不同的故事时!
你有没有被统计数据愚弄过?辛普森悖论表明,分析总体数据可能会掩盖重要趋势。我们可以通过分解信息来发现逆转或消除关系的隐藏因素。这份简短的指南将使您避免被汇总数据误导,并确保您看到全貌。原创 2024-07-25 14:22:01 · 1968 阅读 · 0 评论 -
贝叶斯后验之旅总结
这篇博文深入探讨了贝叶斯统计的核心概念,包括后验分布、点估计和损失函数。我们将探讨如何使用网格近似、百分位区间和最高后验密度区间 (HPDI) 来总结后验分布,并讨论选择正确的损失函数以做出最佳决策的重要性。原创 2024-04-23 11:42:28 · 3090 阅读 · 0 评论 -
使用这种简单的 Python 技术使您的代码更具可扩展性(改进中。。)
如果您已经熟悉传统的 Python 类,乍一看,ABC 似乎是一个陌生的概念。本质上,它们允许您定义一组必须由子类实现的方法,从而在代码中强制执行特定的结构。Python 中的抽象基类 (ABC) 提供了一种定义接口和抽象方法的结构化方法,为子类提供了可遵循的蓝图。原创 2024-04-23 11:22:42 · 1843 阅读 · 0 评论 -
新的相关系数
如果有人告诉你,有一种新的方法来衡量两个变量之间的关系,就像相关性一样,只是可能更好。更具体地说,在 2020 年发表了一篇题为“新的相关系数”[1]的论文,引入了一种新的度量,当且仅当两个变量是独立的时,该度量等于 0,当且仅当一个变量是另一个变量的函数时,才等于 1,最后具有一些很好的理论属性,允许进行假设检验,同时实际上不对数据做出任何假设。在我们开始之前,让我们简要地谈谈更传统的相关性度量是如何工作的。原创 2024-04-11 10:19:21 · 2624 阅读 · 0 评论 -
使用 LSTM 和 TensorFlow 中的注意力机制进行高级股票形态预测:Apple Inc. (AAPL) 数据分步指南
在瞬息万变的金融市场中,准确的预测就像圣杯一样。当我们寻求更复杂的技术来解释市场趋势时,机器学习成为希望的灯塔。在各种机器学习模型中,长短期记忆(LSTM)网络受到了极大的关注。当与注意力机制相结合时,这些模型变得更加强大,尤其是在分析股票价格等时间序列数据时。本文深入探讨了LSTM网络与注意力机制相结合的有趣世界,重点利用雅虎财经(yfinance)的数据预测苹果公司(AAPL)股价接下来的四根蜡烛的模式。原创 2024-04-10 13:49:34 · 3443 阅读 · 0 评论 -
使用注意力机制的 LSTM 彻底改变时间序列预测
在时间序列预测领域,对更准确、更高效的模型的追求始终存在。深度学习的应用为该领域的重大进步铺平了道路,其中,长短期记忆 (LSTM) 网络与注意力机制的集成尤其具有革命性。本文深入探讨了一个实际案例研究:使用这种复杂的架构预测 Apple Inc. (AAPL) 的股价。原创 2024-04-05 12:29:55 · 5347 阅读 · 2 评论 -
数据挖掘中的PCA和KMeans:Airbnb房源案例研究
主成分分析 (PCA) 是一种统计技术,可简化高维数据的复杂性,同时保留趋势和模式。它通过将数据转换为较少的维度来实现此目的,这些维度充当特征的摘要,称为主成分 (PC)。这些分量彼此正交,确保它们表示数据中的独立方差。原创 2024-04-05 12:45:42 · 3975 阅读 · 1 评论 -
使用 Python 的 LSTM 进行股市预测
在本教程中,您将了解如何使用称为长短期记忆的时间序列模型。 LSTM 模型非常强大,尤其是在设计上保留长期记忆,正如您稍后将看到的。您将在本教程中解决以下主题:了解为什么您需要能够预测股价走势;下载数据 - 您将使用从雅虎财经收集的股票市场数据;分割训练测试数据并执行一些数据标准化;回顾并应用一些可用于一步预测的平均技术;激发并简要讨论LSTM 模型,因为它可以提前预测不止一步;利用当前数据预测和可视化未来股市原创 2024-04-08 09:26:51 · 4512 阅读 · 0 评论 -
使用Python的布朗运动过程和金融资产
在金融领域,布朗运动用于模拟股票价格的随机波动。这是因为股票价格的变动受到许多随机且不可预测的因素的影响,例如新闻事件、市场情绪和利率变化。通过将股票价格建模为布朗运动过程,分析师可以使用随机微积分等数学工具来预测未来股票价格,并估计与不同投资策略相关的风险。原创 2024-03-31 15:19:16 · 2973 阅读 · 0 评论 -
探索地理空间数据抽象库 (GDAL):地理空间数据处理综合指南
地理空间数据抽象库 (GDAL) 是地理空间数据处理社区的基石,为读取和写入各种格式的栅格和矢量数据提供了统一的抽象。作为一个开源库,它已成为地理学家、GIS 专业人员和环境科学家工作流程中不可或缺的一部分,有助于空间数据的分析、操作和可视化。本文探讨了 GDAL 在地理空间数据社区中的历史、架构、功能和影响。原创 2024-03-06 13:48:49 · 3065 阅读 · 0 评论