自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (3)
  • 收藏
  • 关注

原创 linux上本地化部署deepseek

ollama官网:https://ollama.com/想要获取ollama的linux版本,请订阅专栏,联系本人。

2025-02-17 18:14:49 184

原创 字节云Bytehouse的使用

【代码】字节云Bytehouse的使用。

2024-03-03 15:20:03 484 1

原创 新能源汽车行业环境数据中的天气数据通过爬虫爬取的思路

新能源汽车行业环境数据中的天气数据通过爬虫爬取的思路

2024-03-03 14:59:47 562 1

原创 通过python实现新能源汽车车辆事故定责报告的实现

新能源汽车行业涉及大量数据,包括销售数据、充电设施数据、车辆性能数据等。利用Python进行数据分析和可视化可以帮助企业更好地理解市场趋势、用户需求和产品表现,为决策提供有力支持。Python可以编写自动化脚本,从不同数据源获取数据并生成报告,节省人力和时间成本。这对于需要定期生成报告的企业来说尤其重要,可以保持报告的及时性和准确性。新能源汽车行业处于快速发展阶段,技术和创新是竞争的关键。

2024-02-29 14:00:11 913

原创 Dataleap上如何使用Docker镜像

一,页面入口:二,如何设置镜像地址:

2024-02-28 20:27:18 263 1

原创 Dataleap中LasSpark的使用

DataLeap上如何提交Spark代码

2024-02-28 20:16:57 445 1

原创 火山引擎Dataleap

火山引擎Dataleap相关技术

2023-10-29 12:40:41 89 1

Anaconda相关工具安装

Anaconda相关工具安装,安装指南

2024-09-03

爬取国外金融网站上数据

python爬虫+国外金融网站数据爬取+js逆向

2024-08-29

十大降维算法总结汇总及其原理

1,主成分分析 2,线性判别分析 3,奇异值分解 4,独立成分分析 5,,非负矩阵分解 6.核PCA .................

2024-08-26

神经网络面试题以及相关注意事项

1,请简述一下神经网络的基本结构和工作原理 2,详细说说这些层是怎么工作的吗 3,如何训练这个网络 4,下这个过程中的梯度计算和权重更新 5,代码实现 6,深度学习和传统机器学习的主要区别 7,在实际应用中,两者有哪些不同的表现 8, 9。。。。。。。。。。

2024-08-26

贝叶斯算法,介绍贝叶斯的原理和应用

贝叶斯要解决的问题,贝叶斯公式,模型比较理论,垃圾邮件过滤实例

2024-08-25

小红书店铺入驻流程汇总

帮助你在小红书开店铺的全程指导

2024-08-25

服务器之间进行时间同步的脚本

服务器之间进行时间同步的脚本

2024-08-21

pandas技术手册,帮助掌握pandas最基本的操作

Pandas 是一个功能强大且灵活的 Python 库,专为数据分析和数据处理而设计。它提供了快速、简单、灵活和表达性强的数据结构,特别是 Series(系列)和 DataFrame(数据框),使用户能够轻松地进行数据操作、数据清洗、数据转换和数据分析等任务。 要掌握 Pandas 最基本的操作,首先需要了解以下几个核心概念: Series:Series 是一维标记数组,类似于带有标签的 NumPy 数组。你可以将其视为由索引和相应的值组成的字典。 DataFrame:DataFrame 是二维标记数据结构,类似于电子表格或 SQL 表。它由行和列组成,每列可以是不同的数据类型。 数据索引与选择:Pandas 提供了多种灵活的方法来选择、过滤和操作数据,包括基于标签的索引、位置索引和条件索引等。 数据清洗与处理:Pandas 允许你轻松地处理缺失值、重复值、异常值等数据质量问题,并支持数据类型转换、合并、拆分、聚合等操作。 数据分析与可视化:Pandas 集成了丰富的数据分析和统计函数,同时也与 Matplotlib、Seaborn 等库无缝对接,方便用户进行数据可视化。

2024-03-16

Azkaban源码,可以用来进行编译

Azkaban是一个用Java编写的开源工作流管理系统,旨在简化大数据处理过程中的任务调度和工作流程管理。它提供了一个直观的用户界面,允许用户轻松地定义、调度和监视工作流程。Azkaban的源代码包含了系统的各个组件,包括前端界面、后端服务以及与数据库交互的模块等。用户可以通过编译源代码来构建自定义的Azkaban部署,以满足其特定需求。 编译Azkaban源代码需要一些基本的开发工具,如Java Development Kit (JDK)、Apache Maven等。一旦配置好开发环境,用户可以使用Maven构建工具编译源代码。编译过程将会生成可执行的Jar文件和其他必要的依赖项,这些文件可以用于部署和运行Azkaban系统。 通过编译Azkaban源代码,用户可以实现对系统的定制和扩展,以满足特定的业务需求或性能优化要求。同时,编译源代码还有助于用户深入理解系统的工作原理和内部机制,从而更好地进行系统调优和故障排除。

2024-03-16

数据产品经理学习手册:产品工具、用户画像、数据分析

活动专题数据产品建设 全链路市场投放的数据产品策略 挖掘客户意见,驱动经营改善 比你更了解你,浅谈用户画像 用户画像场景与技术实现方案 网易数据部用户画像实践 网易严选画像建设实践 数据驱动消费者精细化运营产品和生态 百信银行用户-产品-企业经营多维分析实践 如何搭建数据指标体系 如何建设好的数据指标体系 数据安全工具建设经验分享 如何提升数据化管理效率 网易数据治理工具-资产 360 产品实践 数据中台的底层逻辑 数据产品+数据中台双引擎模式实践 “转变”,贝壳找房数据平台演变之路 专业数据准备工具的介绍和应用

2024-03-05

ngix安装部署脚本,实现自动化安装nginx

通过该脚本可以直接安装nginx

2022-04-24

kylin 3.0.2下载

Kylin是一种MOLAP的数据分析引擎。最早由eBay中国研发中心贡献给Apache基金。 Kylin特点: 数据源和模型:主要支持Hive、Kafka 构建引擎:早期支持MapReduce计算引擎,新版本支持Spark、Flink计算引擎。除了全量构建外,基于时间的分区特性,支持增量构建。 存储引擎:构建好的Cube以Key-Value形式存储在HBase中,通过优化Rowkey加速查询。每一种维度的排列组合计算结果被保存为一个物化视图,叫做Cuboid. 优化算法:Cube本身是空间换时间,也会根据算法,剪枝优化掉一些多余的Cuboid,需求平衡。 访问接口:支持标准SQL接口,可以对接Zeppelin、Tableau等BI工具。SQL通过查询引擎,可以被路由到对应的Cuboid上。

2022-04-16

数据质量griffin

数据质量组件griffin下载

2022-04-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除