canglong88-优快云博客

原创 linux上本地化部署deepseek

ollama官网：https://ollama.com/想要获取ollama的linux版本，请订阅专栏，联系本人。

2025-02-17 18:14:49 356

原创字节云Bytehouse的使用

【代码】字节云Bytehouse的使用。

2024-03-03 15:20:03 696 1

原创新能源汽车行业环境数据中的天气数据通过爬虫爬取的思路

新能源汽车行业环境数据中的天气数据通过爬虫爬取的思路

2024-03-03 14:59:47 622 1

原创通过python实现新能源汽车车辆事故定责报告的实现

新能源汽车行业涉及大量数据，包括销售数据、充电设施数据、车辆性能数据等。利用Python进行数据分析和可视化可以帮助企业更好地理解市场趋势、用户需求和产品表现，为决策提供有力支持。Python可以编写自动化脚本，从不同数据源获取数据并生成报告，节省人力和时间成本。这对于需要定期生成报告的企业来说尤其重要，可以保持报告的及时性和准确性。新能源汽车行业处于快速发展阶段，技术和创新是竞争的关键。

2024-02-29 14:00:11 1018

原创 Dataleap上如何使用Docker镜像

一，页面入口：二，如何设置镜像地址：

2024-02-28 20:27:18 302 1

原创 Dataleap中LasSpark的使用

DataLeap上如何提交Spark代码

2024-02-28 20:16:57 514 1

原创火山引擎Dataleap

火山引擎Dataleap相关技术

2023-10-29 12:40:41 125 1

神经网络面试题以及相关注意事项

1，请简述一下神经网络的基本结构和工作原理 2，详细说说这些层是怎么工作的吗 3，如何训练这个网络 4，下这个过程中的梯度计算和权重更新 5，代码实现 6，深度学习和传统机器学习的主要区别 7，在实际应用中，两者有哪些不同的表现 8， 9。。。。。。。。。。

2024-08-26

十大降维算法总结汇总及其原理

1，主成分分析 2，线性判别分析 3，奇异值分解 4，独立成分分析 5，，非负矩阵分解 6.核PCA .................

2024-08-26

贝叶斯算法，介绍贝叶斯的原理和应用

贝叶斯要解决的问题，贝叶斯公式，模型比较理论，垃圾邮件过滤实例

2024-08-25

Azkaban是一个用Java编写的开源工作流管理系统，旨在简化大数据处理过程中的任务调度和工作流程管理。它提供了一个直观的用户界面，允许用户轻松地定义、调度和监视工作流程。Azkaban的源代码包含了系统的各个组件，包括前端界面、后端服务以及与数据库交互的模块等。用户可以通过编译源代码来构建自定义的Azkaban部署，以满足其特定需求。编译Azkaban源代码需要一些基本的开发工具，如Java Development Kit (JDK)、Apache Maven等。一旦配置好开发环境，用户可以使用Maven构建工具编译源代码。编译过程将会生成可执行的Jar文件和其他必要的依赖项，这些文件可以用于部署和运行Azkaban系统。通过编译Azkaban源代码，用户可以实现对系统的定制和扩展，以满足特定的业务需求或性能优化要求。同时，编译源代码还有助于用户深入理解系统的工作原理和内部机制，从而更好地进行系统调优和故障排除。

2024-03-16

pandas技术手册，帮助掌握pandas最基本的操作

Pandas 是一个功能强大且灵活的 Python 库，专为数据分析和数据处理而设计。它提供了快速、简单、灵活和表达性强的数据结构，特别是 Series（系列）和 DataFrame（数据框），使用户能够轻松地进行数据操作、数据清洗、数据转换和数据分析等任务。要掌握 Pandas 最基本的操作，首先需要了解以下几个核心概念： Series：Series 是一维标记数组，类似于带有标签的 NumPy 数组。你可以将其视为由索引和相应的值组成的字典。 DataFrame：DataFrame 是二维标记数据结构，类似于电子表格或 SQL 表。它由行和列组成，每列可以是不同的数据类型。数据索引与选择：Pandas 提供了多种灵活的方法来选择、过滤和操作数据，包括基于标签的索引、位置索引和条件索引等。数据清洗与处理：Pandas 允许你轻松地处理缺失值、重复值、异常值等数据质量问题，并支持数据类型转换、合并、拆分、聚合等操作。数据分析与可视化：Pandas 集成了丰富的数据分析和统计函数，同时也与 Matplotlib、Seaborn 等库无缝对接，方便用户进行数据可视化。

2024-03-16

数据产品经理学习手册：产品工具、用户画像、数据分析

活动专题数据产品建设全链路市场投放的数据产品策略挖掘客户意见，驱动经营改善比你更了解你，浅谈用户画像用户画像场景与技术实现方案网易数据部用户画像实践网易严选画像建设实践数据驱动消费者精细化运营产品和生态百信银行用户-产品-企业经营多维分析实践如何搭建数据指标体系如何建设好的数据指标体系数据安全工具建设经验分享如何提升数据化管理效率网易数据治理工具-资产 360 产品实践数据中台的底层逻辑数据产品+数据中台双引擎模式实践 “转变”，贝壳找房数据平台演变之路专业数据准备工具的介绍和应用

2024-03-05

ngix安装部署脚本，实现自动化安装nginx

通过该脚本可以直接安装nginx

2022-04-24

kylin 3.0.2下载

Kylin是一种MOLAP的数据分析引擎。最早由eBay中国研发中心贡献给Apache基金。 Kylin特点：数据源和模型：主要支持Hive、Kafka 构建引擎：早期支持MapReduce计算引擎，新版本支持Spark、Flink计算引擎。除了全量构建外，基于时间的分区特性，支持增量构建。存储引擎：构建好的Cube以Key-Value形式存储在HBase中，通过优化Rowkey加速查询。每一种维度的排列组合计算结果被保存为一个物化视图，叫做Cuboid. 优化算法:Cube本身是空间换时间，也会根据算法，剪枝优化掉一些多余的Cuboid，需求平衡。访问接口：支持标准SQL接口，可以对接Zeppelin、Tableau等BI工具。SQL通过查询引擎，可以被路由到对应的Cuboid上。

2022-04-16

数据质量griffin

数据质量组件griffin下载

2022-04-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

canglong88的博客