自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(123)
  • 资源 (1)
  • 收藏
  • 关注

原创 RAGFlow部署与使用介绍-深度文档理解和检索增强生成

RAGFlow作为新一代智能文档处理平台,深度融合检索增强生成(RAG)技术与自动化工作流引擎,为企业级知识管理提供全栈解决方案。通过结合多模态解析、语义理解与智能推理能力,重塑了非结构化数据处理范式。传统的生成模型在回答复杂问题时常常依赖于预训练数据的广度与深度,而检索增强生成(Retrieval-Augmented Generation,简称RAG)则有效结合了检索与生成的优势,为各类应用场景提供了更为灵活、高效的解决方案。能够针对性的进行解答。

2025-04-03 17:36:11 639

原创 Ollama+open-webui搭建私有本地大模型详细教程

​ Ollama 是一个轻量级的 AI 模型运行时,专注于简化 AI 模型的部署和使用。它支持多种预训练模型(如 Llama、Vicuna、Dolly 等),并且可以在本地运行,无需复杂的基础设施。Ollama 的设计理念是让 AI 模型的使用变得像运行普通程序一样简单,同时确保数据和隐私的安全性。​ Ollama 正在不断优化和扩展,未来会支持更多模型类型、更高效的性能优化,以及更友好的用户界面。Ollama的目标是成为 AI 模型部署领域的标准工具,让更多人能够轻松使用

2025-04-01 17:47:39 771

原创 AI智能体OpenManus使用介绍

​ OpenManus是MetaGPT团队在3小时内复刻Manus核心功能的开源AI智能体项目。它采用模块化Agent系统,包含主代理、规划代理和工具调用代理等角色,可自由组合功能模块创建定制AI助手。OpenManus具有实时反馈机制,能可视化展示思考链、任务进度和文件生成过程。它配备强大的工具链,如浏览器自动化、Python代码执行器、网络搜索工具和文件处理系统,可处理复杂任务。OpenManus全免费且支持本地部署,无需邀请码,用户可外挂任意大模型API,灵活配置。

2025-03-13 15:27:24 1756

原创 Dify部署与使用介绍-生成式 AI 应用创新引擎

Dify融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。由于 Dify 内置了构建 LLM 应用所需的关键技术栈,包括对数百个模型的支持、直观的 Prompt 编排界面、高质量的 RAG 引擎、稳健的 Agent 框架、灵活的流程编排,并同时提供了一套易用的界面和 API。这为开发者节省了许多重复造轮子的时间,使其可以专注在创新和业务需求上

2025-03-05 17:06:16 2345

原创 VSCode集成deepseek使用介绍(Visual Studio Code)

随着AI辅助编程工具的快速发展,VSCode作为一款轻量级、高度可扩展的代码编辑器,已成为开发者首选的工具之一。DeepSeek作为AI模型,结合Roo Code插件,能够为开发者提供智能代码生成、调试辅助、需求分析等功能,极大提升了开发效率。这种组合顺应了AI与开发工具深度融合的趋势,尤其适合快速原型开发和小型项目

2025-02-20 11:35:14 1818

原创 深度学习中损失函数(loss function)介绍

​ 在深度学习的宏伟城堡中,损失函数扮演着国王的角色,它决定了模型训练的方向和目标。损失函数,也被称为代价函数,是衡量模型预测与实际结果之间差异的函数。在深度学习的训练过程中,我们的目标就是最小化这个损失函数,就像是在一场游戏中,我们的目标是获得尽可能低的失误和丢分。​ 损失函数的选择对于模型的训练至关重要。不同的问题可能需要不同的损失函数。比如在图像识别中,我们可能需要一个能够处理大量类别的损失函数,这时候交叉熵损失就是一个很好的选择。

2024-12-13 10:23:48 1143

原创 Wekan看板安装部署与使用介绍

​ Wekan 是一个开源的看板式项目管理工具,它的配置相对简单,因为大多数功能都是开箱即用的。它允许用户以卡片的形式组织和跟踪任务,非常适合敏捷开发和日常任务管理。Wekan 的核心功能包括看板、列表和卡片,用户可以在看板上创建多个列表,每个列表代表任务的不同状态,如待办、进行中和已完成。每张卡片则代表一个具体的任务,可以包含详细的描述、截止日期、成员分配和评论。​ Wekan 支持实时协作,团队成员可以同时在线编辑和讨论任务,确保信息的即时更新和共享。

2024-11-20 11:13:58 2486

原创 OpenProject安装部署与使用介绍

​ OpenProject是一个功能全面的开源项目管理软件,它提供了一套集成的工具来支持项目规划、协作和监控。它的核心功能包括任务和问题跟踪、时间管理、新闻和文档管理,以及集成版本控制系统。OpenProject支持敏捷和瀑布项目管理方法,允许团队使用看板和甘特图来组织和监控项目进度。​ 该软件以其灵活性和可定制性而闻名,用户可以根据项目需求调整工作流程和界面。OpenProject还提供了丰富的报表功能,帮助团队成员和管理层洞察项目状态和性能。

2024-11-19 17:36:35 5765 1

原创 PyTorch使用教程-深度学习框架

PyTorch是一个广泛使用的开源机器学习框架,特别适合深度学习的应用。它以其动态计算图而闻名,允许在运行时修改模型,使得实验和调试更加灵活。PyTorch提供了强大的GPU加速功能,支持自动微分,简化了梯度计算和模型训练。此外,PyTorch拥有直观的API,与Python深度集成,使得它易于学习和使用。它还拥有一个庞大的社区和丰富的生态系统,包括预训练模型和专用库,适用于计算机视觉、自然语言处理等多种任务。PyTorch的灵活性和强大的功能使其成为研究人员和开发者的首选工具之一。

2024-11-18 17:41:44 1572

原创 贪心算法介绍(Greedy Algorithm)

贪心算法是一种在每一步选择中都采取当前最优解的策略,以期望构建出全局最优解的算法。它的核心思想是“贪心选择性质”,即在每个决策点上,基于当前信息选择最有利的选项,从而希望通过这些局部最优决策累积成全局最优解。贪心算法的实现通常简单直接,易于编码,且执行效率高,这使得它在需要快速响应的大规模问题中非常有用。贪心算法的关键在于其贪心策略的选择,这通常涉及到对问题结构的深入理解。在某些问题中,贪心算法能够保证找到最优解,特别是当问题具有最优子结构和贪心选择性质时。

2024-08-14 17:08:23 1830

原创 使用Ckman部署ClickHouse集群介绍

ClickHouse Manager是一个为ClickHouse数据库量身定制的管理工具,它是由擎创科技数据库团队主导研发的一款用来管理和监控ClickHouse集群的可视化运维工具。目前该工具已在github上开源,开源地址为:github.com/housepower/ckman。它通过提供一个直观的图形用户界面(GUI),极大地简化了数据库的管理和操作。这款工具支持多种功能,包括但不限于SQL查询编辑器、数据可视化、实时监控、性能分析、备份与恢复等。

2024-07-03 16:10:07 1271

原创 大模型之-Seq2Seq介绍

Seq2Seq(Sequence to Sequence)模型在文本摘要任务中的应用与其在机器翻译中的应用有很多相似之处。文本摘要的目标是从一个长文本中生成一个简短的、语义上等价的摘要。与机器翻译类似,Seq2Seq模型通过编码器和解码器的组合来实现这个任务。编码器(Encoder)编码器将输入的长文本编码成一个固定长度的上下文向量(Context Vector)。通常使用递归神经网络(RNN)、长短期记忆网络(LSTM)或门控循环单元(GRU)来处理输入文本。

2024-06-20 10:46:54 1683

原创 机器学习的分类

机器学习是人工智能的一个分支,它使计算机系统能够从数据中学习并做出决策或预测。机器学习(Machine Learning)是一种基于数据驱动的方法,旨在通过自动化的统计模型和算法从数据中学习和提取模式,以进行预测、分类和决策。其核心思想是通过训练数据构建模型,使其在面对新数据时能够准确进行预测和分类。

2024-06-13 18:32:50 6665

原创 Hudi之数据读写探究

操作类型I/O开销CPU开销写入吞吐量磁盘空间利用内存消耗并发处理能力网络开销INSERT-写入最低几乎无需计算吞吐量较高低低一般低BULK_INSERT-批量写需要更多I/O有一些计算需求吞吐量最高较低较低高低UPSERT-更新或写入最高需要较高的计算资源吞吐量最低高较高低高。

2024-05-29 16:40:09 1864

原创 Hudi之TimeLine(时间轴)原理概念

​ 在Apache Hudi中,TimeLine是指,用于跟踪数据湖Hudi中数据的变化历史。TimeLine是Hudi的核心概念之一,用于管理和维护数据湖Hudi中各个数据集的变化历史。具体来说,TimeLine由一系列时间戳(timestamp)和相关的操作事件(如写入、更新、删除)组成,这些事件按时间顺序排列。每个数据集都有自己的TimeLine,用于记录该数据集的变化历史。​ 通过TimeLine,用户可以追溯数据集的变化历史,了解数据是如何随着时间变化的。

2024-05-20 18:01:22 1574

原创 Nextcloud私有云盘-重新定义云存储体验

​ Nextcloud是一个开源的云存储和协作平台,旨在为个人用户、企业和团队提供安全、隐私保护的数据存储和共享解决方案。它允许您在不同设备之间同步、共享文件,提供了强大的协作工具和应用生态系统。:通过Nextcloud,您可以轻松地在不同设备之间同步和共享文件。无论是照片、视频、文档还是其他文件类型,都可以方便地访问和共享。:Nextcloud致力于保护您的数据安全和隐私。它提供端到端加密功能,确保您的数据在传输和存储过程中始终受到保护。

2024-05-10 17:52:20 6653 1

原创 Python-FastAPI框架使用介绍

FastAPI 关键特性1. **快速高效**:基于 Starlette 和 Pydantic 构建,具有高性能和低延迟的特点,支持异步处理请求,利用 Python 的协程提高并发性能。2. **简单易用**:使用标准的 Python 类型注解来定义 API 的输入和输出参数,无需编写大量的文档和验证代码。3. **自动生成文档**:通过访问 `/docs` 路径可以查看自动生成的交互式 API 文档,包含了每个端点的详细说明、请求和响应的模型结构以及示例请求和响应。4. **数据验证**:利用

2024-04-16 18:28:20 13839 3

原创 python多方式操作elasticsearch介绍

​ Elasticsearch DSL(Domain Specific Language 领域特定语言)是 Elasticsearch 官方提供的一个 Python 客户端库,它允许开发者以一种更加 Pythonic 和直观的方式与 Elasticsearch 进行交互和查询。DSL 不是一种编程语言,而是一种专门针对某一领域(如 Elasticsearch 查询语言)设计的语言。在 Elasticsearch 中,DSL 用于构建复杂的搜索查询、聚合操作和过滤条件。

2024-03-30 16:43:20 1696

原创 Python库-FuzzyWuzzy使用介绍

FuzzyWuzzy是一个 Python 库,旨在提供模糊字符串匹配的功能。它能够比较两个字符串之间的相似度,即使它们在拼写或格式上略有不同。通过使用各种算法和方法,如基于字符、基于单词的匹配,以及部分匹配和排序匹配等技术,FuzzyWuzzy 能够有效地处理文本数据中的拼写错误、近义词和重复项。这使得它在数据清洗、搜索功能、自动完成和信息抽取等场景中非常实用。FuzzyWuzzy 提供了简单易用的 API,使得开发者可以轻松地将其集成到自己的项目中,并快速实现字符串匹配和相似度比较的功能。

2024-03-28 19:34:00 108828

原创 Presto简介、部署、原理和使用介绍

​ Presto是由Facebook开发的一款开源的分布式SQL查询引擎,最初于2012年发布,并在2013年成为Apache项目的一部分;Presto 作为现在在企业中流行使用的即席查询框架,已经在不同的领域得到了越来越多的应用。Presto官方网站:https://prestosql.io/​ Presto被广泛用作即席查询引擎,用户可以使用标准的SQL语句向Presto提交查询,并且能够在几秒钟或更短的时间内获取结果。

2024-02-28 17:48:47 9017

原创 IDC机房交换机核心技术与应用指南

​ 交换机(Switch)是一种用于电脑网络的设备,它连接多个设备(如计算机、打印机、服务器等)到同一网络内,允许这些设备互相通信。交换机工作在OSI(开放式系统互联)模型的第二层,即数据链路层,这使得它能够使用物理设备的MAC(媒体访问控制)地址来传输数据。​ 在基本层面上,交换机的功能是接收来自连接设备的数据包,并决定如何有效地将这些数据包转发到目的地。这通常是通过检查每个数据包的MAC地址来实现的。

2024-01-26 18:06:16 2566

原创 ZooKeeper中bin目录4个脚本执行文件详解

ZooKeeper中bin目录中有如下4个可执行脚本:这些脚本是 ZooKeeper 的一部分,用于管理和操作 ZooKeeper 实例。zkCleanup.sh:zkCli.sh:zkEnv.sh:zkServer.sh:下文将逐个详细介绍4个 ZooKeeper 相关脚本的使用、参数、场景和注意事项连接到 ZooKeeper:创建节点:读取节点数据:参数介绍: 接受连接参数,如 ZooKeeper 服务器地址。场景:用于与 ZooKeeper 交互、创建、读取、更新、删除节点等。 脚本是 ZooKee

2023-12-12 17:36:55 1981

原创 入侵防御系统(IPS)网络安全设备介绍

​ IPS设备是网络安全的关键组成部分,用于检测和防止恶意攻击和入侵尝试。它们通过流量分析、签名检测和异常检测来实现这一目标,并可以采取各种防御措施。IPS设备还与其他安全设备集成,以提供全面的安全性和监控。然而,IPS设备也存在一些挑战和限制,需要不断演进以适应不断变化的网络威胁。在未来,IPS设备将继续发展,采用新技术来提高安全性和效率,以应对不断增加的网络威胁。

2023-10-07 17:34:44 19309 2

原创 图数据库Nebula_Graph界面工具安装与使用

NebulaGraph Studio是一款可以通过 Web 访问的开源图数据库可视化工具,是 Nebula Graph 官方提供的图形用户界面(GUI)工具,它提供了更直观的方式来管理和查询图数据库。Nebula Studio 支持可视化的模式管理、数据查询、图可视化、数据导入导出等功能,使用户能够更轻松地操作数据库。 Nebula Graph Dashboard 是 Nebula Graph 数据库的可视化管理工具,它提供了一个直观的图形用户界面(GUI)来监控、管理和操作

2023-09-21 15:11:47 2651

原创 Nebula Graph图数据库教程介绍

Space(空间)在 Nebula Graph 中,Space 可以类比为数据库。就像关系型数据库中可以有多个数据库,Nebula Graph 中可以有多个 Space。每个 Space 可以看作是一个独立的数据存储区域,用于存储不同类型的数据。比喻Space 就像是一个大仓库,您可以在仓库中存放不同类型的货物,每个货物都有自己的存储区域。Tag(标签)和 Vertex(顶点)在 Nebula Graph 中,Tag 类似于表,而 Vertex 类似于表中的行。Tag 定义了一组属性

2023-09-14 11:56:10 4219

原创 SQL中的CASE WHEN语句:从基础到高级应用指南

SQL中的CASE WHEN语句是一种灵活的条件逻辑工具,用于查询中根据条件生成不同结果。它处理多种条件,可嵌套使用,适用于简单判断到复杂业务规则。无论数据转换还是业务分析,CASE WHEN都是不可或缺的工具。

2023-08-30 18:01:27 14826 2

原创 Python实现企业微信群告警

​ 企业微信群机器人是一个强大的工具,用于实现监控告警和信息通知。机器人发送不同类型的消息通知,我们合理利用企业微信群机器人,可以提升团队的响应速度和业务稳定性,在实际工作中提升效率和效果。

2023-08-24 16:50:57 2251

原创 (WAF)Web应用程序防火墙介绍

​ Web应用程序防火墙(WAF)在保护Web应用程序免受各种网络攻击方面发挥着关键作用。它通过监控、检测和防护恶意请求,提供了一道坚实的防线,保护用户数据、隐私和业务连续性。然而,要充分发挥其作用,WAF需要与其他安全措施结合使用,同时也需要管理员的定期维护和优化。通过综合的安全策略,可以实现强大的Web应用程序安全。​ Web应用程序防火墙(WAF)是保护Web应用程序免受各种网络攻击的关键工具。

2023-08-23 17:40:14 4022

原创 MySQL实现数据炸裂拆分(类似Hive的explode函数的拆分数组功能)

在Hive中,"explode"函数用于将数组类型的列拆分为多行,以便对数组中的每个元素进行处理。然而,在MySQL中,并没有直接的类似功能。但是,我们可以使用一些技巧来模拟这个功能,实现在MySQL中拆分数组并进行查询的操作。本文将介绍如何在MySQL中实现类似Hive的"explode"函数的拆分数组功能。​ 场景模拟:假设我们有一个名为`wow_info`的表,其中包含一个包含竖线分隔的数字列表的列`tianfu`,我们希望将每一种天赋拆分为多行进行查询。

2023-07-07 10:48:23 6575 1

原创 阿里开业项目chat2DB-人工智能SQL分析介绍

下载安装包Chat2DB Setup 2.0.1.exe后,直接安装即可,界面非常简洁清晰配置完毕后,使用方式将改变成只需要描写需求即可chat2DB除可以AI智能SQL分析,还可以协助自动生成报表例如,wow_info表中,字段:zhuangbei,代表装备类型,有布甲、皮甲、板甲等等现在想去分析一下每种类型的占比情况在Charts栏中可以选择不同的指标,实现不同维度的数据。

2023-07-05 15:57:25 4174 1

原创 Flink读写Doris操作介绍

​ Flink Doris Connector 可以支持通过 Flink 操作(读取、插入、修改、删除) Doris 中存储的数据。可以将 Doris 表映射为 DataStream 或者 Table。

2023-05-15 10:55:17 10202 4

原创 Doris的分区Partition和分桶Bucket介绍

Range分区是一种基于分区键对表进行分区的方式,分区键指的是表中的某一列,而Range则是指这个列的值的范围。使用Range分区,可以将数据按照列的值的范围进行划分,将数据分散到不同的节点上,以实现分布式存储和查询分区列通常为时间列,以方便的管理新旧数据Partition 支持通过仅指定上界,系统会将前一个分区的上界作为该分区的下界,生成一个左闭右开的区间。也支持通过指定上下界,生成一个左闭右开的区间当不使用Partition建表时,系统会自动生成一个和表名同名的,全值范围的 Partition。

2023-05-12 14:23:30 6004 1

原创 Doris简介、部署、功能介绍以及架构设计

​ Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。

2023-05-10 17:34:44 49363

原创 DataX简介、部署、原理和使用介绍

​ DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS, databend 等各种异构数据源之间高效的数据同步功能。

2023-02-17 11:02:58 22533 1

原创 Maxwell简介、部署、原理和使用介绍

Maxwell是由美国Zendesk公司开源,使用Java编写的MySQL变更数据抓取软件。他会实时监控Mysql数据库的数据变更操作(包括insert、update、delete),并将变更数据以JSON的格式发送给Kafka、Kinesis、RabbitMQ、Redis、Google CloudPub/Sub、文件或其它平台等等Maxwell项目官方网站:https://maxwells-daemon.io/

2023-02-15 17:22:42 6353

原创 Elasticsearch-SQL介绍

​ Elasticsearch的SQLjdbc驱动程序是Elasticsearch的一个功能丰富的jdbc驱动程序。它是Type 4驱动程序,这意味着它是一个独立于平台的、独立的、直接到数据库的纯Java驱动程序,可以将JDBC调用转换为Elasticsearch SQL使用官网地址:https://www.elastic.co/guide/en/elasticsearch/reference/current/sql-jdbc.html查询索引v查询结构数据查询。

2023-02-11 16:13:07 2921 4

原创 hadoop-hdfs集群安全模式详解

安全模式相关命令查看安全模式 hdfs dfsadmin -safemode get进入安全模式状 hdfs dfsadmin -safemode enter离开安全模式 hdfs dfsadmin -safemode leave等待安全模式状态 hdfs dfsadmin -safemode wait dfs.namenode.safemode.min.datanodes 0

2023-01-27 18:38:00 2935

原创 JDBC简介及原理和使用介绍

Java数据库连接,(Java Database Connectivity,简称JDBC)是Java语言中用来规范客户端程序如何来访问数据库的应用程序接口,提供了诸如查询和更新数据库中数据的方法。​ 使用Java程序访问数据库时,Java代码并不是直接通过TCP连接去访问数据库,而是通过JDBC接口来访问,而JDBC接口则通过JDBC驱动来实现真正对数据库的访问例如,我们在Java代码中如果要访问MySQL,那么必须编写代码操作JDBC接口。JDBC接口是Java标准库自带的

2023-01-12 10:36:41 1717

原创 Greenplum-PostgreSQL常用操作语句

调用文本编辑器功能,可以打开并编辑最后一次SQL执行的查询语句并二次执行\e-- 例如平时SQL语句输入错误时,一般会光标按上找出上一句SQL修改,但是当SQL语句非常长时,使用\e编辑非常直观易用 dmcpgsdb = # select * from amr_n042_company_inv limitttt 1;

2022-12-27 17:20:08 2420

原创 pandas模块使用介绍

​ pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。Python在数据处理和准备⽅⾯⼀直做得很好,但在数据分析和建模⽅⾯就差⼀些。pandas帮助填补了这⼀空⽩,使您能够在Python中执⾏整个数据分析⼯作流程,⽽不必切换到更特定于领域的其它语⾔与出⾊的 jupyter⼯具包和其他库相结合,Python中⽤于进⾏数据

2022-12-07 14:33:08 3448 1

监控yaml压缩包.zip

用于监控搭建使用的yaml文件汇总,以防止文档中yaml文件缺失等遇到的问题

2019-10-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除