自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

项目git同名小胡说技书

目前大四实习

  • 博客(215)
  • 资源 (7)
  • 收藏
  • 关注

原创 小白入坑向:Java 全栈系统性学习推荐路线之一

我的专栏差不多是按照这些流程,在细化一些写的;当然技术是更新换代很快(当然活下来的技术,肯定简化了之前开发带来的问题),所以我的建议是系统性的学习完后,在实际的开发过程中以官方文档+“大模型老师”下快速的学习。

2025-03-04 20:32:25 1544

原创 小白向:如何使用dify官方市场“ECharts图表生成”工具插件——dify入门案例

dify小白使用echarts组件教程

2025-03-03 21:06:49 5590 20

原创 小胡说技书博客(精选、各类书籍推荐):服务治理、数据治理与安全治理对比;

小胡说技书博客分类(部分目录):服务治理、数据治理与安全治理对比表格

2025-02-15 23:54:57 1432 2

原创 知识图谱入门——5:Neo4j Desktop安装和使用手册(小白向:Cypher 查询语言:逐步教程!Neo4j 优缺点分析)

知识图谱入门——5:Neo4j Desktop安装和使用手册(小白向:Cypher 查询语言:逐步教程!Neo4j 优缺点分析)

2024-10-03 16:19:22 5293 6

原创 CentOS Linux通过yum安装nginx并代理静态页。(重复的仓库配置 safe thing yum can do is fail. ...a few ways to work “fix“)

由于 CentOS 7 官方仓库已经进入维护状态,其默认配置可能无法满足当前需求。文件,再重新添加新的仓库配置文件。启用 EPEL 仓库后,可以获取更多经过测试且维护良好的软件包,符合企业级需求。在企业级环境中,安全配置至关重要。此命令将自动解决依赖关系,并从官方或镜像源中获取最新稳定版本的软件包。现在,你的 Nginx 服务器已经成功挂载静态网页 🎉🚀,可以访问。这样能够确保外部访问不受阻碍,同时保持整体安全性。您可以先备份当前的仓库配置,然后删除所有现有的。在进行任何删除操作前,务必先备份。

2025-04-02 16:40:51 457

原创 9.时间序列分析与预测的理论与实践——Python数据挖掘代码实践

全面方法论时间序列分析是一项系统工程,涉及数据平滑、分解、模型构建及评估。交叉验证、验证曲线和学习曲线在监督学习中同样适用于时序模型调优。自动化与持续监控建议构建自动化的模型调优管道,将时间序列预测模型与数据治理平台结合,实时监控数据变化和模型表现。随着业务数据和市场环境的不断变化,模型需要持续更新和再训练。技术前沿未来,深度学习方法(如 LSTM、Transformer)在时间序列预测中的应用将进一步提升预测准确性,特别是在处理复杂非线性和多变量时序数据上。

2025-03-30 16:18:50 1085

原创 企业级知识库建设:自建与开源产品集成的全景解析 —— 产品经理、CTO 与 CDO 的深度对话

本文将结合技术细节和工具实践,对自建方案与开源产品集成两大路径进行深入对比和解析,并以大表格形式直观呈现当前主流产品的特点,供企业在产品选择时参考。:在对核心竞争力要求较高的领域自主研发,同时在标准化模块上充分利用开源产品的成熟解决方案,既保证定制化需求,又能缩短上线周期,降低整体研发与运维成本。以下从具体实施流程、技术难点、数据治理及长期发展等方面进行深入对比分析。下表汇总了当前较为成熟的几套产品及相关开源项目,从产品功能模块、优势、劣势、适用场景及技术要求等多维度进行对比,直观展示各产品的特点与局限。

2025-03-29 22:35:27 999

原创 知识库中嵌入模型(Embedding Models)与重排序模型(Re-ranking Models)推荐工具与库

知识库作为信息管理和知识发现的核心平台,已经广泛应用于搜索引擎、问答系统、智能客服、推荐系统等领域。然而,传统的基于关键词匹配的检索方法往往难以捕捉深层次的语义关联,导致检索效果不佳。为了解决这一问题,嵌入模型和重排序模型应运而生。

2025-03-28 21:37:31 982

原创 跨语言微服务架构(Java、Python)——“API中台”

本系统架构旨在打破传统单一技术栈的限制,实现不同编程语言、不同平台之间的无缝协同,最终构建出一个灵活、安全、高效的企业级微服务生态系统。

2025-03-26 22:02:22 1200

原创 8.非监督学习与关系挖掘:聚类分析、客户细分、关联规则与协同过滤的全面解析——Python数据挖掘代码实践

聚类分析(Clustering)是非监督学习中的一种重要方法,其目标是将数据集中的对象根据相似性分为若干个簇。非层次聚类:如 K 均值算法(K-Means),通过迭代优化簇中心的方式实现数据分群。层次聚类:包括凝聚层次聚类(Agglomerative Clustering)和分裂层次聚类(Divisive Clustering),可利用不同的链接方式(单链接、完全链接、Ward法)构建树状结构,从而对数据进行分层次的划分。聚类分析在客户细分、市场分割、图像分割以及异常检测等领域有广泛应用。

2025-03-25 21:02:01 1033

原创 7.模型选择与评估:构建科学的参数调优与性能评估体系——Python数据挖掘代码实践

在构建监督学习模型时,如何选择合适的模型、确定最佳超参数以及科学地评估模型性能一直是数据科学家与机器学习专家关注的核心问题。本文旨在为您提供一套从数据预处理到模型评估的完整流程,结合理论、代码实践以及深度思考,构建一个全面、系统且具有实际指导意义的模型选择与评估体系。

2025-03-25 20:29:12 1164

原创 6.监督学习:模型总览表格——Python数据挖掘代码实践

下面的表格详细列出了深度学习中常见的模型类型,从基础前馈网络到的 Transformer 模型,涵盖各模型的基本描述、主要优缺点、适用场景及在 Python 中常用的工具。这份表格旨在帮助您全面理解深度学习模型的分类及其应用,为项目选型和研究提供参考。下面的表格详细列出常见的监督学习模型,从经典的线性模型、判别分析,到支持向量机、树模型、朴素贝叶斯、最近邻、神经网络及其他较为前沿的方法,涵盖其主要用途、优势、缺点、适用场景以及在 Python 中常用的工具。(神经网络表格单独说)

2025-03-24 17:52:50 982

原创 5.特征工程与维度降维实践指南——Python数据挖掘代码实践

本博客旨在分享如何利用 Python 工具,从数据聚合、透视、正则化、树模型到非数值数据处理,实现特征构造与变量选择,进而为后续建模奠定坚实基础。

2025-03-21 15:32:06 1026

原创 4.玩转热图(续:矩阵式网络关系热图、Pivot Table 热图、三维/交互式热图)——Python数据挖掘代码实践

4.玩转热图(续:矩阵式网络关系热图、Pivot Table 热图、三维/交互式热图)

2025-03-20 20:49:23 980

原创 4.玩转热图(续:地图热图)——Python数据挖掘代码实践

在数据可视化中,地理热图(Choropleth)是一种直观的方式来展示地理区域数据的分布。本文将使用 Python 的GeoPandas库,通过 Natural Earth 提供的Shapefile数据,绘制一张全球地理热图。

2025-03-20 19:53:29 311

原创 4.玩转热图(相关矩阵、缺失值、多维相关、聚类热图、时间序列)——Python数据挖掘代码实践

玩转热图(相关矩阵、缺失值、多维相关、聚类热图、时间序列)

2025-03-18 22:27:20 1448

原创 3.数据探索与可视化基本图形(直方图、箱线图、散点图)——Python数据挖掘代码实践

本部分旨在帮助初学者从理论上认识数据可视化的基本概念,并理解常见图形的内涵及其适用场景。通过掌握这些基本概念,您将能更好地利用数据分布、相关性和多维数据展示等工具来探索和分析数据。

2025-03-18 15:28:57 1480

原创 Xinference大模型配置介绍并通过git-lfs、hf-mirror安装

Xinference大模型配置介绍并通过git-lfs、hf-mirror安装

2025-03-15 17:55:01 1284

原创 linux(ubuntu)中Conda、CUDA安装Xinference报错ERROR: Failed to build (llama-cpp-python)

linux(ubuntu)中Conda中CUDA安装Xinference报错ERROR: Failed to build (llama-cpp-python)

2025-03-14 18:47:11 972

原创 大模型有哪些?类别全景解析及对比:从预训练到多模态、通用表示模型多任务及强化学习、领域专用、知识库嵌入与检索优化、语音与视频处理、强化学习与自监督大模型

本文旨在为技术决策者和开发者提供一份系统化、细分且前瞻性的大模型种类全景图,详细阐述预训练模型的基本原理及各类大模型的细分体系,涵盖生成式预训练模型、通用表示模型、多任务通用模型、领域专用大模型、多模态大模型、知识库嵌入与检索优化模型、语音与视频处理模型,以及强化学习与自监督大模型。通过深入解析每一类模型的技术原理、优势特点、典型应用和代表工具,助力企业在实际开发过程中科学选型、精细落地,实现资源最优配置和商业价值最大化。

2025-03-13 08:22:40 1354

原创 2.数据平衡——Python数据挖掘代码实践(SMOTE(合成少数类过采样技术)、ADASYN 及其他过采样方法、随机欠采样、聚类欠采样)

类别不平衡问题是数据挖掘和机器学习中的关键挑战,对模型的预测准确率和鲁棒性有深远影响。本文回顾了过采样(SMOTE、ADASYN)与欠采样(随机、聚类欠采样)的核心原理及优缺点,并提供了实践建议和前沿展望。通过合理地整合技术工具与业务知识,我们不仅能够提升模型在少数类上的识别能力,还能为企业决策提供更可靠的数据支持。希望本文的总结与思考能为您在实际项目中选择合适的数据平衡策略提供指导和启发。

2025-03-13 08:21:51 1168

原创 1.数据清洗与预处理——Python数据挖掘(数据抽样、数据分割、异常值处理、缺失值处理)

本文将以实践为导向,介绍数据抽样、数据分割、异常值处理以及缺失值处理的原理、策略和实现代码,帮助您构建一个完善的数据预处理流程。

2025-03-12 17:01:23 1245

原创 读书推荐:《Data Mining for Business Analytics: Concepts, Techniques and Applications》数据挖掘:商业数据分析技术与实践

这套知识体系不仅涵盖了传统统计方法和现代机器学习算法,还融入了大数据背景下的前沿技术(如深度学习、社交网络与文本挖掘)以及实际业务案例,形成了一种结构化、应用驱动的学习路径。通过系统地学习这些内容,开发者和数据科学家将能够设计和部署具备高度预测准确性、业务洞察力和可扩展性的分析解决方案,为企业构建竞争优势,助力数字化转型。

2025-03-12 15:50:59 1042

原创 9.大模型开发demo——中文文本生成模型实践

在当今自然语言处理领域,文本生成模型已经广泛应用于对话系统、文章撰写、内容创作等场景。本文将以从零开始开发一个中文文本生成模型为例,详细讲解如何构建数据预处理流程、设计词汇表、构造 Transformer 模型、训练模型以及实现文本生成。整个案例使用简化的中文数据,仅作教学演示,但同时也介绍了实际开发中可扩展的方向。

2025-03-10 20:22:14 1091

原创 8.大模型微调学习案例:基于 Hugging Face、8位量化与 LoRA 适配器的方案

本博客详细介绍了如何利用 Hugging Face Transformers、Datasets、PEFT 及 BitsAndBytes 等先进工具,实现大模型的高效微调。文章从数据预处理、训练样本构建、文本分词,到加载预训练模型、8 位量化技术应用,再结合 LoRA 适配器进行参数高效微调,最后通过自定义 Trainer 类完成训练与模型保存,全流程代码详解贯穿始终。文中众多参数配置以“能跑就行”为目标,仅供教学演示,旨在帮助读者快速理解和掌握大模型微调关键技术。

2025-03-08 23:26:38 1020

原创 0.大模型开发知识点需求综述

已更新完到二章、自然语言处理(NLP)基础的细化版(1-7),其中还是省略了很多的基础公式细节,想来如果博客写的太详细,自己暂无精力,且理论太多,因此把大纲放在这里,读者自行学习即可。从下篇博客(这个类型)开始,将以写实际为主。

2025-03-07 23:07:15 692

原创 7.自然语言处理(NLP)理论基础——大模型微调的基石

下面是一个关于“工具介绍”的表格,涵盖了主流预训练模型与微调平台、文本预处理与解析工具以及数据集与 Benchmark 平台,供您参考。分类工具/平台功能与特点适用场景推荐/备注预训练模型与微调平台提供大量预训练模型(BERT、GPT、RoBERTa、T5 等);API 简单易用;支持多任务微调;拥有丰富社区资源快速构建原型、微调任务、少样本学习预训练模型与微调平台高级 API 便于模型构建、训练与部署;

2025-03-06 22:19:43 1084

原创 6.过拟合处理:确保模型泛化能力的实践指南——大模型开发深度学习理论基础

模型复杂度过高模型参数过多或网络层数太深,容易导致对训练数据的噪声进行拟合。训练数据不足数据样本量较少时,模型容易学习到数据中的随机误差。训练时间过长过度训练可能使模型逐步记忆训练数据的细节,而忽略了数据的普遍模式。过拟合是深度学习中常见的问题,但通过合理的策略可以有效缓解。Dropout:通过随机丢弃部分神经元,减少模型对局部特征的依赖,从而提高泛化能力。数据增强:通过对训练数据进行变换扩充数据集,帮助模型学习到更多样化的特征。L1/L2 正则化。

2025-03-05 21:38:33 1175

原创 5.训练策略:优化深度学习训练过程的实践指南——大模型开发深度学习理论基础

定义:Early Stopping 是一种监控验证集表现,当连续若干个训练周期(Epoch)内验证性能不再改善时,提前终止训练的策略。作用防止模型在训练数据上过拟合,确保模型在未见数据上有良好泛化能力。节省计算资源,避免不必要的训练周期浪费时间。定义:Warmup 策略是在训练初期逐步增加学习率的做法,避免模型刚开始训练时因过高的学习率导致梯度不稳定或损失震荡。作用稳定训练:使模型在初始阶段以较小的步幅学习,逐渐适应训练数据分布。防止梯度问题。

2025-03-05 21:27:54 1247

原创 4.归一化技术:深度网络中的关键优化手段——大模型开发深度学习理论基础

归一化技术通过对每一层或每个样本中的数据分布进行标准化,使其均值和方差处于一定范围内。这样做的目的是减少内部协变量偏移(Internal Covariate Shift),使得每层输入具有更稳定的分布,进而提高训练速度和模型稳定性。主要作用缓解梯度问题:通过标准化激活值,减少梯度消失和梯度爆炸问题。加速收敛:统一数据分布,使优化器能够更快地找到最优解。提升泛化能力:归一化操作在一定程度上具有正则化作用,能降低过拟合风险。归一化技术是深度学习网络中必备的优化手段。

2025-03-05 15:13:40 1063

原创 3.激活函数:神经网络中的非线性驱动器——大模型开发深度学习理论基础

定义激活函数是神经网络中每个神经元输出信号的非线性变换函数。简单来说,它将线性组合的输入映射为非线性的输出,使得网络能够处理复杂的非线性问题。激活函数作为神经网络中的非线性驱动器,其选择对模型的表达能力、训练稳定性以及收敛速度具有深远影响。本文从实际开发角度出发,详细介绍了 ReLU、GELU、Swish 等常见激活函数的特点与适用场景,并通过代码示例展示了如何在 PyTorch 中使用这些激活函数及其可视化方法。

2025-03-05 15:12:41 911

原创 2.反向传播机制简述——大模型开发深度学习理论基础

反向传播是一种通过“自顶向下”计算梯度的算法,用于调整神经网络中各层参数。它的基本思想是根据网络输出与真实标签之间的误差,通过逐层传递梯度,指导每一层权重的更新。作用帮助网络“学习”:在每次训练迭代中,网络利用反向传播获得各参数的梯度信息,从而逐步减少误差。自动调整参数:与自动微分(Autograd)结合后,开发者无需手动推导复杂的导数,大大降低了开发难度。反向传播是利用链式法则逐层计算梯度,指导神经网络参数更新的关键算法。

2025-03-04 21:39:05 1145

原创 1.大模型开发数学基础回顾及代码示例——构建大模型的理论基石

线性代数、概率与统计、优化算法、计算图与自动微分。

2025-03-03 19:33:32 833

原创 构建数据治理闭环:DAMA视角下的全流程实践与价值变现

随着数字经济的迅速发展,数据已成为企业核心资产,高效的数据治理体系正变得至关重要。本文基于DAMA理论,从数据资产入表、分类分级、确权登记到元数据管理、数据质量监控,再到数据集成、互操作及主数据管理,全流程构建数据治理闭环。文章介绍了隐私计算、安全沙箱、授权运营等前沿技术如何保障数据安全与共享,同时通过绩效评估与成熟度模型,探索实现数据流通与价值变现的实践路径,为企业构建智能、标准化的数据生态提供理论指导与技术参考。

2025-02-26 21:28:16 1391

原创 《红蓝攻防:构建实战化网络安全防御体系》网络安全技术全景解析

本篇博客探讨了现代网络安全技术及战略管理,分析了红队、蓝队和紫队的协作。蓝队负责防御,使用IDS/IPS、SIEM和EDR等工具保护企业,红队通过渗透测试和社会工程学攻击发现漏洞。文章强调纵深防御和动态响应,介绍了AI与机器学习在攻击识别中的应用,以及量子计算和区块链在数据加密中的潜力。同时,通过SWOT和PEST分析揭示了网络安全的战略意义,并提出如何通过风险矩阵优化安全资源配置。企业需结合技术创新与团队协作,构建全面的网络安全战略应对复杂威胁。

2025-02-24 21:47:52 979

原创 极简入门,本地部署dify低代码平台构建AI Agent大模型全流程(使用教程、微案例、配置详解、架构图解析)

极简入门,本地部署dify低代码平台构建AI Agent大模型全流程(使用教程、微案例、配置详解、架构图解析)

2025-02-22 19:04:42 4031 5

原创 LangChain:AI大模型开发与分布式系统设计

LLM 的基本概念和工作原理大语言模型(Large Language Models,简称 LLM)是一类通过深度学习技术训练的自然语言处理模型,它们通过海量的文本数据进行训练,以学习语言的结构、语法以及语义信息。LLM 的核心在于其大规模的参数和训练数据,这使得它们能够执行多种任务,如文本生成、翻译、问答等。其工作原理基于架构,这是一种处理序列数据(如文本)的神经网络架构,能够高效捕捉上下文信息,理解并生成自然语言。深度学习与大数据的结合LLM 的成功得益于深度学习与大数据的结合。

2025-02-21 21:11:08 917

原创 读书笔记:要点提炼《基于大模型的RAG应用开发与优化——构建企业级LLM应用》(严灿平)

本书解析企业级RAG应用开发与优化,涵盖大模型基础、RAG原理与架构、开发环境、模型、Prompt、嵌入管理、数据加载分割与向量索引;构建检索、响应生成引擎,并探讨高级查询转换、语义路由、多模态检索、代理开发及评估优化;对比C-RAG、Self-RAG、RAPTOR新范式,为企业智能决策提供全景方案。

2025-02-20 22:28:10 1125

原创 智能体(AI Agent、Deepseek、硅基流动)落地实践Demo——借助大模型生成报表,推动AI赋能企业决策

本文以一个智能体 Demo 为例,展示了如何利用硅基流动 DeepSeek API 生成 SQL 查询、执行数据库统计,并进一步自动生成详细的营销报告。硅基流动提供的免费模型服务为企业和开发者降低了 AI 应用门槛,使得智能体系统在各行业落地成为可能。希望这篇博客文章能为您在智能体及大模型应用方面提供新的思路,并激发更多开发者探索 AI 技术的无限可能!

2025-02-19 21:36:52 915 2

原创 智能体系统(AI Agent System)是什么?——从概念解析到企业数字化转型的全景落地及投资视角

本文系统阐述了智能体系统的定义、架构设计、落地实施路径以及未来发展趋势,从企业高层、销售、技术交付和专业投资人等多个角度进行深度解析。文章利用5W2H、波特五力、SWOT等分析方法,探讨智能体在自动化运维、实时决策、风险管控和业务模式创新中的关键作用,并结合实际案例说明如何在中国市场实现本地化落地。特别针对投资人,文章提出了从核心技术、商业模式、团队执行、财务健康、战略合作及政策环境等维度考察智能体公司的综合评估体系,为投资决策提供科学、前瞻的参考依据。

2025-02-18 21:12:08 1098

Protege-5.6.4-win-知识图谱构建工具安装包

Protege-5.6.4-win-知识图谱构建工具安装包

2024-10-30

配套文件:知识图谱入门-7:阶段案例

配套文件:知识图谱入门——7:阶段案例:使用 Protégé、Jupyter Notebook 中的 spaCy 和 Neo4j Desktop 搭建知识图谱

2024-10-05

Neo4j Desktop 1.6.0安装包:知识图谱工具

Neo4j Desktop 1.6.0安装包:知识图谱工具

2024-10-03

2024计算机设计大赛,数据解读乡村发展,数据分析,Jupyter Notebook分析建模,可视化图表

2024计算机设计大赛,数据解读乡村发展,数据分析,Jupyter Notebook分析建模,可视化图表

2024-09-22

数据:基本类型+分类思维导图源文件

数据:基本类型+分类思维导图源文件

2024-09-22

设计模式(设计原则、分类)+思维导图原图

设计模式(设计原则、分类)+思维导图原图

2024-09-22

设计模式(设计原则、分类)+思维导图源文件

设计模式(设计原则、分类)+思维导图源文件

2024-09-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除