自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(132)
  • 收藏
  • 关注

原创 什么是PID控制?

本文详细介绍了工业场景中常用的PID控制算法的概念、原理及其python实现。

2025-04-02 21:59:13 140

原创 PEFT实战(一)——LoRA

本文基于PEFT库,展示了如何使用LoRA进行大模型的参数高效微调策略。

2025-04-02 11:12:44 919

原创 CPU跑大模型怎么加速?

本文介绍了HuggingFace官方教程中的CPU大模型推理加速方案。

2025-03-26 17:59:27 874

原创 什么是FP-growth频繁项集挖掘?

本文详细介绍了FP-Growth频繁项集挖掘算法的概念、原理以及python实现。

2025-03-26 15:53:16 423

原创 什么是Apriori关联分析?

本文详细介绍了Apriori关联规则挖掘算法的概念、原理及具体的python实现方式。

2025-03-20 19:15:46 943

原创 谷歌最新发布Gemma3大模型:小规模高性能

本文介绍了谷歌发布的Gemma 3系列大模型的技术要点。

2025-03-20 14:24:08 287

原创 什么是关系抽取?

本文详细介绍了关系抽取的概念及原理,并给出了基于规则匹配的关系抽取python实例。

2025-03-15 14:37:17 360

原创 <论文>MiniCPM:利用可扩展训练策略揭示小型语言模型的潜力

本文介绍了论文​《MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies》的主要研究内容。

2025-03-09 23:41:48 539 1

原创 机器学习模型可解释性工具——SHAP

本文介绍了机器学习可解释性工具SHAP的原理、概念及python用法。

2025-02-28 10:05:47 416

原创 SMOTE过采样算法

本文详细介绍了SMOTE过采样的概念、原理及python实现。

2025-02-20 17:02:58 500

原创 数据结构中的邻接表

本文详细介绍了邻接表的概念、原理及python实现。

2025-02-17 16:55:43 948

原创 python实战(十七)——基于对比学习的跨语言文本对齐

本文基于kaggle的开源数据集进行了跨语言文本对齐的python实践。

2025-02-17 14:59:55 650

原创 什么是元学习?

本文详细介绍了元学习的概念、原理。

2025-02-15 12:17:23 737

原创 数据结构中的邻接矩阵

本文详细介绍了邻接矩阵的概念、原理及python实现方式。

2025-02-13 16:28:50 674

原创 <论文>通过频率分解MoE来增强时序预测能力

本文详细介绍了论文《FreqMoE: Enhancing Time Series Forecasting through Frequency Decomposition Mixture of Experts》的研究内容及核心创新点。

2025-02-13 09:51:05 1198

原创 python实战(十六)——基于LSTM的股价预测

本文基于特斯拉股价数据集展示了使用LSTM进行时序预测的python建模过程。

2025-02-09 09:33:49 1159

原创 <论文>DeepSeek-R1:通过强化学习激励大语言模型的推理能力(深度思考)

本文详细介绍了论文​《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning | Papers With Code》的主要研究内容及创新点。

2025-02-07 18:30:48 3025 2

原创 DeepSeek中用到的Grouped-Query Attention技术是什么来头?

本文详细介绍了Grouped-Query Attention的概念、原理以及python实现。

2025-02-07 13:54:22 846

原创 DeepSeek中的Multi-head Latent Attention技术

本文详细介绍了DeepSeek大模型所用到的多头隐注意力机制的概念、核心原理及python实现。

2025-02-06 14:27:22 2539

原创 什么是图神经网络?

本文详细介绍了图神经网络GNN的概念及python实现。

2025-02-06 13:13:43 1419

原创 什么是门控循环单元?

本文详细介绍了门控循环单元GRU的基本概念及核心算法,并给出了python实现的示例。

2025-02-01 10:30:50 1613

原创 什么是长短期记忆网络?

本文详细介绍了LSTM的概念、原理及python实现。

2025-01-29 18:01:38 1123

原创 什么是循环神经网络?

本文详细介绍了RNN的概念、原理及python实现方式。

2025-01-28 13:04:59 716

原创 什么是卷积神经网络?

本文详细介绍了卷积神经网络的概念、原理及python实现。

2025-01-27 11:30:01 1457

原创 算法中的时间复杂度和空间复杂度

本文详细介绍了时间复杂度和空间复杂度的概念及常见类型。

2025-01-23 18:07:24 1101

原创 <论文>大模型可以在手机上运行?

本文介绍了论文​《MiniCPM-V: A GPT-4V Level MLLM on Your Phone》的核心内容。

2025-01-23 16:11:05 877

原创 python实战(十五)——中文手写体数字图像CNN分类

本文基于汉字手写体数字图像进行了CNN分类实战。

2025-01-22 20:07:24 878 4

原创 <论文>用于大语言模型去偏的因果奖励机制

本文介绍了论文​《Beyond Reward Hacking: Causal Rewards for Large Language Model Alignment》的主要研究内容。

2025-01-22 17:50:07 1266

原创 大模型后训练——DPO直接偏好优化

本文介绍了大模型优化方法——DPO,即直接偏好优化的概念及python实现。

2025-01-21 15:25:47 1687

原创 大模型旋转位置编码RoPE

本文介绍了大模型领域的旋转位置编码RoPE。

2025-01-17 12:50:33 620

原创 <论文>谷歌的时序大模型TimesFM

本文介绍谷歌团队发表于2023年的论文《译文:受自然语言处理(NLP)中大型语言模型最新进展的启发,我们设计了一种用于预测的时间序列基础模型,其在各种公共数据集上的开箱即用零样本性能接近于每个单独数据集的最先进监督预测模型的准确性。我们的模型基于预训练一个带有输入分片的解码器风格注意力模型,使用一个包含真实世界和合成数据集的大型时间序列语料库。在一组多样化的先前未见过的预测数据集上的实验表明,该模型可以在不同领域、预测范围和时间粒度上产生准确的零样本预测。

2025-01-17 11:47:26 868

原创 <论文>如何将RAG和时序大模型相结合?

本文介绍了论文​《Retrieval Augmented Time Series Forecasting》及其提出的RAG增强方法。

2025-01-15 17:58:43 849

原创 python实战(十四)——Bert-BiLSTM-CRF命名实体识别

本文使用人民日报BIO标注数据集进行了基于Bert-BiLSTM-CRF的命名实体识别建模实践。

2025-01-15 17:54:11 2827 5

原创 <论文>时序大模型如何应用于金融领域?

本文简要介绍了论文​《Financial Fine-tuning a Large Time Series Model》。

2025-01-13 16:59:41 885

原创 <论文>LoRA是什么?

本文介绍了论文​《LoRA: Low-Rank Adaptation of Large Language Models》的主要研究内容,并介绍了LoRA技术的基本思路。

2025-01-12 10:15:13 511

原创 什么是知识图谱?

本文详细介绍了知识图谱的概念、应用场景及构建方式。

2025-01-10 13:48:58 1079

原创 什么是命名实体识别?

本文介绍了命名实体识别的基本概念及基于规则的命名实体识别python实现。

2025-01-08 18:40:46 640

原创 <论文>什么是胶囊神经网络?

本文简要介绍了​论文《Dynamic Routing Between Capsules》及其提出的胶囊神经网络核心要点。

2025-01-08 15:38:40 1259 1

原创 <论文>大模型也能做时间序列预测?

本文介绍了​论文《UnderstandingDifferentDesignChoicesinTrainingLargeTimeSeriesModels》的核心研究内容。

2025-01-07 16:49:55 899

原创 python实战(十三)——基于Bert+HDBSCAN的微博热搜数据挖掘

本文使用微博热搜词条数据,展示了文本数据分析及python无监督文本挖掘的过程。

2025-01-07 09:36:47 2116

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除