自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 主题爬虫(Focused Crawler)

主题爬虫(Focused Crawler)是一种针对特定主题或领域进行信息采集的网络爬虫,与通用爬虫(General Crawler)不同,它只抓取与目标主题相关的网页,以提高爬取效率和数据质量。主题爬虫相比通用爬虫更具针对性和效率,广泛应用于行业监测、学术分析、市场调研等领域。实现高效的主题爬取需要结合 NLP、机器学习、链接分析等技术,同时要应对反爬虫机制的挑战。在实践中,选取合适的爬虫框架并结合优化策略,可以显著提高爬取效果。

2025-03-02 09:09:25 1858

原创 【RAG】

这些方法旨在通过利用外部知识源和大型语言模型的能力,提高信息检索和生成的效率及有效性。每种模式展示了这些模块如何组合,如“重写-检索-读取”、“展示-检索-搜索”、“检索-重排-读取”等,以及动态选择和剪枝、迭代检索生成等高级模式。

2025-02-20 17:08:43 305

原创 BM25、密集段落检索(DPR) 和 REALM(Retrieval-Augmented Language Model)

技术核心思想优点缺点BM25基于关键词匹配的概率模型,依赖于词频和逆文档频率进行检索。简单、高效,适用于大规模数据集。只依赖于关键词,无法捕捉语义信息,容易受噪声影响。DPR使用深度学习模型将查询和文档转换为密集向量,使用向量相似度进行检索。捕捉语义信息,能够进行深层次语义匹配。训练复杂,需要大量计算资源,预计算和存储向量有一定开销。REALM将检索模块和语言模型结合,增强语言模型的知识库,进行端到端训练。检索增强,提高生成能力和检索效果,能够处理开放域问答。

2025-02-20 15:53:37 770

原创 【嵌入模型】

嵌入模型通过将离散数据转换为低维向量表示,极大地提高了数据的可处理性和计算效率。随着深度学习和预训练技术的发展,嵌入模型在多个领域(如自然语言处理、计算机视觉、推荐系统等)取得了显著的成功。它们不仅能够捕捉对象之间的语义关系,还能够在不同任务之间迁移学习,提高了模型的泛化能力和灵活性。

2025-02-20 15:52:51 1662

原创 知识图谱嵌入

知识图谱:是一种用图模型来描述事物之间关联关系的技术,其中节点代表实体(如人物、地点等),边则代表实体之间的关系(如“出生于”、“工作于”)。知识图谱能够有效地捕捉现实世界中的复杂关系,并且易于扩展和更新。知识图谱嵌入:其核心思想是将知识图谱中的实体和关系转化为低维向量,这样做的好处是可以简化计算,同时保留原始图谱的语义信息。例如,在推荐系统中,可以通过计算用户兴趣向量与商品特征向量之间的相似度来进行个性化推荐。

2025-02-08 10:24:41 764

原创 混合专家模型(MoE)

初始化:首先,需要初始化所有的专家和门控网络。每个专家可以是一个独立的小型神经网络或更复杂的结构,而门控网络负责决定输入数据应该由哪个或哪些专家来处理。前向传播输入数据通过门控网络,该网络输出一个概率分布,指示每个专家处理当前输入的重要性或权重。根据门控网络的输出,选择对应的专家对输入数据进行处理,并得到相应的输出结果。这些输出结果通常会根据门控网络分配的概率加权求和,形成最终的输出。计算损失:使用标准的损失函数(如交叉熵损失、均方误差等)来评估模型预测与真实标签之间的差距。反向传播。

2025-02-08 09:47:01 1668

原创 DeepSeek

**架构与训练方法**:该模型采用了混合专家(MoE)架构,这种设计允许模型在特定任务上表现得更加专业,同时保持较高的计算效率。它的应用范围广泛,从简单的对话系统到复杂的文本分析和生成任务都能胜任。- **强化学习技术**:DeepSeek-R1利用了大规模强化学习(RL)技术进行后训练阶段的优化,即使在极少标注数据的情况下也能显著提升模型的推理能力。综上所述,DeepSeek大模型代表了当前人工智能领域的前沿水平,它们不仅展示了深度学习技术的强大潜力,也为各行各业提供了新的解决方案和发展机遇。

2025-02-07 16:26:51 195

原创 开源框架Rasa

Rasa NLU是一个自然语言理解工具,用于将用户输入的自然语言转化为结构化的数据。它可以识别意图、提取实体并理解用户的意图。它可以根据当前的对话状态和用户的意图来做出相应的回应。使用Rasa框架,开发者可以定义自己的对话流程,包括意图、实体、对话状态和对应的回应。开发者可以通过自然语言理解模型训练和优化对话系统的理解能力,并通过对话管理模型优化对话系统的决策能力。除了核心组件外,Rasa还提供了一些辅助工具和库,用于训练和评估模型、部署和集成聊天机器人,并提供了丰富的文档和示例代码供开发者参考。

2025-01-25 15:37:28 305

原创 TensorFlow

自然语言处理:TensorFlow 提供了一些用于处理文本数据的工具和模型,如词嵌入(Word Embedding)、循环神经网络语言模型(RNNLM)等,可以用于文本分类、情感分析、机器翻译等任务。图像处理:TensorFlow 提供了一些用于图像处理的工具和模型,如卷积神经网络(CNN)和图像生成模型,可以用于图像分类、目标检测、图像生成等任务。机器学习:TensorFlow 提供了丰富的机器学习算法库和模型结构,可以用于分类、回归、聚类、生成对抗网络等各种类型的任务。

2025-01-25 15:36:01 224

原创 RESTful API

总结来说,RESTful API通过定义资源、HTTP方法和数据格式,提供了一种灵活和可扩展的方式来构建Web应用程序,并提供了一种简单和标准化的方式来与其他系统进行通信和交互。RESTful API是一种设计和开发Web应用程序的架构风格。它基于一组规范和约定,使得不同的系统和组件可以通过HTTP协议进行通信和交互。

2025-01-25 15:35:27 323

原创 Rasa 与 LLM

Rasa适用于需要高度定制化对话管理和多轮对话的系统,提供了可控制的对话流、意图和实体识别,适合企业级应用。LLM(如 GPT)则更通用,能够生成自然语言文本,适合广泛的文本生成和对话任务,但在多轮对话的上下文保持和定制方面不如 Rasa 精细。两者可以结合使用,例如,将 Rasa 用于对话管理和流程控制,将 LLM 用于生成更加自然、丰富的文本响应。

2025-01-16 18:18:10 1604

原创 条件概率、贝叶斯公式

设 A 和 B是两个事件,且 P(B)>0,则在事件 B已发生的条件下,事件 A发生的条件概率记为 P(A∣B),其定义为:P(A∩B)表示事件 A和 B 同时发生的概率;P(B)表示事件 B的概率;P(A∣B)表示在事件 B已知发生的条件下,事件A发生的概率。

2025-01-14 11:53:48 961

原创 SQLite简介

SQLite 是一个功能强大、轻量级的嵌入式数据库,适用于许多需要简洁、高效且跨平台的数据库解决方案。它非常适合移动设备、桌面应用、物联网以及小型 Web 应用等场景,但对于高并发、高数据量的企业级应用,可能需要考虑使用更复杂的数据库系统。

2025-01-11 10:14:10 941

原创 恒定流 vs 非恒定流

恒定流:流体的物理量不随时间变化,流动稳定。非恒定流:流体的物理量随时间变化,流动不稳定。在水利工程设计与管理中,非恒定流常常需要考虑更多的动态因素,如流量变化、洪水调度等,而恒定流则较为简化,适用于一些长期稳定的流动场景。

2025-01-09 14:32:55 1623

原创 动态规划:最优子结构、重叠子问题

最优子结构指的是问题的最优解可以通过其子问题的最优解来构造。也就是说,问题的整体最优解可以由其子问题的最优解组成。

2025-01-09 11:47:32 1846

原创 动态规划 VS 启发式算法

动态规划(Dynamic Programming, DP)和启发式算法(Heuristic Algorithms)都是用于求解优化问题的重要方法,但它们在求解问题的方式、适用场景、计算效率等方面有显著的不同。以下是动态规划与启发式算法的详细对比:动态规划:启发式算法:动态规划:启发式算法:动态规划:启发式算法:动态规划:启发式算法:优点:缺点:最终的选择取决于具体问题的规模、特性及计算资源。如果问题的规模较小且具有最优子结构,动态规划是一个很好的选择;如果问题较复杂,且解空间非常大且无法精确分解,启发式算法

2025-01-09 11:45:31 1181

原创 计算机视觉(CV)

计算机视觉(CV)技术是通过计算机处理和理解图像和视频来模拟人类视觉的能力。它具有许多优势和挑战。

2025-01-04 15:57:23 745

原创 人工智能简介

人工智能(Artificial Intelligence, AI)是一种模拟和模仿人类智能的技术,它在现代科技中扮演着重要角色,并有着广泛的应用和令人期待的未来发展趋势。大数据和云计算:人工智能需要大量的数据来学习和训练模型,因此大数据和云计算的发展将为人工智能提供更多资源和计算能力。强化学习和自主决策:强化学习是人工智能的重要分支,可以使机器在与环境交互的过程中学习和优化策略,实现自主决策能力。图像和视频分析:人工智能技术可以对图像和视频进行分析和识别,如人脸识别、目标检测和图像生成等。

2025-01-04 15:54:39 696

原创 Git介绍

Git 是现代开发中不可或缺的工具,不仅适用于单人项目,也支持多人协作开发。熟悉这些基本操作和概念后,可以进一步学习 Git 的高级功能,如。Git 是一种功能强大的分布式版本控制系统,广泛应用于软件开发领域。,以适应更复杂的开发需求。

2025-01-04 15:53:43 961

原创 Docker

可移植性:Docker容器可以在任何支持Docker的操作系统中运行,无论是在开发环境中还是在生产环境中。Docker是一个开源的容器化平台,它通过将应用程序及其依赖项打包到一个称为容器的可移植镜像中,提供了一种轻量级、可移植和自包含的软件交付解决方案。总的来说,Docker提供了一种先进的软件交付解决方案,能够简化应用程序的开发、测试、部署和维护过程,提高开发效率和应用程序的可靠性。轻量级:Docker容器相比于传统的虚拟机更加轻量和高效,因为它们共享主机的操作系统内核,避免了额外的操作系统开销。

2025-01-04 15:51:24 183

原创 K-均值聚类算法

总之,K-均值聚类算法是一种常用且简单的聚类算法,适用于大规模数据集和球形簇结构的数据。然而,对于非球形簇结构的数据集,其聚类效果可能较差,并且对于噪声和离群点敏感。K-均值聚类算法是一种常用的无监督学习算法,用于将数据集划分为K个互不重叠的簇。该算法的目标是最小化数据点到其所属簇中心点的平方距离的总和。

2025-01-04 15:50:44 298

原创 Django 介绍

【代码】Django 介绍。

2025-01-04 15:18:49 1241

原创 Django0

Django是一种开源的高效、简洁且具有安全性的 web 应用框架。它基于 Python 编程语言开发,并被广泛用于快速构建和开发 web 应用程序。

2025-01-04 15:16:19 369

原创 基于LSTM的流量预测

LSTM 模型可以直接输入多维特征数据,无需特殊处理。

2025-01-03 15:12:55 1259

原创 长短期记忆网络(LSTM)

LSTM通过引入记忆单元,有效地控制信息的传递和丢弃,从而在长序列中保留关键信息。

2025-01-03 15:09:16 904

原创 马尔可夫过程、马尔可夫奖励过程、马尔可夫决策过程、马尔可夫最重要的性质

马尔可夫过程由一个状态集合 S和状态转移概率矩阵 P组成。转移概率 P(s′∣s):表示从状态 s转移到状态 s′的概率。状态集合 S:所有可能状态。转移概率矩阵 P:描述状态转移的概率。奖励函数 R(s):每个状态的期望即时奖励。折扣因子 γ∈[0,1]:用于计算长期收益。状态集合 S:所有可能状态。动作集合 A:所有可能动作。状态转移概率 P(s′∣s,a):执行动作 a后从状态 s转移到状态 s′ 的概率。奖励函数 R(s,a):执行动作 a后在状态 s的期望即时奖励。

2025-01-03 09:13:17 841

原创 双目标优化

【代码】【无标题】

2025-01-02 17:12:47 282

原创 pyomo or pymoo

pymoo和pyomo都是用于优化问题建模和求解的 Python 库,但它们的应用场景和功能有所不同。

2025-01-02 14:57:57 1222

原创 强化学习9

主要区别特征强化学习中的损失函数深度学习中的损失函数目标优化长期奖励,调整智能体的策略或价值函数最小化预测误差,优化模型的预测准确性反馈机制通过环境的奖励和惩罚提供反馈,奖励是延迟的通过与真实标签的对比提供即时反馈数据类型与环境的交互数据(状态、动作、奖励)相关依赖于标注数据(输入与标签)优化目标最大化累积奖励(Q值、策略)最小化损失(如分类误差、回归误差)损失函数形式通常基于价值函数(如Q-learning)、策略梯度等形式通常基于标签与预测的误差,如交叉熵损失、均方误差等应用领域。

2024-12-31 10:34:07 1234

原创 强化学习8

强化学习:通过与环境的互动学习如何做出最优决策,主要解决如何通过行动获得最大回报的问题。监督学习:通过标注数据学习输入与输出之间的映射,适用于分类和回归任务,依赖于标签数据。无监督学习:从无标签数据中发现数据的内在结构或模式,常用于聚类、降维等任务,关注数据的隐藏模式。

2024-12-31 10:30:39 936

原创 强化学习0

强化学习就是让智能体(像小狗或贪吃蛇)在一个环境中通过与环境互动,尝试不同的动作,并根据反馈(奖励或惩罚)不断调整行为,以便最大化最终的奖励。这个过程是通过试错来学习的,不依赖于事先的知识或指导。

2024-12-31 10:29:13 873

原创 强化学习7

有模型学习:通过构建或学习环境的模型,智能体可以在没有大量交互的情况下进行有效的规划和决策,适用于模型能够较为准确描述环境的场景。优点是交互效率高,但缺点是模型的建立和更新可能非常复杂。免模型学习:不需要环境模型,通过与环境的交互来学习最优策略。优点是简单、直观,缺点是通常需要更多的交互数据,收敛速度较慢。

2024-12-31 10:27:18 656

原创 强化学习6

特性基于策略迭代基于价值迭代核心思想交替进行策略评估和策略改善同时更新状态值和策略更新机制策略评估 -> 策略改善值更新 -> 策略更新收敛速度较快,但每轮需要进行完整的策略评估相对较慢,但每次迭代都同时更新价值函数和策略实现复杂度较高,需要显式分开策略评估和改善较低,策略和价值函数一起更新计算复杂度策略评估过程较慢更新过程较快,但需要更多的迭代最终输出最优策略最优值函数,派生出最优策略基于策略迭代。

2024-12-31 10:25:05 956

原创 强化学习5

基于模型的智能体vs.无模型的智能体离散动作空间智能体vs.连续动作空间智能体单智能体系统vs.多智能体系统基于值的智能体vs.基于策略的智能体离线学习(Off-Policy)vs.在线学习(On-Policy)这些分类帮助我们理解不同类型的强化学习智能体如何适应不同的任务和环境,选择合适的算法和策略来应对具体的强化学习问题。

2024-12-31 10:22:37 594

原创 强化学习4

状态是指在某一时刻,环境的一个完整描述,包含了对智能体决策过程有影响的所有信息。在理想的强化学习模型中,状态是完全可观察的,并且能够为智能体提供所有必要的信息,以做出合理的决策。

2024-12-31 10:18:16 838

原创 强化学习3

强化学习近年来迅速发展的原因是多方面的,主要包括计算能力的提升、深度学习的突破、丰富数据和模拟环境的可用性、算法的不断创新、应用领域的成功案例、开源工具的普及、以及理论和实践的逐步成熟。随着这些因素的共同作用,强化学习已经成为人工智能领域最具潜力和前景的研究方向之一。

2024-12-31 10:16:49 917

原创 强化学习2

强化学习的训练过程比监督学习更加困难,主要是因为强化学习需要处理奖励延迟、探索与利用的平衡、环境的动态性和不确定性、长期依赖性以及庞大的状态和动作空间。此外,强化学习的目标是优化策略以最大化长期回报,这比监督学习中的单一目标(如最小化损失)更加复杂和挑战性大。

2024-12-31 09:57:34 1353

原创 强化学习1

强化学习(Reinforcement Learning,RL)是一种通过与环境的交互学习如何采取行动以最大化长期回报的学习方法。

2024-12-31 09:54:00 409

原创 人工智能、机器学习、深度学习之间的关系

AI是大框架,涵盖所有模仿人类智能的技术。ML是AI的一个方法,强调通过数据让机器“学习”。DL是ML的一种方法,利用深层神经网络进行复杂的学习。

2024-12-30 18:54:20 890

原创 马尔科夫链

状态空间(State Space):马尔科夫链的所有可能状态的集合,通常用 S={s1,s2,…,sn}S = \{s_1, s_2, \dots, s_n\} 表示,状态空间可以是有限的,也可以是无限的。状态空间的大小决定了转移概率矩阵的维度。转移概率(Transition Probability):转移概率描述了系统从一个状态转移到另一个状态的概率。其中,XnX_n 表示马尔科夫链在时刻 nn 的状态,PijP_{ij} 是从 sis_i 转移到 sjs_j 的概率。

2024-12-30 16:48:11 1623

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除