自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

kznsbs的博客

原创神经网络笔记 - 神经网络

显然W2 的数据更加平稳，这样的数据说明再计算的过程中，神经网络最大程度上使不同数据的信息，而不是单独通过某一条数据进行判断。在训练神经网络时，计算每个参数（权重）应该怎么调整，才能让模型的输出变得更好（比如分类更准）的一种算法。它是一层一层往回推，算出每个参数对最终误差（loss）的影响，然后用这些信息来更新参数。那么，我们如何知道分数有多对，或则这个分数的准确率有多少，这里需要用到损失函数。通过反向传播，它知道了：“啊，我哪一部分参数错了，应该怎么调整”。顺着上面的例子，我们的到了X* W的分数。

2025-04-27 22:08:39 1153

原创神经网络笔记 - 感知机

主题关键词备注感知机基础权重、阈值、加权和决定输出0或1逻辑门实现单层感知机线性与非线性线性可分 vs 非线性可分XOR是非线性问题多层感知机层与层组合解决复杂问题。

2025-04-26 18:39:49 715

原创大模型微调-高效微调

方法是否修改 Transformer 层参数训练内容注入位置❌ 不修改只训练输入层的可学习 soft prompt（embedding 向量）仅输入嵌入层❌ 不修改只训练 soft prompt（embedding 向量）仅输入嵌入层❌ 不修改训练可学习 prefix，注入每层 attention 的 KV（key/value）每层 Transformer 的注意力层❌ 不修改训练深度 prompt encoder（如 LSTM），输出注入每层 KV 中。

2025-04-26 01:41:43 940

原创大模型微调 - transformer架构

Transformer 架构是由 Vaswani 等人在 2017 年提出的一种深度学习模型架构，首次发表于论文《Attention is All You Need》中。

2025-04-25 17:14:04 370

原创大模型微调 - 自注意力机制

注意力机制（Attention Mechanism）是一种能够根据输入的相关性动态分配权重的机制，广泛应用于自然语言处理、计算机视觉等领域。其核心思想是：“。

2025-04-25 16:33:29 367

原创大模型Rag - 检索增强技术

给定一个用户问题，让大语言模型（LLM）直接生成对该问题的一个回答，将该回答作为**“伪文档”**，再与原始问题拼接后送入检索系统。利用 LLM 所生成的伪答案来填补原问题的语义空白，提升语义匹配程度，从而提高检索准确性。将问题与伪文档拼接后用于搜索，提升了检索命中文档的语义相关性。

2025-04-23 16:32:20 993

原创大模型（4） - LangChain

LangChain 通过组合模块和能力抽象来扩展大型语言模型（LLM）的应用开发者文档：https://python.langchain.com/docs/integrations/llms/代码实现：https://github.com/langchain-ai/langchain/tree/master/libs/langchain/langchain/llms。

2025-04-20 17:33:52 806

原创大模型Rag - 两大检索技术

稀疏检索是一种基于关键词统计的传统检索方法。

2025-04-19 22:47:49 581

原创大模型Rag - 如何评估Rag

RAG（Retrieval-Augmented Generation）是一种结合检索与生成的问答架构。用户提出问题 → 系统检索相关上下文 → 基于上下文由大语言模型生成答案。上下文相关性检索到的上下文是否紧密围绕用户问题展开？是否包含解答问题所需的关键信息？生成答案的忠实性（Faithfulness）答案是否与提供的上下文信息保持事实一致性？能否通过上下文信息进行推断？答案相关性（Relevance）是否直接、完整地回答了用户问题？有无遗漏或冗余无关内容？

2025-04-19 22:14:57 924

原创大模型Rag - 文本分块

在构建智能问答系统或知识库的过程中，文本分块（Text Splitting）是一项基础但极为关键的任务。它不仅决定了后续 embedding 生成的质量，也直接影响向量检索系统的准确率与效率。本文将系统性地介绍文本分块的原理、动因、策略及工具实践，帮助你构建更健壮的语义检索系统。

2025-04-19 16:36:22 441

原创大模型Rag - 向量数据库索引

向量数据库 Chroma是一个简单易用的 AI 原生向量数据库，安装十分简单，使用 pip install chromadb 即可完成安装。服务启动后，可以在指定路径查看本地持久化存储的数据。

2025-04-19 12:11:28 295

原创大模型Rag - 向量数据库

特性维度 Chroma Milvus上手难度 ⭐⭐⭐⭐☆（易上手） ⭐⭐☆☆☆（较复杂）部署方式本地 / 服务端本地 / 服务端 / 分布式可扩展性中等高检索能力支持元数据 + 向量检索支持更多相似度度量与索引算法权限与监控暂不支持支持角色权限、监控与日志功能适合项目规模中小型中大型。

2025-04-18 17:36:54 1055

原创大模型Rag - embedding

Embedding模型是一种将各种形式的数据对象（如文本、音频、视频等）转换为的技术。这种转换过程可以形象地理解为将复杂数据"嵌入"到一个高维的数学空间中。以文本为例："机器学习"和"深度学习"这两个短语的embedding向量在空间中会比它们与"篮球比赛"的向量更接近。

2025-04-18 14:53:10 1041

原创 Open AI 使用篇

大模型中的 function calling 指的是在人工智能模型（如 GPT-4）中调用外部函数或API，以便模型能够执行更复杂的任务或获取外部数据。这种方式允许模型在生成回答时不仅仅依赖于内部的训练数据，还能够与外部系统进行交互，从而拓展其功能。

2025-04-15 21:04:11 468

原创大模型（3）--提示学习

提示模型（Prompt Model）是指导大语言模型（LLM）生成特定输出的结构化输入方法，通常由自然语言指令、上下文和示例组成。

2025-04-15 02:37:11 459

原创大模型（2） -大模型的发展

序列中当前时刻的输出可能需要依赖很远之前的输入信息。

2025-04-14 12:28:15 780

原创大模型（1） - 什么是GPT

全称 Generative Pre-trained Transformer 是一种基于架构的大规模预训练语言模型，由OpenAI研发，但GPT仅仅只是借鉴了Transformer 中Decoder的部分，并且做了升级。

2025-04-11 17:40:17 862

原创 RateLimiter 原理

限流器

2023-01-31 15:43:07 578

原创 spring 中 mybaits 的一级缓存失效

mybatis

2023-01-30 12:31:26 753

原创 eureka 读写锁的一点思考

eureka

2023-01-29 18:52:50 461

原创分析一下spring循环依赖

spring 三级缓存

2023-01-29 16:46:21 742

原创 redisson公平锁与非公平原理

redis

2022-08-16 17:18:03 2025

原创 springclout Config刷新配置源码解析

springcloud

2022-06-28 11:19:15 375

原创 mybatis在spring中的执行流程

mybatis

2022-06-22 10:48:31 398

原创 spring 的 mybatis 整合源码解析

mybatis

2022-06-20 22:52:19 183

原创二战spring_FactoryBean

spring

2022-06-19 13:43:39 148

原创二战spring_启动流程

spring

2022-06-19 10:17:53 133

原创 eureka三级缓存源码级解析

服务端增量获取注册表eureka 的三级缓存可以说是设计的整个中间件非常大的亮点，这里以增量获取注册表信息为例，直接从服务端开始进行分析我们直接来到获取缓存的部分@VisibleForTesting Value getValue(final Key key, boolean useReadOnlyCache) { Value payload = null; ...... if (useReadOnlyCache) {

2021-02-22 15:54:37 1894

原创 springboot 启动流程

spring 启动 public static ConfigurableApplicationContext run(Class<?>[] primarySources, String[] args) { //从springboot return new SpringApplication(primarySources).run(args); }这里主要分为两步，一个是spring Application的构造方法另一步时执行 run()SpringApplication()

2021-02-06 13:37:37 148

原创 LinedBlockingQueue 源码解析

构造方法 public LinkedBlockingQueue() { this(Integer.MAX_VALUE); }空参构造方法，也就是说没有传入大小，队列的大小默认为Integer的最大值属性 private final int capacity;//容量 private final AtomicInteger count = new AtomicInteger();//存储的元素个数 transient Node<E> head

2021-01-04 15:22:54 165 1

原创 ScheduledThreadPoolExecutor 源码解析

概述ScheduledThreadPoolExecutor 常常用来作为延迟任务，或者是周期性执行某个任务延迟任务简单的使用示如下，如果需要周期性执行任务，使用 scheduleAtFixedRate() public static void main(String[] args) throws ClassNotFoundException, ExecutionException, InterruptedException { ScheduledThreadPoolExecutor s

2021-01-04 14:22:56 170

原创 Callable 源码解析

概述这里Callable 的使用以 FutureTask 举例，源码示例如下 public static void main(String[] args) throws ClassNotFoundException, ExecutionException, InterruptedException { FutureTask futureTask = new FutureTask(new Callable() { @Override pub

2021-01-04 13:03:16 328

原创 ArrayBlockingQueue 源码解析

ArrayBlockingQueue 属性首先来看看ArrayBlockingQueue 的属性public class ArrayBlockingQueue<E> extends AbstractQueue<E> implements BlockingQueue<E>, java.io.Serializable { private static final long serialVersionUID = -817911632652898426

2020-12-31 00:11:18 203 2

原创线程池提交任务和执行任务源码解析（2）

概述因为篇幅太长所以分两篇博客进行说明，本文算是对《线程池提交任务和执行任务源码解析》的补充第一篇博客《线程池提交任务和执行任务源码解析》—》https://blog.youkuaiyun.com/kznsbs/article/details/111958345继续execute()方法的说明 public void execute(Runnable command) { ... int c = ctl.get(); if (workerCountOf(c)

2020-12-30 23:01:51 139

原创线程池提交任务和执行任务源码解析

线程池提交我们就按照平时使用的方式，从execute（）这以execute这个方法为入口 public void execute(Runnable command) { ... int c = ctl.get(); if (workerCountOf(c) < corePoolSize) { if (addWorker(command, true)) return;

2020-12-30 14:23:10 302

原创 rocketmq 消息发送

概述rocketmq的消息发送大体可以分为三部1.消息的验证2.队列的选择3.消息的发送消息的验证以send 方法为入口 public SendResult send( Message msg) throws MQClientException, RemotingException, MQBrokerException, InterruptedException { Validators.checkMessage(msg, this);//消息验证

2020-12-29 17:27:05 627 2

原创 Rocketmq 故障延迟源码解析

故障延迟在 rocketmq 中，有两种延迟机制1. 开启故障延迟2. 关闭故障延迟（默认）关闭故障延迟通过 sendLatencyFaultEnable = false 表示关闭故障延迟所谓的关闭故障延迟就是，在生产者发送消息的时候，可能因为网络原因或者是其他外接因素，导致消息发送失败，这个时候就会进行消息发送的重试（单向消息除外）那么在 broker 端机会记录一下这个失败的broker，所以下次轮询到这个broker 的时候就会跳过这个broker，这样就减少了消息发送失败的概率这里关于

2020-12-29 15:28:03 782 5

原创 mybatis 插件执行原理

Interceptorpublic interface Interceptor { Object intercept(Invocation invocation) throws Throwable; default Object plugin(Object target) { return Plugin.wrap(target, this); } default void setProperties(Properties properties) { // NOP }

2020-12-20 21:44:37 151

原创 spring 循环依赖源码解析

循环依赖循环依赖在java中其实并不是一个问题而是一个现象，例如public class AService{ public BService bservice;}public class BService{ public AService aService;} AService aService = new AService();BService bService = new BService();aService.bService = bService;bService.aServi

2020-12-08 00:20:37 152

原创 springBean的实例化过程详解---createBeanInstance(2)

回到createBeanInstance Constructor<?>[] ctors = determineConstructorsFromBeanPostProcessors(beanClass, beanName); if (ctors != null || mbd.getResolvedAutowireMode() == AUTOWIRE_CONSTRUCTOR || mbd.hasConstructorArgumentValues() || !ObjectUtils.i

2020-12-05 15:40:16 239

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

我还没秃，还能学

博客等级

码龄8年

66
原创

214
点赞

190
收藏

79
粉丝

关注

私信

热门文章

分类专栏

redis 1篇
nacos
eureka 1篇

最新评论

netty之wakeup详解
qq_36313598: 你说的对，进入这个后，肯定是false，hasTasks() && wakenUp.compareAndSet(false, true)肯定是true，除非外部线程唤醒，不会进入，外部线程唤醒，外部线程肯定也执行了selector.wakeup(),我也没看明白楼主表达啥
spring之BeanFactory源码解析
高某某。。: 你好，请问一下为什么他beanFacotry一般创建的时候不调用getObject对象，添加了一个&，他这样做的目的是什么啊
Rocketmq 故障延迟源码解析
Java识堂: 最新的代码已经改了
netty之wakeup详解
liushangzaibeijing: 没看懂这个变量干嘛的
Rocketmq 故障延迟源码解析
hello vian: 感觉最后的地方应该是 !mq.getBrokerName().equals(lastBrokerName)

提示

确定要删除当前文章？

取消删除