- 博客(102)
- 收藏
- 关注
原创 LLM 笔记 —— 08 Embeddings(One-hot、Word、Word2Vec、Glove、FastText)
本文介绍了四种常见的文本表示方法:One-hot编码、Word Embeddings、Word2Vec和FastText。One-hot编码通过创建对角矩阵表示分类变量,避免数值间的序关系误导模型。Word Embeddings将词汇转化为数字向量,通过神经网络优化词向量表示。Word2Vec(包括CBOW和Skip-gram)利用上下文信息构建词向量,并通过负采样提高效率。Glove引入全局共现矩阵捕获词间关系。FastText通过子词结构解决未登录词问题,提升词向量质量。这些方法各具优势,为自然语言处理
2025-10-12 17:29:16
910
原创 LLM 笔记 —— 07 Tokenizers(BPE、WordPeice、SentencePiece、Unigram)
本文介绍了四种主流的分词器算法: BPE分词器:通过统计高频子词对逐步扩充词汇表,将常见字符组合合并为新词元。 WordPiece分词器:类似BPE但采用概率评分机制,优先合并互信息高的子词对,非词首字符添加特殊标记。 SentencePiece分词器:直接处理原始字符流(含空格),适用于无空格语言(如中文),通过下划线保留空格信息。 Unigram分词器:基于统计语言模型,从大词汇表开始迭代剪枝,保留使语料概率损失最小的词元。 各算法核心差异体现在词汇表构建策略与合并规则上,BPE/WordPiece采用
2025-10-12 17:17:36
1096
原创 Attention is All You Need,一文速通 Transformer 基本架构!(Tokenization、Embedding、Attention、Feed Forward)
目前,流行的大型语言模型训练时的框架为和Pytorch,但是,在模型的演变历史当中,采用了各式各样的类神经网络框架。
2025-10-12 17:06:25
1396
原创 LLM 笔记 —— 05 有关影像的生成式 AI
本文系统介绍了生成式AI在影像处理中的技术原理与应用。主要内容包括:1)影像生成AI的五大类型:图文互转、影像修复、语音生成影像等;2)AI处理影像的机制,通过神经网络对像素进行多维压缩编码;3)训练方法,如使用LAION等开源数据集进行patch接龙训练,并引入CLIP模型评估质量;4)文字生成影片的挑战与优化方案,包括减少Attention运算和分步处理;5)四大经典生成方法(VAE、扩散模型等)及其"脑补"机制,通过联合训练实现信息抽取与生成。文章还探讨了个性化图像生成等前沿应用。
2025-10-11 21:51:46
738
原创 LLM 笔记 —— 04 为什么语言模型用文字接龙,图片模型不用像素接龙呢?
生成式AI通过自回归(AR)和非自回归(NAR)两种方式生成内容。AR通过逐步"接龙"生成文字、图像或声音,但效率较低;NAR可同时生成多个部分,但存在多模态问题。解决方案包括:1)结合AR和NAR,先用AR生成精简版本,再由NAR扩展;2)使用Auto-Encoder压缩数据;3)采用多次NAR迭代优化。此外,投机解码(Speculative Decoding)技术通过预测后续token来加速语言模型生成。这些方法在不同场景下各有优势,共同推动生成式AI的发展。
2025-10-11 21:41:37
840
原创 LLM 笔记 —— 03 大语言模型安全性评定
本文探讨了大型语言模型的四个关键问题:1)错误信息问题,可通过事实核查和有害词检测补救;2)固有偏见问题,提出了使用红队模型检测偏见的方法;3)AI生成内容识别难题,讨论了分类和水印技术;4)模型安全风险,分析了越狱攻击和提示注入等攻击手段。文章通过实验数据展示了这些问题的存在,并简要讨论了可能的解决方案,但指出这些领域仍存在优化空间。
2025-10-02 19:35:32
709
原创 LLM 笔记 —— 02 大语言模型能力评定
本文探讨了评估语言模型性能的不同方法及其局限性。对于选择题,模型输出可能包含文字、概率或推断,难以标准化评判;开放性问题则更难统一标准。解决方案包括wit人类评审、使用更强模型模型(如GPT-4)评判,但需注意"内卷"(过长输出)的影响。测试应涵盖多样化任务(如BIG-bench中的200多个特定任务)或专项能力(如长文理解)。此外,研究表明语言模型可能为达成目标而降低道德标准,心智理论能力较弱,且存在记忆训练数据的问题。还需考虑价格、速度等实际因素。评估需综合多种方法,避免单一标准带来
2025-10-02 19:29:07
652
原创 LLM 笔记 —— 01 大型语言模型修炼史(Self-supervised Learning、Supervised Learning、RLHF)
在第二个阶段,人类比较辛苦,需要收集大量的资料来告诉模型什么是对的,而到了第三阶段,人类比较轻松,模型对某个问题会给出两个答案,人类只需要判断哪个答案更好一些即可。大型语言模型在训练的过程中,需要不断调整超参数以实现效果的最佳化,因为训练可能会失败,需要更换一组超参数重新训练,超参数的数量是上亿级的,需要大量的算力支持。但是,过度跟虚拟人类学习,训练出来的结果也是有偏差的,今天一些大语言模型的一些不尽如人意的行为,可能就是过度跟虚拟人类学习的结果。吗,答案是不行,我们没有高质量资料,不过,可以对。
2025-10-02 19:22:01
888
原创 JavaWeb 课堂笔记 —— 26 SpringBoot 原理
摘要: SpringBoot通过起步依赖和自动配置简化了开发流程。起步依赖利用Maven的依赖传递特性,减少pom.xml配置;自动配置则在应用启动时自动将Bean注册到IOC容器,省去手动声明。其核心原理包括: 组件扫描(@ComponentScan)和导入机制(@Import),支持加载第三方依赖; 条件装配(如@ConditionalOnClass)动态控制Bean的注册; 注解驱动(@SpringBootApplication整合配置类、扫描与自动配置)。 掌握这些机制能提升开发效率,理解框架设计思
2025-09-28 20:40:19
320
原创 JavaWeb 课堂笔记 —— 25 Bean 的管理类
SpringBoot配置与Bean管理总结 SpringBoot支持properties、yml/yaml三种配置文件格式,优先级依次递增。除了配置文件外,还支持Java系统属性和命令行参数配置,且命令行参数优先级最高。项目打包后可通过java命令设置参数运行jar包。 Spring默认在启动时创建所有单例非延迟加载的Bean并存入IOC容器,可通过ApplicationContext的getBean方法获取Bean,支持按名称、类型或两者结合三种方式获取。 Bean支持五种作用域,通过@Scope注解配置
2025-09-28 20:35:04
900
原创 JavaWeb 课堂笔记 —— 24 AOP 面向切面编程
本文介绍了Spring AOP的基本概念与实现方式。AOP(面向切面编程)通过动态代理机制对特定方法进行编程,解决代码重复性问题。文章以统计方法执行耗时为例,演示了Spring AOP的快速入门步骤:导入依赖、编写切面类、定义切入点表达式。核心概念包括连接点、通知、切入点等,并详细讲解了AOP的执行流程和五种通知类型。此外,还介绍了通知顺序规则、切入点表达式语法(@execution和@annotation)及其通配符使用技巧,提出了书写切入点表达式的优化建议。最后展示了如何通过自定义注解实现更灵活的AOP
2025-09-28 20:29:03
908
原创 JavaWeb 课堂笔记 —— 23 事务管理
本文介绍了Spring事务管理的基本概念和应用。事务是一组原子性操作,通过@Transactional注解实现。文章以解散部门为例,展示了事务的回滚机制(rollbackFor)和传播行为(propagation)。重点说明了当需要将不同操作分离为独立事务时,使用REQUIRES_NEW传播行为的重要性。通过日志记录案例,演示了如何确保关键操作不受主事务异常影响。这些机制有效解决了数据一致性问题,是Spring事务管理的核心功能。
2025-09-28 20:17:25
456
原创 JavaWeb 课堂笔记 —— 22 登录校验
本文介绍了JavaWeb中的过滤器Filter和拦截器Interceptor在登录校验中的应用。主要内容包括:1) Filter过滤器的作用与快速入门,通过@WebFilter注解配置拦截路径;2) Filter过滤器链的执行顺序;3) 登录校验实现步骤,包括获取请求URL、判断登录操作、校验Token令牌等;4) Interceptor拦截器的基本概念与快速入门方法。通过代码示例演示了如何实现登录校验功能,并对比了Filter和Interceptor的区别,两者均可用于请求拦截和统一处理,但Interce
2025-09-28 19:29:32
662
原创 JavaWeb 课堂笔记 —— 21 登录认证
文章摘要:本文介绍了Tlias智能学习辅助系统的登录功能实现与登录校验机制。登录功能通过POST请求验证用户名密码,成功后发放JWT令牌;登录校验采用统一拦截方式,通过JWT令牌验证用户状态。同时对比了两种会话跟踪技术:客户端Cookie和服务端Session,分别展示了设置和获取方法。文章还提供了SQL查询语句、接口测试结果和代码实现示例,完整呈现了系统认证模块的开发流程。
2025-09-28 19:18:30
851
原创 JavaWeb 课堂笔记 —— 20 SpringBootWeb案例 配置文件
本文是JavaWeb学习笔记,基于黑马程序员教程,详细介绍了查询回显和修改员工的实现流程。通过GET/PUT请求实现员工信息查询与修改,包含SQL语句、MyBatis配置及前后端联调测试。同时讲解了参数配置化方法,比较了properties与yml配置文件的差异,并演示如何将properties转为更简洁的yml格式。最后引入@ConfigurationProperties注解解决多属性注入问题,提升开发效率。教程涵盖SpringBoot项目配置、MyBatis日志输出等实用技巧,适合JavaWeb初学者参
2025-09-28 19:06:47
321
原创 JavaWeb 课堂笔记 —— 19 SpringBootWeb案例 文件上传
本文摘要了JavaWeb开发中的文件上传功能实现过程。内容涵盖:1) 新增员工功能的RESTful接口设计与实现;2) 前端文件上传的三要素(file表单项、POST方法、multipart编码);3) 服务端通过MultipartFile接收文件,并演示临时文件处理;4) 本地存储方案实现及UUID防重名优化。文章采用代码片段+截图的方式,详细展示了从接口定义到前后端联调的完整开发流程,适合JavaWeb初学者参考学习。
2025-09-21 19:19:16
849
原创 JavaWeb 课堂笔记 —— 18 SpringBootWeb案例 员工管理
本文是JavaWeb学习笔记,基于黑马程序员的教程,主要讲解分页查询和条件分页查询的实现。文章首先介绍SQL分页语法和参数计算方法,然后详细说明后端开发流程:通过PageBean封装分页数据,使用MyBatis注解编写Mapper层查询,在Service层实现分页逻辑,并在Controller接收参数。特别介绍了分页插件PageHelper的简化用法,最后扩展实现带条件的动态分页查询,包括时间参数处理等注意事项。所有代码示例均配有详细注释,并展示了Postman测试和前后端联调过程。
2025-09-21 19:09:34
405
原创 JavaWeb 课堂笔记 —— 17 SpringBootWeb案例 部门管理
本文介绍了JavaWeb开发学习笔记,基于黑马程序员教程,涵盖Spring+MyBatis等框架。主要内容包括:1)环境搭建,创建SpringBoot项目并引入相关依赖;2)数据库准备,创建部门表和员工表并插入测试数据;3)项目结构配置,设置三层架构基础(Mapper、Service、Controller)。文章提供了详细的SQL建表语句和SpringBoot项目创建步骤,适合JavaWeb初学者参考学习企业级开发流程。
2025-09-21 18:38:28
711
原创 Javase 高级技术 —— 02 注解
本文介绍了Java注解的基本概念与使用方法。首先解释了注解是Java代码中的特殊标记,可用于方法、类等元素,并演示了如何自定义注解。重点讲解了元注解@Target和@Retention的作用,以及如何通过反射机制解析注解内容。最后通过一个模拟Junit框架的案例,展示了注解在实际开发中的应用场景,包括定义注解、标记方法以及通过反射调用被注解标记的方法。文章内容涵盖了注解的定义、使用和解析全流程,适合Java初学者学习注解相关知识。
2025-09-21 18:18:38
292
原创 Javase 高级技术 —— 01 反射
本文介绍了JavaSE中的单元测试和反射技术。单元测试部分讲解了Junit框架的优势,包括自动化测试和生成测试报告。反射部分详细说明了如何通过三种方式获取Class对象(类名.class、Class.forName、对象.getClass()),并演示了如何获取和操作类的构造器、成员变量和方法。文中通过Dog类实例展示了反射的具体应用,包括暴力反射访问私有成员、调用方法等操作。这些技术为Java开发提供了更灵活的编程方式,特别适合框架开发和动态调用场景。
2025-09-21 18:14:32
284
原创 Javase 基础加强 —— 12 网络编程
本文介绍了Java网络编程的基础知识,主要包括CS/BS架构、IP地址、端口、通信协议等核心概念。重点讲解了UDP协议的特点和实现方式,提供了客户端和服务端的示例代码。文章还涉及TCP/IP网络模型、三次握手/四次挥手等关键技术,帮助读者理解Java网络编程的基本原理和应用场景。通过学习这些内容,读者可以掌握Java网络编程的基础技能,为开发网络应用程序打下坚实基础。
2025-09-21 18:05:45
769
原创 Javase 基础加强 —— 11 线程池
本文介绍了Java线程池的基本概念和使用方法。主要内容包括:线程池的创建(通过ThreadPoolExecutor或Executors工具类)、处理Runnable任务(使用execute方法)和处理Callable任务(使用submit方法)。文章通过代码示例演示了线程池的核心参数配置、任务提交方式以及线程复用机制,并解释了线程池的工作流程(核心线程、任务队列、临时线程的关系)和拒绝策略。最后展示了如何通过Future对象获取Callable任务的执行结果。这些知识对于优化多线程性能和资源管理具有重要意义
2025-09-21 17:55:59
451
原创 Javase 基础加强 —— 10 多线程
摘要:本文介绍了Java多线程编程的基础知识,包括线程概念、三种创建线程的方式(继承Thread类、实现Runnable接口、实现Callable接口)、常用线程方法以及线程安全问题。通过代码示例详细演示了每种线程创建方式的具体实现,并讲解了线程命名、休眠(sleep)、插队(join)等操作。最后指出当多个线程同时操作共享资源时可能导致的线程安全问题,为后续学习线程同步机制打下基础。 (字数:148字)
2025-09-21 17:50:01
377
原创 Leetcode 刷题记录 21 —— 技巧
本文总结了Leetcode刷题技巧中的四个经典问题:1)利用位运算找唯一数字;2)哈希法求多数元素;3)两次遍历排序三色数组;4)寻找下一个排列的算法。每个问题都给出了简洁的解决思路和关键代码实现,涵盖了位运算、哈希表、双指针等技术要点。这些方法在时间复杂度上均达到最优,适合面试快速解题。
2025-09-11 22:41:49
719
原创 Leetcode 刷题记录 20 —— 多维动态规划
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-06-16 22:19:40
376
原创 Leetcode 刷题记录 19 —— 动态规划
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-06-16 22:16:08
416
原创 Leetcode 刷题记录 18—— 贪心算法
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-06-16 22:03:12
438
原创 Leetcode 刷题记录 17 —— 堆
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-06-16 22:00:58
500
原创 Leetcode 刷题记录 16 —— 栈
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-06-15 23:16:04
403
原创 Leetcode 刷题记录 15 —— 二分查找
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-06-15 23:12:56
372
原创 Leetcode 刷题记录 14 —— 回溯
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-06-15 23:09:28
1130
原创 Leetcode 刷题记录 13 —— 图论
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-06-15 23:00:58
1075
原创 Leetcode 刷题记录 12 —— 二叉树第三弹
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-06-15 22:54:39
1106
原创 Javase 基础加强 —— 09 IO流第二弹
本系列为笔者学习Javase的课堂笔记,视频资源为B站黑马程序员出品的《黑马程序员Java+AI智能辅助编程全套视频教程,java零基础入门到大牛一套通关》,章节分布参考视频教程,为同样学习Javase系列课程的同学们提供参考。
2025-05-25 21:28:29
449
原创 Javase 基础加强 —— 08 IO流
本系列为笔者学习Javase的课堂笔记,视频资源为B站黑马程序员出品的《黑马程序员Java+AI智能辅助编程全套视频教程,java零基础入门到大牛一套通关》,章节分布参考视频教程,为同样学习Javase系列课程的同学们提供参考。
2025-05-25 21:22:21
400
原创 Javase 基础加强 —— 07 File
本系列为笔者学习Javase的课堂笔记,视频资源为B站黑马程序员出品的《黑马程序员Java+AI智能辅助编程全套视频教程,java零基础入门到大牛一套通关》,章节分布参考视频教程,为同样学习Javase系列课程的同学们提供参考。
2025-05-25 21:18:16
645
原创 Leetcode 刷题记录 11 —— 二叉树第二弹
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-05-25 21:11:11
1084
原创 Leetcode 刷题记录 10 —— 二叉树
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-05-25 21:03:50
759
原创 Leetcode 刷题记录 09 —— 链表第三弹
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-05-07 23:35:39
908
原创 Leetcode 刷题记录 08 —— 链表第二弹
本系列为笔者的 Leetcode 刷题记录,顺序为 Hot 100 题官方顺序,根据标签命名,记录笔者总结的做题思路,附部分代码解释和疑问解答,01~07为C++语言,08及以后为Java语言。
2025-05-06 21:26:41
524
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅