- 博客(59)
- 资源 (17)
- 收藏
- 关注
原创 大模型中的temperature参数是什么
咱可以把大模型想象成一个特别会聊天的朋友。这个朋友在回答你问题的时候,它脑袋里有好多好多可能的回答。学术文献摘要学术文献摘要要精准概括核心内容。temperature参数设低,大概0.2 - 0.3。低参数能保证大模型提取出最重要、最准确的信息,不会添加一些不必要的内容。新闻摘要新闻摘要也需要准确传达关键信息,参数在0.3 - 0.5。这样既能概括主要内容,又不会丢失重要细节,同时也不会因为参数过大而产生不准确的表述。
2025-05-11 07:30:00
1226
原创 大模型中的top_k参数是什么
举个更具体的例子,假如大模型在回答一个问题,它想出了100个可能的答案。设置top_k = 10,那模型就只会在这概率最高的10个答案里面去进一步考虑,然后选出它觉得最合适的那个作为最终回答。这个top_k参数呢,就像是你要从这堆苹果里挑出几个最好的苹果。k 就是你要挑出的苹果的数量。top_k参数就是让模型只考虑其中概率最高的k个结果。简单总结一下,top_k参数就是让大模型在众多可能结果里,只关注概率最高的k个结果的这么一个设置。假设top_k = 1 ,这就好比你从一堆苹果里只挑1个最好的苹果。
2025-05-10 07:30:00
1111
原创 大模型中的top_p参数是什么
举个例子。假如你问大模型:“今天中午吃什么?“米饭”,可能性 0.3“面条”,可能性 0.2“饺子”,可能性 0.15“披萨”,可能性 0.1“汉堡”,可能性 0.08“寿司”,可能性 0.07等等好多好多其他吃的现在假设 top_p 设定为 0.7。从可能性最高的 “米饭” 开始加,0.3。再加上 “面条” 的可能性,0.3 + 0.2 = 0.5。接着加上 “饺子” 的可能性,0.5 + 0.15 = 0.65。
2025-05-09 07:30:00
879
原创 什么是 低秩自适应算法(LoRa: Low-Rank Adaptation of Large Language Models)
低秩自适应算法就是在一些情况里,让东西能根据实际状况变成低秩矩阵的算法。打个比方,你家里有个特别大的书架,上面摆满了各种各样的书。一开始,这些书的摆放乱七八糟,就好像一个普通的大矩阵,里面信息很杂乱。但是后来你想整理一下,你发现好多书其实主题差不多,内容有很多重复或者关联性很强。你就决定把这些类似的书归到一起,只保留最能代表这一类书的几本,其他重复的就不摆出来了。这时候,书架上的书就变得更有条理,就好像变成了一个低秩矩阵。这个从乱七八糟的书到有条理摆放的过程,就有点像低秩自适应。
2025-04-25 07:30:00
764
原创 什么是 低秩矩阵(Low-Rank)
咱先来理解啥是“秩”。可以把矩阵想象成一个数字组成的大表格。秩呢,简单说就是这个表格里“真正有用”的行或者列的数量。比如说,你有一个表格记录了很多人的信息,有姓名、年龄、性别,还有一列全是0(比如记录一些从来没用到过的神秘代码),那这列全是0的对于表达这些人的信息其实没啥用。这个表格真正有用的列数就是它的“秩”。那低秩矩阵就是这个“秩”比较小的矩阵。也就是说,这个数字表格里,真正起作用的行或者列不多。
2025-04-24 18:30:00
905
原创 什么是 随机裁剪(Random Crop)
随机裁剪呢,简单说就是在一张图片或者一个东西上,随机地选一块区域给剪下来。给你举个生活中的例子哈。比如说你有一张很大的全家福照片,照片里有好多人,还有各种背景。现在让你随机裁剪。那就好比你闭上眼睛,随便在照片上画一个小方块(这个小方块就是裁剪的区域),然后把这个小方块里的画面剪下来。每次你闭上眼睛画的小方块位置都可能不一样,这就是随机的意思。在计算机图像处理里也是类似。计算机要处理一张图片的时候,它就按照一定的规则,随机在这张图片上选取一个矩形的区域,然后把这个区域的图像保留下来,这就是随机裁剪。
2025-04-24 07:30:00
1042
原创 什么是 金字塔缩放(Multi-scale Input)
想象一下,你有一堆不同大小的照片。最小的照片只能看清一个大概轮廓,稍微大一点的照片能看清一些细节,最大的照片就能看清超级多的细节了。在计算机处理图像或者数据的时候,也会用到类似的办法。金字塔缩放就是把数据或者图像,按照不同的大小(尺度)来处理。就好比盖金字塔,最下面是最大、最完整的数据或者图像,细节满满,然后一层一层往上,数据或者图像变得越来越小,细节也越来越少。这样做有啥好处呢?
2025-04-22 23:13:32
1329
原创 若依前后端分离框架——生成数字验证码功能源码学习
使用版本:Ruo-Vue 3.8.0项目地址:https://gitee.com/y_project/RuoYi-Vue
2021-12-22 15:08:14
2392
原创 若依前后端分离框架——初始化参数功能源码学习
版本:Ruo-Vue 3.8.0项目地址:https://gitee.com/y_project/RuoYi-Vue0:初始化参数时序图1:init()初始化代码位置:com.ruoyi.system.service.impl.SysConfigServiceImpl#init@PostConstructpublic void init(){ loadingConfigCache();}@PostConstruct :@PostContruct是Java自带的注解,在方法上加
2021-12-22 09:20:55
1465
原创 什么是IoC?
IoC全称Inversion of Control,翻译为“控制反转”。要理解控制需要了解以下四个问题:谁控制谁控制什么为何是反转哪些方面反转了IoC定义所谓IoC,就是由Spring IoC容器来负责对象的生命周期和对象之间的关系使用场景:需要获取对象的时候原有的获取对象的方式:使用new Object()来创建一个对象。使用了IoC之后:由IoC容器给你分配一个对象。当多个地方需要获取相同的类的对象的时候,如果主动创建对象就会创建出多个对象。而使用IoC的话
2021-10-26 22:40:09
5777
原创 常用的函数接口
序号接口描述1BiConsumer<T,U>代表了一个接受两个输入参数的操作,并且不返回任何结果2BiFunction<T,U,R>代表了一个接受两个输入参数的方法,并且返回一个结果3BinaryOperator代表了一个作用于于两个同类型操作符的操作,并且返回了操作符同类型的结果4BiPredicate<T,U>代表了一个两个参数的boolean值方法5BooleanSupplier代表了boolean值...
2021-04-30 15:35:21
224
1
原创 如何解决SpringMVC接收到的请求参数为乱码的问题
如何解决SpringMVC接收到的请求参数为乱码的问题Get请求直接设置tomcat目录下conf/server.xml文件,添加编码为utf-8<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="utf-8"/>Post请求原理请求参数为乱码主要是因为编码的问题。需要在w
2020-12-20 21:09:27
1192
原创 nacos实现服务注册与两种消费方式
nacos实现服务注册与两种消费方式运行nacos服务注册实例两种服务消费方式RestTempletFeign测试参考运行nacos预备环境:64位操作系统、64位JDK1.8+、Maven 3.2.x+启动服务器:Linux:sh startup.sh -m standaloneWindows:cmd startup.cmd测试:登录网址:http://localhost:88...
2019-05-21 16:17:28
10187
原创 认识微服务
认识微服务维基百科的定义为什么服务化什么是微服务微服务引入的架构复杂度Cloud-Platform是如何解决微服务的复杂性问题维基百科的定义 微服务的概念最早是在2014年由Martin Fowler和James Lewis共同提出,他们定义了微服务是由单一应用程序构成的小服务,拥有自己的进程与轻量化处理,服务依业务功能设计,以全自动的方式部署,与其他服务使用HTTP API通讯。为什么服...
2019-05-20 14:22:56
508
原创 单例模式
文章目录概述单例模式的作用解决方案实现单例模式的两种方式饿汉模式懒汉模式如何选择扩展单例模式下的线程安全问题多例模式概述单例模式的作用单件模式能够保证某一类型对象在系统中的唯一性,即某类在系统中只有一个实例。解决方案在类中创建一个类的静态变量(用于保存实例)创建一个没有参数的构造函数,设置为private(让用户无法创建实例)创建一个返回实例的方法(让类自身进行实例创建,用户调用这...
2019-04-26 11:59:50
165
原创 企业级大数据技术体系概述
本篇文章是对《大数据技术体系详解:原理、架构与实践》(作者:董西成 )一书的第一章节的整理。文章目录常见使用场景企业级大数据技术框架数据收集层特点数据存储层特点资源管理与服务协调层优点计算引擎层分类Hadoop与Spark开源大数据技术栈大数据架构LA架构推荐系统常见使用场景互联网领域搜索引擎:帮助人们在大数据集上快速检索信息推荐系统:能够在用户没有明确目的的时候根据用户历史行为...
2019-03-27 09:15:10
1812
转载 Maven内置变量说明
Maven内置变量说明:${basedir} 项目根目录 ${project.build.directory} 构建目录,缺省为target ${project.build.outputDirectory} 构建过程输出目录,缺省为target/classes ${project.build.finalName} 产出物名称,缺省为${project.artifactId}-${proj...
2019-03-26 17:55:43
562
原创 2.https和ssl
httpshttps是什么为什么要使用httpshttps流程https握手https数据传输ssl对称加密非对称加密ssl单向双向认证单向认证双向认证ssl的重连握手过程会话缓存握手过程如何验证证书的有效性httpshttps是什么https协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议...
2018-09-14 11:37:36
832
原创 三点定位
代码// 三点定位function ThreePointOrientation(A, B, C) { var a = [A, B, C]; var delta = -1; var intersects = []; intersect(A, B); checkPoint(C); return intersects; // 计算两个圆的交点
2017-06-01 18:04:41
4356
10万单词库txt版本
2020-06-08
Java经典入门教程pdf
2015-07-15
Spring Boot + Spring Session + Redis
2016-11-14
portalTlv封装包
2017-04-25
spring_boot基础Demo
2016-11-11
西加云杉本地跳转AAA认证配置文件
2017-04-25
西加云杉设备上下线DEMO
2017-04-25
WebSphere MQ Using Java 中文版
2017-01-23
spring-boot-thymeleaf DEMO
2016-12-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅