- 博客(70)
- 收藏
- 关注
原创 Qdrant向量数据库
在提供的上下文约束下,检索与给定目标最相似的点。上下文搜索:当仅提供上下文(没有目标)时,将使用成对的点来生成损失,从而将搜索引导至大多数正例重叠的区域。一个点可以获得的最高分数是 0.0,这意味着许多点的分数可能是 0.0。目标搜索:当提供目标(有或没有上下文)时,分数由两部分组成:整数部分表示相对于上下文的排名,小数部分与与目标的距离有关。如果点更接近正例而不是反例,则每对的上下文分数为 +1,否则为 -1。根据向量相似性和给定的过滤条件检索最近点,并按给定的有效载荷字段分组。
2025-03-24 13:31:59
1926
原创 向量数据库基础
实例是腾讯云中独立运行的数据库环境,是用户购买向量数据库服务的基本单位,以单独的进程存在。一个数据库实例可以包含多个由用户创建的数据库。
2025-03-17 10:25:14
2176
原创 软件设计师:软件工程
可靠性是指一个系统对于给定的时间间隔内、在给定的条件下无失效运作的概率。可以用MTTF/(1+MTTF)来度量,其中MTTF为平均无故障时间。可用性是在给定的时间点上,一个系统能够按照规格说明正确运作的概率,可以用MTBF/(1+MTBF)来度量,其中MTBF为平均失效间隔时间。可维护性是在给定的使用条件下,使用规定的过程和资源完成维护活动的概率。可以用1/(1+MTTR)来度量,其中MTTR为平均修复时间。自顶向下集成不需要驱动模块,自底向上不需要桩模块。检测模块接口、局部数据结构。
2024-10-21 21:44:18
2642
原创 软件设计师:系统开发与运行
判断依据:1、数据流的两端必须有一个是加工2、加工最少要有一个输入数据流和一个输出数据流3、数据流名称在题中不能重名3.1、依赖关系只要在方法局部变量、方法参数位置、方法返回值处使用了另外的类,他们就产生了依赖关系3.2、实现关系3.3、泛化关系3.4、关联关系单向关联跟依赖差不多,不过单向关联的依赖性更强一点
2024-10-14 14:49:15
2057
原创 软件设计师:03操作系统原理
特别注意:这里的磁头它旋转的时候是不会停下来的,也就是在处理记录的时候磁头还是会继续往下转,而不会留下来等记录处理完。顺序处理:(单个读取时间+单个处理时间+X)*(物理块数量-1) + (单个读取时间+单个处理时间)依次类推到倒数第二个记录I结束需要(单个读取时间+单个处理时间+X)*(物理块数量-1)最后的H记录起始位置读取完毕之后再执行处理时间便结束(单个读取时间+单个处理时间)优化处理:(单个读取时间+单个处理时间)*物理块数量。读取A记录需要(单个读取时间+单个处理时间+X)
2024-10-07 12:20:32
2169
原创 软件设计师:02程序语言设计
源程序 -》 词法分析 -》 记号流 -》语法分析 -》语法树 -》语义分析。分析构成程序的字符,及由字符按照构造规则构成的符号是否符合程序语言的规定。编译时独立生成目标程序,源程序和编译程序不参与目标程序的运行过程。记录程序中各个符号的必要信息,以辅助语义的正确性检查和代码生成。编译时不生成独立的目标程序,解释程序和源程序都参与程序运行过程。语法结构错误, if、endif不匹配,缺分号。对每个状态来说,识别字符后转移的状态是不唯一的。对每个状态来说,识别字符后转移的状态是唯一的。
2024-09-30 09:35:41
1770
原创 软件设计师:01计算机组成与结构
解析:内存容量为4GB =》 2^32 B ,所以地址总线宽度是32。位于cpu和主存之间,对程序员透明,cache容量越大,命中率越高。I/O设备发中断信号,向CPU报告,两者并行工作、CPU利用率高。CPU需要一直轮询检查,长时间处于忙等状态,利用率低。仅需要在传送数据块的开始和结束时才需要CPU的干预。在信息传输过程中、附加一些用于检错和纠错的信息。cache与主存之间的映射是 硬件自动 完成的。全相联映射 –> 组相联映射 –> 直接映射。运算器、控制器、寄存器、内部总线。
2024-09-23 18:06:10
1910
原创 ElasticSearch入门到掌握,用心看完这三篇就够了【完结2】
elasticsearch 支持对搜索结果排序,默认是根据相关度算分( _score )来排序。可以排序字段类型有: keyword类型、数值类型、地理坐标类型、日期类型等。全文检索的 match 和 multi_match 查询与 match_all 的 API 基本一致。当我们利用 match 查询时,文档结果会根据与搜索词条的关联度打分( _score ),返回结果时按照分值降序排列。所以不会对搜索条件分词。布尔查询是一个或多个查询子句的组合。算分函数查询,可以控制文档相关性算分,控制文档排名。
2024-09-02 15:46:29
2800
原创 开发团队如何应对突发的技术故障和危机
在数字化时代,软件服务的稳定性至关重要。然而,即便是像网易云音乐这样的大型平台,也难免遇到突发的技术故障。8月19日下午,网易云音乐疑似出现服务器故障,网页端出现502 Bad Gateway 报错,且App也无法正常使用。面对这类情况,开发团队该如何快速响应、高效解决问题,并从中吸取教训以防患未然?又该如何在日常工作中培养团队应对突发事件的能力?让我们一起探讨如何在技术风暴中站稳脚跟,提升团队的应急处理能力吧!在面对突发技术故障时,快速响应和准确的问题定位至关重要。方向二:建立健全的应急预案和备份机制。
2024-09-01 16:58:05
1166
原创 大白话单元测试之mock测试
Mock通常是指,在测试一个对象A时,我们构造一些假的对象来模拟与A之间的交互,而这些Mock对象的行为是我们事先设定且符合预期。这什么意思呢?就是指在测试一个单元方法的时候,我们不想加载其他的类,默认其他类的功能是正常的,只测试这个方法。好吧,我知道其实还是不太明白,那么请看示例。
2024-08-19 13:33:41
3917
原创 Apache Hive详解
Apache Hive是一款建立在Hadoop之上的开源数据仓库系统,可以将存储在Hadoop文件中的结构化、半结构化数据文件映射为一张数据库表,基于表提供了一种类似SQL的查询模型,称为Hive查询语言(HQL),用于访问和分析存储在Hadoop文件中的大型数据集。Hive核心是将HQL转换为MapReduce程序,然后将程序提交到Hadoop集群执行。Hive由Facebook实现并开源。Hive利用HDFS存储数据,利用MapReduce查询分析数据。
2024-08-12 09:57:55
3253
原创 大数据技术之Hadoop(YARN)
Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的Hadoop资源管理器。YARN是一个通用资源管理系统和调度平台,可为上层应用提供统一的资源管理和调度。它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。
2024-08-05 15:47:55
2074
原创 大数据技术之Hadoop(MapReduce)
分布式计算是一种计算方法,和集中式计算是相对的。Hadoop MapReduce是一个分布式计算框架,用于轻松编写分布式应用程序,这些应用程序以可靠,容错的方式并行处理大型硬件集群(数千个节点)上的大量数据(多TB数据集)。MapReduce是一种面向海量数据处理的一种指导思想,也是一种用于对大规模数据进行分布式计算的编程模型。
2024-07-29 10:37:23
2325
原创 大数据技术之Hadoop(HDFS)
文件系统是一种存储和组织数据的方法,实现了数据的存储、分级组织、访问和获取等操作,使得用户对文件访问和查找变得容易;文件系统使用树形目录的抽象逻辑概念代替了硬盘等物理设备使用数据块的概念,用户不必关心数据底层存在硬盘哪里,只需要记住这个文件的所属目录和文件名即可;比如windows操作系统数据:指存储的内容本身,比如文件、视频、图片等元数据:又称之为解释性数据,记录数据的数据;一般指文件大小、最后修改时间、底层存储位置、属性、所属用户、权限等信息。Hadoop分布式文件系统。
2024-07-22 09:41:58
3495
原创 Sentinel限流算法总结
之所以叫漏桶算法,就是把请求看做水,队列看做是一个漏了的桶。因此,在使用令牌桶算法时,尽量不要将令牌上限设定到服务能承受的QPS上限。设置一个窗口的大小,然后窗口是匀速往前滑动的,在一段时间范围内,请求落在同一个窗口的数量大于窗口阈值,就拒绝该请求。在限流的时候,要统计每秒钟的QPS,同样是计数。漏桶的优势就是流量整型,不管并发量如何波动,经过漏桶处理后的请求一定是相对平滑的曲线。Sentinel中的热点参数限流正是基于令牌桶算法实现的。基于令牌桶算法,每秒产生的令牌数量基本就是QPS上限。
2024-07-02 14:06:25
2086
1
原创 分布式事务之Seata框架
传统的单体项目被拆分成多个微服务,一个完整的流程可能涉及到多个服务之间的调用,多个服务的入库操作,为了满足事务的ACID原则,提出了分布式事务。
2024-06-25 13:59:11
2220
原创 2024年,计算机相关专业还值得选择吗?
随着2024年高考落幕,数百万高三学生又将面临人生中的重要抉择:选择大学专业。在这个关键节点,计算机相关专业是否仍是“万金油”的选择?在过去很长一段时间里,计算机科学与技术、人工智能、网络安全、软件工程等专业一直以来是炙手可热的存在,吸引了大批学生前往。然而,随着行业竞争加剧和市场饱和度提高,该类专业是否仍具有长远的发展潜力和就业前景呢?
2024-06-20 14:32:53
422
原创 普通人当前可以入局AIGC行业吗
近年来,人工智能、大数据和云计算等领域的高速发展,使得AIGC(人工智能、大数据、云计算)行业成为一个备受瞩目的领域。他们负责从市场需求和技术可行性的角度,制定人工智能产品的策略和路线图,并协调各个团队的工作。数据工程师是负责处理和管理大数据的专家。他们使用各种工具和技术来收集、清洗和存储海量的数据,并为数据科学家和机器学习工程师提供可靠的数据支持。总的来说,AIGC行业的前景非常广阔,将对社会经济的各个领域产生巨大的影响。随着技术不断进步和应用的拓展,AIGC行业将继续发展壮大,并带来更多的创新和机会。
2024-06-19 14:24:36
1114
原创 ollama部署本地大模型
本地运行大模型的工具,可以运行Llama 3、Phi 3、Mistral、Gemma和其他型号。定制并创建您自己的型号。
2024-06-18 15:03:18
2670
1
原创 spring整合openAI大模型之Spring AI
Spring AI 是一个面向 AI 工程的应用框架,其目标是将 Spring 生态系统的可移植性和模块化设计等设计原则应用到 AI 领域,并推动将 POJO 作为应用的构建块应用于 AI 领域。简单地说,就是不再需要我们再去封装各种各样的类或者方法,直接用spring框架内置的方法,和大模型进行通信官网地址意思就是在调用聊天模型的时候,预先给他设定好一个角色比如调用聊天接口,他是怎么知道他是java开发工程师的呢?就是通过预先定义角色。
2024-06-17 16:00:40
6921
22
原创 一文搞定Django学习
将临时文件中的建表信息在数据库中执行,执行完语句之后,可以看到数据库中已经存在了app01_userinfo的表。表示创建userInfo表结构,包括name、password、phone、age、email字段。执行完成后可以看到项目中多了一个migrations的文件夹,生成了临时文件。安装完成后目录下会多一个django-admin.exe。(1)利用django-admin.exe创建。在models.py文件中进行操作。在python的控制台执行。(2)pycharm创建。
2024-06-14 10:44:47
2230
原创 pip install太慢了,怎么解决?
例:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyqt5。清华:https://pypi.tuna.tsinghua.edu.cn/simple。
2024-06-13 11:43:56
7122
原创 2024速通python之python高阶技巧
定义双层嵌套函数, 内层函数可以访问外层函数的变量将内存函数作为外层函数的返回,此内层函数就是闭包函数这里的inner就是闭包函数,如果需要修改外层函数的outerNum变量,则需要用nonlocal关键字来声明装饰器其实也是一种闭包, 其功能就是在不破坏目标函数原有的代码和功能的前提下,为目标函数增加新功能。
2024-06-07 13:34:46
1169
原创 2024速通python之python面向对象
章节总览」【2024速通python之python基础 https://blog.youkuaiyun.com/weixin_45404884/article/details/138578955】【2024速通python之python进阶 https://blog.youkuaiyun.com/weixin_45404884/article/details/138663338】
2024-06-05 16:29:08
1729
原创 JVM调优工具命令详解(JVM调优看这一篇就够了)
class name:类名称,[C is a char[],[S is a short[],[I is a int[],[B is a byte[],[[I is a int[][]这个因为之前已经大概知道Young GC的频率,假设是每5分钟一次,那么可以执行命令 jstat -gc pid 300000 10 ,观察每次结果eden,尽量别让对象进入老年。JVM参数,比如堆内存大小,年轻代大小,Eden和Survivor的比例,老年代的大小,大对象的阈值,大龄对象进入老年代的阈值等。
2024-05-14 15:22:55
1336
原创 2024速通python之python进阶
将列表遍历输出# 输出name_list类型字典的定义,同样使用{},不过存储的元素是一个个的:键值对,如下语法:字典内Key不允许重复,重复添加等同于覆盖原有数据。
2024-05-13 15:54:32
2195
1
原创 debug启动测试类报错Command line is too long. Shorten the command line via JAR manifest or via a classpath
Command line is too long. Shorten the command line via JAR manifest or via a classpath file and rerun.
2024-05-08 19:15:52
253
原创 记录一次jar包依赖冲突解决流程
java.lang.NoClassDefFoundError: org/springframework/boot/web/server/WebServerFactoryCustomizer
2024-04-30 17:32:02
530
原创 springboot之Conditional相关注解
当给定的类名在类路径上不存在,则实例化当前Bean。当给定的在bean不存在时,则实例化当前Bean。当给定的类名在类路径上存在,则实例化当前Bean。当给定的在bean存在时,则实例化当前Bean。
2024-04-28 16:25:58
382
原创 Redis发布-订阅模式之Channel的发布订阅
Redis 发布订阅(Pus/Sub)是一种消息通信模式:发送者通过 publish发布消息,订阅者通过 subcribe订阅接收消息或通过unsubcribe取消订阅。主要包含三个部分组成:发布者、订阅者、Channel。发布者和订阅者属于客户端,Channel 是 Redis 服务端,发布者将消息发布到频道,订阅这个频道的订阅者则收到消息。
2024-04-28 16:11:20
1124
3
原创 mybatis之if标签不生效
查看框架执行的sql时发现,下面这串标签一直不生效,sql拼接不上,其中virtualCode 时Boolean类型。删掉后面的字符串判断操作,因为是Boolean类型,只会为null、true、false三种状态。
2024-04-24 11:18:35
665
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人