自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(117)
  • 资源 (3)
  • 收藏
  • 关注

原创 特殊回文串 剪枝法【蓝桥杯算法】(c++代码实现)

上文链接:蓝桥杯之十六进制与十进制互转简化(c++代码实现)资源限制时间限制:1.0s 内存限制:512.0MB问题描述123321是一个非常特殊的数,它从左边读和从右边读是一样的。输入一个正整数n, 编程求所有这样的五位和六位十进制数,满足各位数字之和等于n 。输入格式输入一行,包含一个正整数n。输出格式按从小到大的顺序输出满足条件的整数,每个整数占一行。...

2020-02-07 19:21:03 28372

原创 几天掌握新语言-python【推荐网站】

python快速入门

2025-03-17 13:07:31 167

原创 不要错过系列!!LLM【deepseek、Qwen结构】深度解析

LLM基础结构介绍:https://bbycroft.net/llm模型内置了nano-gpt、gpt-2、gpt-3,展示gpt这种大模型的基础结构。

2025-03-07 20:01:30 611

原创 显卡性能总结-持续更新

NVIDIA A100 单精度FP32指令吞吐 64 FLOPS/Cycle ,核心运行频率为 1.41GHz ,SM 数量为108 ,Tensor Core里面的是融合乘加指令,所以一次指令执行会计算2次(一次乘法一次加法),因此会乘以2。FLOPs:(Floating point operations)缩写,末尾的s表复数,意指浮点运算数,理解为计算量, 主要用来衡量算法/模型的复杂度,比如YOLOv11n模型的FLOPs大概为6.4x10^9。性能较低,适合基本的图形处理任务,如办公和视频播放。

2025-01-09 13:57:02 1864

原创 【LLM】提高NLP问答效果的提示准则

提示词结构清晰特征和信息用户交互和参与内容和语言风格复杂任务及编码提示。

2024-07-17 11:32:23 505

原创 docker安装及部署算法模型项目命令示例-【window及linux通用安装】

注:上面链接中,安装docker可以默认C盘等。登录docker destop即使报错也可使用。docker restart 容器id (stop停止,strat启动)docker commit 容器name/id 镜像名:镜像版本。注:联网下,可直接输入安装命令。安装后可使用命令窗口。docker rmi 镜像id。docker rm 容器id。

2024-07-09 10:53:09 589

原创 【LLM】一分钟带你了解Agent工作流四范式

比如软件开发,一个大模型充当经理,一个大模型充当设计师,一个大模型充当软件开发者。这里大模型充当回答各种问题的工具角色。

2024-06-26 18:03:19 706

原创 llm-大模型落地评测?提供一个领域大模型测评方法

根据不同任务特点和敏感话题、排斥成见、非法竞争、权益侵害、隐私安全、恶意抨击、违法违纪、人身危害、心理危害、负向价值 10 项影响安全的内容,准备有针对性的测试数据集,施加于领域大模型,人工分析各项输出结果,判断是否属于禁止项内容、问题项内容和无问题项内容,最后按照式(6)和式(7)计算有关安全性指标。首字响应时间的评价分数分为6级,满分为5 分。安排足够长的测试时间,考查领域大模型在被测试时段出现的故障次数和每一次故障的恢复时间,分别按照式(8)和式(9)统计可靠性指标 MTBF和可维护性指标MTBR。

2024-06-18 10:47:44 1633

原创 LLM-不要错过,教你如何快速且精准生成提示词?(总结Singapore首届GPT-4提示工程获奖者Sheila Teo博客)

context: 提供任务的背景资料objective: 定义希望LLM执行的任务style: 指定希望LLM使用的协作风格Tone: 设定LLM回应的态度Audience: 确定LLM回答的受众类型Response:提供响应的格式。

2024-06-13 15:38:17 1613

原创 git-本地项目与git连接及上传【快速教程】

【代码】git-本地项目与git连接及上传【快速教程】

2024-06-13 09:37:42 691

原创 宝藏级-LLM-文档级别向量化问答技术总结

文档切割最简单的做法就是根据句子的长度来将进行切割,一般是根据embedding模型的max_seq_len来进行设定的,即chunk_size=max_seq_len, 这样做的好处就是处理简单,文档内容没有重复,但是容易将答案切分到两端passages。在一些学术文档中,比较好办,一般找到文档的所有信息块的中心店坐标即可,用这一组横坐标的极差来判断即可,双栏论文的极差远远大于单栏论文,因此可以设定一个极差阈值。对于单栏文档,按照y坐标升降序就能完成顺序的组织,但是对于双栏文档,就需要进一步的分析处理。

2024-06-06 14:48:36 1807

原创 【算法提升之赛事推荐】蓝桥杯没拿奖?你还有这个比赛的羊毛可以薅

参赛者不仅有机会提升个人算法水平,更有机会赢取**现金奖励**。奖励包括单场最高300元的现金奖及各种实物奖品

2024-05-14 10:44:59 943 4

原创 降本增效及大模型优化调研总结[小工蚁视频调研]

疑问:和Text2vec或sentence2vec的区别,谁更好?Glm4可调研模型号称数学和代码能力碾压LLama2?若可行,可提高Gpu使用率,可后续调研不知道是否能否有效提高LLM效果,可以后续按此实现下可验证是否可用于NSTL但A100GPU单卡部署多个实体可验证是否能够用于NSTL多场景合并效果。也采用此种方式评估大模型好坏,不过具体场景还需要结合具体场景数据验证采用人工问答的方式评估大模型的基础能力,于此量化不太相同,可参考验证下当前推理仅需部署好环境就行,因此需要对比看下两者那种更好。

2024-01-25 12:17:29 926

原创 开发相关的工具及AI算法调研【降本增效】

以下是实现软件开发降本增效的主要流程,将调研涉及该过程的可用工具或方法。按照满足我的核心需求查找:1.必须能快速生成一段完整的业务代码(示例,生成“读取pdf并解析数据”的业务代码)2.能够集成在各个开发工具里自动生成代码另其他的在线AI,均满足1,选其中一种也可。具体如下:文心一言 (baidu.com)讯飞星火认知大模型-AI大语言模型-星火大模型-科大讯飞 (xfyun.cn)智谱清言 (chatglm.cn)通义千问 (aliyun.com)

2024-01-25 12:08:31 1199

原创 高效数组处理的Numpy入门总结

NumPy是Python中一个重要的数学库,它提供了高效的数组操作和数学函数,是数据科学、机器学习、科学计算等领域的重要工具。下面是一个简单的NumPy学习教程,介绍了NumPy的基本用法和常用函数。

2023-12-12 16:36:03 1025

原创 对小工蚁关于LLM的技术总结+个人思考

推理能力?目前还未知晓为何得到结果。

2023-12-04 16:09:21 499

原创 【数据处理】 -- 【两分钟】了解【最好】的方式 -- 【正则表达式】

r’'表示单引号里字符为其特殊含义,比如.不是句号是匹配符的意思。表示非贪婪模型,匹配最少字符。re.M表示多行,一般默认单行。

2023-11-23 16:17:11 9762

原创 一定要看看的大模型【评测基准】及【评测报告】

针对于复杂任务,每个模型都要多次测试其对指示模版的适应程度。

2023-10-31 16:26:28 13916 2

原创 大模型该被知道的技术实现-面向垂直领域

在实际应用中,大模型可以带来非常显著的性能提升,例如可以更准确地完成语音识别、自然语言理解、图像识别等任务。与此同时,大模型的开发和部署也带来了新的挑战,例如需要使用大规模分布式系统来训练模型,并保证模型的高效性和性能稳定性。虽然大模型技术面临着种种挑战和限制,但其可能带来的巨大潜力也值得我们进一步深入研究和探索。随着计算能力的不断提升和硬件技术的进步,相信大模型技术也将不断得到优化和改进,为我们带来更高效、更智能的机器学习解决方案。

2023-10-31 12:07:48 9304

原创 chatGPT结构及商业级相似模型应用调研

ChatGPT(Chat Graphical Planning Tool)是一种用于设计和开发现代聊天机器人的AI技术。它是一个开源的自然语言处理框架,可以帮助开发人员在真实环境中构建聊天机器人。ChatGPT包括组件,这些组件可以让开发人员创建自然语言处理系统,此外还可以实现智能行为和多伦智能的用户交互。ChatGPT的实现方式是将机器学习,自然语言处理,图形规划等技术结合在一起,创建出一个全方位的聊天机器人框架。

2023-10-22 18:41:38 9664

原创 大模型微调发展-学习调研总结

针对于小公司,如何能够利用开源的大模型,在自己的数据上继续训练,从而应用于自己的业务场景?或低成本的方法微调大模型。目前主流的方法包括2019年Houlsby N等人提出的, 2021年微软提出的,斯坦福提出的,谷歌提出的, 2022年清华提出的方法各自都有自己的特点,从个人使用情况来说,LORA的效果会好与其他几种方法。

2023-10-22 18:38:30 9739

原创 LLM技术发展及在垂直领域中如何应用-经验学习大全

语言建模(LM)是提高机器语言智能的主要方法之一。一般来说,LM旨在对词序列的生成概率进行建模,以预测未来tokens的概率。: 起源于 20世纪90年代。其基本思想是基于马尔可夫假设建立词预测模型,由于需要估计指数级数量的转换概率,因此很难准确估计高阶语言模型。因此需要专门设计平滑策略,如回退估计和古德图灵估计被引入以缓解数据稀疏问题。: 通过神经网络,如循环神经网络(RNN),来描述单词序列 的概率。作为一个显著贡献。工作引入了词的分布式表示这一概念,并在聚合上下文特征的条件下构建词预测函数。

2023-07-24 18:01:44 9864

原创 Rocky Linux 8.4在Tesla P100服务器里的部署及显卡cudnn安装、miniconda安装-极度精简

cuda及cudnn安装:https://blog.youkuaiyun.com/bluewind_1988/article/details/105244396。Nvidia教程:https://blog.youkuaiyun.com/dendi_hust/article/details/111177699。驱动下载:https://www.nvidia.cn/download/driverResults.aspx/207499/cn/安装rocky linux时,这两项默认,轻易不要改,否则可能无法安装下一步。

2023-07-24 17:55:31 10841

原创 AI模型训练推理一定要知道的事情

模型训练需要大量计算资源,包括CPU(Central Processing Unit)、GPU(Graphical Processing Unit)、TPU(Tensor Processing Unit)等,其中GPU是最为常见的硬件加速器。另外还可以通过算法优化提高模型训练效率。例如分布式训练技术(将数据和模型参数分配到多台机器上进行计算)、还可以采用模型压缩技术,将模型的大小压缩到最小。

2023-03-25 21:26:01 10582

原创 编码工作之python编程规范总结-Google版

每个导入应该独占一行导入应该在文件顶部。导入顺序应按照通用到不通用顺序,标准库大于第三方库大于程序库。

2023-02-10 18:25:27 10424

原创 编码工作之JavaScript编程规范总结-Google版

一定不要试图手工对齐初始值

2023-02-10 18:03:55 10007

原创 面向战场的cesium基础到进阶的案例展示(我相信VIP总是有原因的)

直接看代码:学习相关Cesium使用(需要JS中级及以上能力)

2023-02-10 18:01:34 11721 5

原创 Cesium-数字仿真-你总要了解

GIS从2D到3D到4D进行发展,根据BS/CS的形式不同,可以划分到以上几类,而Cesium实现了3D到4D的跨越。通视分析(可以看到什么,看不到的用红色显示)、可视域分析(可以看到什么,不可以看到什么)、流动性展示。支持粒子系统(游戏动画基本都是粒子系统完成)轨迹追踪(多目标、单目标)

2023-02-10 17:54:53 10494 2

原创 算法顶级比赛汇总

时间:每年各个季度很多类型都会出题(比赛总时间大概为两个月)内容:各个类型的算法题都会出、奖金上万不等形式:在线提交(提交后在线检查结果)、离线测试。每队每天有1次提交结果的机会时间:每个时间段都有题,一次小比赛大概(2个月时间)内容:本地训练、在线提交(一等奖5万)形式:在线提交(提交后在线检查结果)、离线测试。每队每天有1次提交结果的机会时间:春季赛四月到七月、七月到九月有三场;秋季赛雷同。平均每个小赛题(两个月的时间)

2023-02-10 17:50:35 14015

原创 轨迹预测算法vectorNet调研报告

传统的行为预测方法是规则的,基于道路结构的约束生成多个行为假设。最近,很多基于学习的预测方法被提出。他们提出了对于不同行为假设的进行概率解释的好处,但是需要重构一个新的表示来编码地图和轨迹信息。有趣的是,虽然高精度地图是高度结构化的,但是目前大多数预测方法选择将高精度地图渲染成颜色编码的属性,并且采用感受野有限的卷积神经网络对场景信息进行编码。这带来一个疑问:能否直接从结构化的高精度地图中学习到有意义的场景信息表示?

2023-02-10 17:36:58 12353

原创 pointpillars Paper学习总结

PointPillars提出了一种新的点云编码方式和3D转2D的方法,用2D卷积的方式实现目标检测而没有采用耗时的3D卷积,在速度和精度上达到了很好的平衡,其速度快、精度高、易于部署的特点使得其在工业界得到了广泛的应用。处理思路是3d转2d,在2d伪图像上进行目标检测。数据增强。

2023-02-10 17:18:43 9735

原创 目标检测算法之voxelNet与pointpillars对比

目前检测主流算法VoxelNet与Pointpillars对比比较

2023-02-10 17:11:16 11794

原创 自然算法 - AI面试基础补全

面经回复项目连接

2022-11-30 15:09:06 26084

原创 NLP-了解BERT下游任务

MNLI:大规模分类任务,目标是预测第二个句子相对于第一个句子是包含,矛盾还是中立。QQP:二分类任务,预测Quora在两个语义问题上是否等效。STS-B:语义文本相似性基准,从新闻头条或者其他来源提取句子对的集合。然后按分值标注,表示两个句子在语义上多相似。MRPC:自动从在线新闻源中提取句子对组成,并带有人工标注,以说明句子对中的句子在语义上是否等效。SWAG: 对抗生成的情境数据集包含113k个句子对完整示例,用于评估扎实的常识推理。给定一个句子,任务是在四个选择中选择最合理的连续性。

2022-11-30 15:05:31 28168 4

原创 算法优化总结 - Transofomer避免显存不足及训练时间过长

自BERT出现以来,nlp领域已经进入了大模型的时代,大模型虽然效果好,但是毕竟不是人人都有着丰富的GPU资源,在训练时往往就捉襟见肘,出现显存out of memory的问题,或者训练时间非常非常的久,因此,这篇文章主要解决的问题就是如何在GPU资源受限的情况下训练transformers库上面的大模型。

2022-11-30 15:02:33 27674

原创 Transformer对接公司需求的调研报告

它们都是有助于计算和理解注意力机制的抽象概念。计算自注意力的第二步是计算得分。假设这个例子中,为第一个词“Thinking”计算自注意力向量,就需要拿输入句子中的每个单词对“Thinking”打分。这些分数决定了在编码单词“Thinking”的过程中有多重视句子的其它部分。这些分数是通过打分单词(所有输入句子的单词)的键向量与“Thinking”的查询向量相点积来计算的。所以如果我们是处理位置最靠前的词的自注意力的话,第一个分数是q1和k1的点积,第二个分数是q1和k2的点积。

2022-11-30 14:59:53 26864

原创 自然语言-知识图谱调研结论

torchTextFeed-Forward Neural Networks(前馈神经网络)FFN在很多TC(文本分类)任务中实现了高精确度。它把文本看做成一袋单词。每个单词都用word2vec或者Glove等嵌入模型表示成词向量,然后将词向量取和或者平均来代表文本,然后通过一层或多层的前馈神经网络(例如:MLPs),然后使用分类器(例:逻辑回归,朴素贝叶斯,或SVM)对最后一层的表示进行分类。RNN-Based Models(基于循环神经网络的模型)

2022-11-30 14:44:17 26452

原创 知识图搭建- Nebula Graph 3.1 + studio3.3 数据语法试错合集

查询点Person的属性Person.name# 显示图空间统计信息。# 查看所有标签为Person的点,限制100个数# 使用属性name搜索匹配的点。等于 MATCH (v:Person) WHERE v.name == "Aaron Acosta" RETURN v;(后面where在不同版本是有问题的,比如v.name可能是v.tag.name)# 使用id搜索匹配的点# 使用多个id搜索匹配的点# 使用点与点关系搜索点(用户可以在--符号上增加符号指定边的方向。)

2022-11-30 14:39:05 26191

原创 服务器安装Rocky Linux 8.x安装及显卡配置

前置步骤镜像下载启动盘制作(系统无法安装时,尝试使用其他软件制作启动盘尝试,例如ubunto官方推出的UltraSO)服务器BIOS进入方式:一般为F12、F11、F4、F2、Delete(启动服务器重复点按即可)。安装过程一、安装Rocky Linux 8.4成功引导系统后,会出现下面的界面界面说明:Install Rocky Linux 8 #安装Rocky Linux 8Test this media & install Rocky Linux 8 #测试安装文件并

2021-11-18 23:12:23 30506

原创 Rocky linux 8 docker安装及基本使用【精华极简】

dockers前置资料(可选看)视频查看docker详细讲解中文文档1:官方详细版中文文档2:精简版资源网站:镜像资源官方网站资源网站:镜像资源官方网站CentOS 8 安装docker(Rocky linux 8 由 centos 8 演变而来)step 1: 安装必要的一些系统工具sudo yum install -y yum-utils device-mapper-persistent-data lvm2Step 2: 添加软件源信息sudo yum-config-ma

2021-11-18 21:16:46 21834

大模型该被知道的技术实现-LLM

LLM+技术发展+技术实现+xmind清晰思路。帮助快速理清大模型实现需要的技术,快速定位自身实现大模型需要的基础能力及如何微调,如何进行思维链提示,即如何进行IT、COT等工作。

2023-10-31

蓝桥杯之c++篇全部涉及点算法训练.doc

C++是C语言的继承,它既可以进行C语言的过程化程序设计,又可以进行以抽象数据类型为特点的基于对象的程序设计,还可以进行以继承和多态为特点的面向对象的程序设计。C++擅长面向对象程序设计的同时,还可以进行基于过程的程序设计,因而C++就适应的问题规模而论,c++可以拓展个人很多道路。本文档设计算法的设计,有大量算法思路展示,大量算法代码实现,大量算法重点点播。文档也在不断更新中。

2020-04-21

数据库原理高清教程大图

以结构化图表展示数据库DBMS应用原理,包含数据库原理基础教程中所有必考项,帮助我们理清DML、DDL、DCL,BCDF等是个什么东西,适用于温习及复习数据库知识。

2020-04-21

django部署所需资源包.zip

重要的事情说三遍: 收集django在window系统上安装所需的一些比较完整的工具及插件,供大家参考,严禁商业使用。该工具所有权归优快云所有。 收集django在window系统上安装所需的一些比较完整的工具及插件,供大家参考,严禁商业使用。该工具所有权归优快云所有。 收集django在window系统上安装所需的一些比较完整的工具及插件,供大家参考,严禁商业使用。该工具所有权归优快云所有。

2020-03-04

用户管理jsp+struts2+hibernate代码

用户登录管理系统,使用jsp+sql进行数据的封装显示,在功能较为复杂时,使用struts2与hibernate进行数据封装和显示,可用于进行功能对比,通过内置对象的封装比较,有助于开拓思路

2018-12-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除