自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 让大模型听话的6种优化方法

摘要:针对大模型在业务场景中表现不佳的问题,本文提出6种优化方法:1)微调训练实现参数级适配;2)提示词工程引导模型理解需求;3)Agent框架处理复杂流程;4)FunctionCall实现工具调用;5)RLHF优化人类偏好匹配;6)上下文工程确保合规性。这些方法可根据项目需求组合使用,从小规模快速验证到复杂系统搭建,帮助模型精准满足业务要求。核心是通过技术手段让通用模型具备场景化能力,实现从"听懂"到"做到"的转变。

2025-12-09 11:14:42 683

原创 Function Call的原理

摘要: FunctionCall(函数调用)是AI调用外部工具获取信息并整合结果的能力,相当于为AI配备"手脚"。其核心原理分为三步:1)AI判断需求是否需要调用工具;2)生成标准化指令(工具名称、参数、返回格式);3)工具返回数据后,AI分析并转化为自然语言回答。开发者需提前定义"工具说明书"(FunctionDescription),明确工具用途、参数要求及格式规范。FunctionCall的本质是让AI充当"需求翻译官+工具协调员",结合逻辑

2025-12-09 10:41:35 763

原创 程序被占用解决方法(写给电脑小白)

在使用电脑时,打开软件,显示程序被占用,或者程序已经打开,这个时候我们要怎么解决呢,下面是具体的解决办法。

2025-12-01 10:26:38 180

原创 游戏体验中AI交互的深度剖析与发展展望

在游戏产业蓬勃发展的当下,AI交互正以前所未有的态势重塑着玩家的游戏体验。从最初的简单文字互动,到如今深度融入各类游戏类型,AI交互不断突破边界,为玩家带来更加丰富、个性化的游戏世界。

2025-06-27 09:17:48 1482

原创 文字游戏: 斗罗大陆

同时,修炼速度为每年 2 级魂力/武魂数量(默认每年增长 2 级魂力,若有多武魂则按此规则叠加计算,但总增长不超过因武魂数量带来的额外增长限制,即每年至少增长 2 级,多武魂时按武魂数量均分增长额度,但总和仍为每年至少 2 级,具体实现可调整为每年基础增长 2 级,多武魂时每多一个武魂额外增加 0.5 级增长潜力,但每年实际增长不超过 3 级以保持平衡)。魂环获取节点:每当角色魂力等级达到 10、20、30、40、50、60、70、80、90、100 级时,系统将弹出获取魂环的选项供玩家选择。

2025-06-27 08:56:09 2069

原创 当AI邂逅文字游戏:一场跨越次元的创意狂欢

在科技飞速发展的今天,AI(人工智能)已不再仅仅是科幻电影中的神秘元素,而是悄然融入了我们生活的方方面面。其中,AI在文字创作领域的表现尤为引人注目,而当它与文字游戏相遇,更是碰撞出了令人惊叹的火花,开启了一场跨越次元的创意狂欢。

2025-06-27 08:48:48 1197

原创 普通人要怎么抓住AI的时代红利

从今日起,每天用AI完成1项原需2小时的工作(如写周报、做PPT),逐步积累人机协作经验。

2025-06-25 16:40:26 889

原创 AI对于普通人的影响

2025年AI将深度重塑社会:就业方面,30%重复性岗位被替代,新兴AI相关职业需求激增;生活上,智能家居普及率达40%,医疗诊断准确率提升至95%。同时社会风险凸显,隐私泄露年增25%,数字鸿沟加剧。未来趋势显示人机协作常态化,自动驾驶或减少90%交通事故,但需应对算法偏见等治理挑战。普通人应掌握AI协作技能,培养批判性思维,关注技术伦理。人类的情感共鸣与创造力仍是核心竞争力,主动适应变革者将把握发展机遇。(148字)

2025-06-25 16:32:50 988

原创 Spring ai 的使用

Spring Boot 3.3.x 或更高版本。JDK 17 或更高版本(推荐21)。Maven/Gradle构建工具。

2025-06-24 10:02:26 299

原创 为什么“不上班”会有负罪感?

不上班时内心自责,上班却又无法全心投入——这是一种现代生活中常见的心理困境,很多人都曾在这种状态里挣扎过。

2025-06-24 09:44:43 725

原创 解决困难的办法之一“延迟顿悟”

在问题解决与认知发展的过程中,我们常常会面临各种复杂情境,需要应对诸多难题。当个体遭遇困难或面临亟待解决的问题时,往往会经历一个主动思考却暂时未得其解的阶段。有趣的是,在经过一段时间的间隔后,尤其是在个体处于相对放松、无意识加工的状态,如夜间睡眠时,答案或解决方案会突然在脑海中闪现。这种在时间延迟后出现的顿悟现象,我将其定义为“延迟顿悟”,它揭示了人类认知过程中无意识加工与意识思考之间的复杂交互作用。

2025-06-19 17:30:37 342

原创 Qwen3 系列模型性能登顶全球,千问3模型介绍

千问3(Qwen3)是阿里巴巴开源的新一代通义千问模型,发布于2025年4月29日。这款模型系列是国内首个采用“混合推理模型”设计的,它将“快思考”与“慢思考”集成到同一个模型中,旨在提升性能的同时减少算力消耗。模型能力优点参数规模和成本效益:旗舰版Qwen3-235B-A22B拥有235B的总参数量,但在实际运行时仅激活22B参数,这使得其部署成本大幅下降,只需要4张H20显卡即可部署满血版本,显存占用为性能相近模型的三分之一。性能表现。

2025-04-30 10:10:46 1778

原创 普通人也能上手的模型微调

利用录音对大模型进行微调

2024-11-01 10:00:11 573

原创 租聘GPU,并对GPU能力进行测试

GPU并发能力测试

2024-11-01 09:56:50 427

原创 centos7安装docker最新版记录

最近好多镜像失效,centos7安装不了docker,以下是基于centos7安装docker的全过程

2024-09-24 17:30:02 646

原创 Transformer模型生成文本的原理及微调方法

在Transformer模型中,由于自注意力机制本身不考虑序列中元素的顺序,因此需要额外的位置信息来指示每个元素在序列中的位置。这通常指的是残差连接(将输入直接加到输出上)和层归一化(对层的输出进行归一化,以保持数值的稳定性)。首先,输入的文本(或其他类型的数据)被转换为嵌入向量。模型利用预训练学到的知识和微调过程中学到的特定任务知识,对输入文本进行编码,生成一个内部表示(通常是一系列的向量)。模型首先在大量无标注的文本数据上进行预训练,学习语言的基本规律和知识,如词汇的语义、语法结构、上下文关系等。

2024-09-24 14:05:28 1431

原创 Linux 部署docker,ssh学习记录

【代码】Linux 部署docker,ssh学习记录。

2024-09-23 17:44:55 273

原创 A100、V100等GPU私有化部署小模型ChatGLM4-9b并发测试方案

租聘服务器之后,运行chatGlm4-9b模型,服务启动之后,通过apifox 多线程去批量调用,不断增加并发量,直到成功率不足100%停止,连续三次结果的平均值,即为当前GPU的并发量。在后面给其他客户评估服务器资源时,例如客户要求100路并发,我们评估了A100服务器,要15-20台,成本比开发成本都搞了。A100等大内存显卡,多模型部署测试 价格不确定, 先按照200来计算,等200块用完了根据实际情况来调整。先单模型跑,查看极限并发量,然后再查找资料,看怎么多模型部署。并发量测试 300左右。

2024-09-23 17:38:28 1114

原创 JAVA代码进行语义相似度聚类并生成热点数据

根据工单信息梳理出来工单的核心要点内容,生成热点信息,和百度的热搜类似,要求生成每月的热点事件。以下是我根据代码梳理了一个合并热点的工具类,提供一个方法,入参是标题列表,最后返回合并结果,及合并的热点标题。

2024-09-11 16:06:53 813

原创 记一次websokect在生产上一直断开连接然后重连

websocket断开重连,原因竟然是docker和openEuler不兼容导致的。

2024-02-19 08:57:37 579

原创 代码及接口文档自动生成

基于以上需要,整理了一套适合我们自己的代码模板,生成的模板能严格遵守我们的代码规范,且可以直接生成apifox。

2023-08-31 17:07:45 2452

原创 JAVA变声器

java变声器,对录音文件进行变声处理

2023-07-21 14:06:24 1356

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除