- 博客(22)
- 收藏
- 关注
原创 让大模型听话的6种优化方法
摘要:针对大模型在业务场景中表现不佳的问题,本文提出6种优化方法:1)微调训练实现参数级适配;2)提示词工程引导模型理解需求;3)Agent框架处理复杂流程;4)FunctionCall实现工具调用;5)RLHF优化人类偏好匹配;6)上下文工程确保合规性。这些方法可根据项目需求组合使用,从小规模快速验证到复杂系统搭建,帮助模型精准满足业务要求。核心是通过技术手段让通用模型具备场景化能力,实现从"听懂"到"做到"的转变。
2025-12-09 11:14:42
683
原创 Function Call的原理
摘要: FunctionCall(函数调用)是AI调用外部工具获取信息并整合结果的能力,相当于为AI配备"手脚"。其核心原理分为三步:1)AI判断需求是否需要调用工具;2)生成标准化指令(工具名称、参数、返回格式);3)工具返回数据后,AI分析并转化为自然语言回答。开发者需提前定义"工具说明书"(FunctionDescription),明确工具用途、参数要求及格式规范。FunctionCall的本质是让AI充当"需求翻译官+工具协调员",结合逻辑
2025-12-09 10:41:35
763
原创 游戏体验中AI交互的深度剖析与发展展望
在游戏产业蓬勃发展的当下,AI交互正以前所未有的态势重塑着玩家的游戏体验。从最初的简单文字互动,到如今深度融入各类游戏类型,AI交互不断突破边界,为玩家带来更加丰富、个性化的游戏世界。
2025-06-27 09:17:48
1482
原创 文字游戏: 斗罗大陆
同时,修炼速度为每年 2 级魂力/武魂数量(默认每年增长 2 级魂力,若有多武魂则按此规则叠加计算,但总增长不超过因武魂数量带来的额外增长限制,即每年至少增长 2 级,多武魂时按武魂数量均分增长额度,但总和仍为每年至少 2 级,具体实现可调整为每年基础增长 2 级,多武魂时每多一个武魂额外增加 0.5 级增长潜力,但每年实际增长不超过 3 级以保持平衡)。魂环获取节点:每当角色魂力等级达到 10、20、30、40、50、60、70、80、90、100 级时,系统将弹出获取魂环的选项供玩家选择。
2025-06-27 08:56:09
2069
原创 当AI邂逅文字游戏:一场跨越次元的创意狂欢
在科技飞速发展的今天,AI(人工智能)已不再仅仅是科幻电影中的神秘元素,而是悄然融入了我们生活的方方面面。其中,AI在文字创作领域的表现尤为引人注目,而当它与文字游戏相遇,更是碰撞出了令人惊叹的火花,开启了一场跨越次元的创意狂欢。
2025-06-27 08:48:48
1197
原创 AI对于普通人的影响
2025年AI将深度重塑社会:就业方面,30%重复性岗位被替代,新兴AI相关职业需求激增;生活上,智能家居普及率达40%,医疗诊断准确率提升至95%。同时社会风险凸显,隐私泄露年增25%,数字鸿沟加剧。未来趋势显示人机协作常态化,自动驾驶或减少90%交通事故,但需应对算法偏见等治理挑战。普通人应掌握AI协作技能,培养批判性思维,关注技术伦理。人类的情感共鸣与创造力仍是核心竞争力,主动适应变革者将把握发展机遇。(148字)
2025-06-25 16:32:50
988
原创 Spring ai 的使用
Spring Boot 3.3.x 或更高版本。JDK 17 或更高版本(推荐21)。Maven/Gradle构建工具。
2025-06-24 10:02:26
299
原创 解决困难的办法之一“延迟顿悟”
在问题解决与认知发展的过程中,我们常常会面临各种复杂情境,需要应对诸多难题。当个体遭遇困难或面临亟待解决的问题时,往往会经历一个主动思考却暂时未得其解的阶段。有趣的是,在经过一段时间的间隔后,尤其是在个体处于相对放松、无意识加工的状态,如夜间睡眠时,答案或解决方案会突然在脑海中闪现。这种在时间延迟后出现的顿悟现象,我将其定义为“延迟顿悟”,它揭示了人类认知过程中无意识加工与意识思考之间的复杂交互作用。
2025-06-19 17:30:37
342
原创 Qwen3 系列模型性能登顶全球,千问3模型介绍
千问3(Qwen3)是阿里巴巴开源的新一代通义千问模型,发布于2025年4月29日。这款模型系列是国内首个采用“混合推理模型”设计的,它将“快思考”与“慢思考”集成到同一个模型中,旨在提升性能的同时减少算力消耗。模型能力优点参数规模和成本效益:旗舰版Qwen3-235B-A22B拥有235B的总参数量,但在实际运行时仅激活22B参数,这使得其部署成本大幅下降,只需要4张H20显卡即可部署满血版本,显存占用为性能相近模型的三分之一。性能表现。
2025-04-30 10:10:46
1778
原创 Transformer模型生成文本的原理及微调方法
在Transformer模型中,由于自注意力机制本身不考虑序列中元素的顺序,因此需要额外的位置信息来指示每个元素在序列中的位置。这通常指的是残差连接(将输入直接加到输出上)和层归一化(对层的输出进行归一化,以保持数值的稳定性)。首先,输入的文本(或其他类型的数据)被转换为嵌入向量。模型利用预训练学到的知识和微调过程中学到的特定任务知识,对输入文本进行编码,生成一个内部表示(通常是一系列的向量)。模型首先在大量无标注的文本数据上进行预训练,学习语言的基本规律和知识,如词汇的语义、语法结构、上下文关系等。
2024-09-24 14:05:28
1431
原创 A100、V100等GPU私有化部署小模型ChatGLM4-9b并发测试方案
租聘服务器之后,运行chatGlm4-9b模型,服务启动之后,通过apifox 多线程去批量调用,不断增加并发量,直到成功率不足100%停止,连续三次结果的平均值,即为当前GPU的并发量。在后面给其他客户评估服务器资源时,例如客户要求100路并发,我们评估了A100服务器,要15-20台,成本比开发成本都搞了。A100等大内存显卡,多模型部署测试 价格不确定, 先按照200来计算,等200块用完了根据实际情况来调整。先单模型跑,查看极限并发量,然后再查找资料,看怎么多模型部署。并发量测试 300左右。
2024-09-23 17:38:28
1114
原创 JAVA代码进行语义相似度聚类并生成热点数据
根据工单信息梳理出来工单的核心要点内容,生成热点信息,和百度的热搜类似,要求生成每月的热点事件。以下是我根据代码梳理了一个合并热点的工具类,提供一个方法,入参是标题列表,最后返回合并结果,及合并的热点标题。
2024-09-11 16:06:53
813
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅