- 博客(21)
- 问答 (1)
- 收藏
- 关注
原创 AI记账的“最终形态”:我设计的6级智能流水线全解析
本文分享了我在打造一款“AI 智能记账 App”过程中的完整识别流水线设计。从预处理、正则提取到本地 BERT 模型微调、偏好匹配与云端增强,我一步步构建了一个真正可用、可扩展的结构化识别系统。这不仅是一个实用工具,也是我 AI 应用开发学习路线的起点。欢迎关注,后续我将推出「AI 应用开发实战系列」,从微调、RAG 到 Agent 全线开讲。
2025-06-24 20:05:23
753
原创 让AI“越用越懂你”的秘密:我是如何从0到1设计一个AI置信度系统的?
本文介绍了一种基于置信度系统的AI记账应用优化方案。通过构建本地智能流水线,系统实现了80%高频场景的毫秒级处理,仅在复杂场景才调用云端API。核心创新在于:1)本地预处理与正则匹配快速提取关键字段;2)并行运行的NER模型和分类模型进行智能识别;3)置信度系统结合用户历史偏好进行动态决策。测试表明,该方案较传统云端处理模式效率提升显著,特别在常见账单场景响应速度提高5-10倍。系统还设计了智能字段处理策略,如通过关键词快速判定收支类型,备注字段则采取"留白"设计保持扩展性。
2025-06-23 21:14:06
1006
原创 模型微调后效果暴跌?90%人忽略的「对话模板陷阱」!(附解决方案)
大模型微调后推理效果异常,往往是ChatTemplate不匹配导致。训练时模型学习特定对话模板(如Qwen的ChatML格式),但部署时若使用默认模板(如Alpaca格式),模型因“语法”错乱而输出无效内容。关键问题包括:Llamafactory实现与官方模板存在差异、GGUF转换丢失模板、推理工具未适配原模板。解决方案:1) 从tokenizer_config.json提取训练时的Jinja2模板;2) 在llama.cpp等工具中强制适配该模板;3) 跟踪工具对动态模板的支持进展。
2025-06-19 20:27:53
1087
原创 想把6亿参数的AI巨兽塞进手机App?结果惨被现实打脸
《AI记账App开发踩坑记:本地化大模型的理想与现实》本文记录了开发AI记账应用时尝试将大模型本地化的失败经历。最初设想将6亿参数的Qwen-0.6B模型塞入手机App,以实现隐私安全、离线使用和无成本三大优势。经过微调优化和量化压缩后,却面临三大致命问题:App体积膨胀至近1GB、首次加载需十几秒、推理速度慢且手机发烫。最终认识到移动端AI需要"小而美"的解决方案,而非简单移植大模型。这一尝试促使开发者转向云端与本地协同的新思路,并意外发现了苹果CoreML小型模型的可行性。
2025-06-18 20:34:10
577
原创 一次关于Spark广播变量broadcast variable的优化
通过配置广播变量broadcast variable去优化Spark application
2023-03-02 23:43:49
1157
原创 计算机中为什么使用二进制
计算机中为什么使用二进制Answer:将计算转换成逻辑判断经典例题:100桶饮料,其中有一桶是有毒的,喝了肚子会难受,二十分钟后恢复,请问最少需要多少测试人员才能确定有毒的桶的位置?答:7个人解析:使用二进制的来思考,首先饮料是否有毒为两种情况,符合逻辑判断0和1,遂将100转换为二进制:1 1 0 0 1 0 0;共7位,假设第100桶饮料是有毒的,那么由二进制显示方式可以判断出从左到右第一个,第二个,第五个测试者会出现中毒现象;因此7位二进制数就可以满足确定100桶饮料中有毒饮料的位置。
2021-01-25 23:09:37
1561
原创 VScode - 前端开发涉及插件
VScode - 前端开发涉及插件vetur实现在 vue 文件中:语法错误检查,包括 CSS/SCSS/LESS/Javascript/TypeScript语法高亮,包括 html/jade/pug css/sass/scss/less/stylus js/ts emmet 支持代码自动补全(目前还是初级阶段),包括 HTML/CSS/SCSS/LESS/JavaScript/TypeScript 配合 ESLint 插件使用效果更佳eslinteslint插件能够检测代码语法
2021-01-15 20:12:13
378
原创 hive-sql入门-实践摘记-持续更新
Hive SQL记录DQL:Data QueryLanguage - 只读权限 selectDML:Data manipulation language - 数据操作语句 insert/ delete/updateDDL:Data Definition language - 数据定义语句 create/alter/drop etcDCL:Data Control Language - 数据库控制语句 grant,deny,revoketo_date():to_date(exp
2021-01-09 23:50:14
1363
原创 The reason for hadoop fs -touch: Unknown command
理由简单粗暴,hadoop2.7.2版本不支持 该命令;平时还得多关注官网动态;具体参考:REF
2020-05-26 15:35:56
846
原创 IDEA下载maven官方镜像过慢解决办法,修改maven阿里镜像 并添加网络代理
需求:官方的maven镜像下载速度过慢,公司有网络代理才能访问外网;解决方式:改成国内阿里镜像源,并添加网络代理信息;Settings ->Build, Execution, Deployment -> Build Tools > Maven或者Settings -->直接搜索maven具体如下图所示:Maven Home可以选择你自己安装的maven路径,当然也可以用idea自带的;主要是修改 settings.xml的路径,并去对应路径下找到sett.
2020-05-22 14:43:23
871
原创 Chrome Software Reporter Tool长时间占用CPU解决办法
记录一下:什么是Software Reporter ToolSoftware Reporter Tool是一个Chrome清理工具,用于清理谷歌浏览器中不必要或恶意的扩展,应用程序,劫持开始页面等等。当你安装Chrome时,Software_reporter_tool.exe也j就会被下载在SwReporter文件夹下的Chrome应用数据文件夹中。如何关闭SRT这个软件在运行的过程中可能会长时间地占用CPU,导致高CPU使用率。我们虽然可以通过任务管理器手动结束进程或者选择删除SRT,但这都不是
2020-05-19 22:00:10
1153
原创 我的上进空想症和拖延绝症的挣扎旅程记录
2020-02-08记:在看了多年油管,TED,某乎,wechat大佬推送的解决拖延症相关的文章视频演讲之后,自以为总结了一些自我挣扎的措施,但是自己的老毛病始终没发改变,故以此blog为始,定时检测自己的完成情况。首先记录最近一项刚失败的计划:2019年6月-2019年12月过年计划彻底失败!反思:缺少 阶段性奖励 和 终极奖励,计划没有细致化 或者要求过高 可以从小计划做起。曾经的...
2020-02-08 20:17:13
558
原创 java -jar 报异常:No main manifest attribute, in XXX.jar
工作问题杂记:Linux系统下执行java -jar XXX.jar 往往会提示:No main manifest attribute, in XXX.jar异常原因:正常情况下,打jar包的时候会在MANIFEST.MF中指定Main-Class项,这样在执行java -jar XXX.jar的时候就能找到对应的主类。因为-jar的含义就是后面跟的jar包是有main class可独...
2020-01-14 15:13:05
2489
原创 停用Windows Defender Antivirus Service,释放CPU和内存
First,What isWindows Defender Antivirus Service?该服务一般会在占用20%的CPU(i5-4210M)以及200多MB的内存。通常改成禁用会出现拒绝访问的提示。因此提供以下方式解决该问题!1.使用Windows键+ R键盘快捷键打开运行命令。2.键入regedit.exe,然后单击确定以打开注册表。3.浏览以下路径:H...
2019-12-27 21:07:22
146451
26
原创 Excel 高级筛选实现多条件筛选数据
由于工作原因,需要在一堆Oracle表名中筛选出需要更新表结构的表,可以用excel高级筛选实现该功能,故记录下来以供讨论。实际场景: 需要在几百张表中筛选出需要更新的表结构的几十张表,如果使用普通筛选方式只能一次次筛选复制,重复操作!So,这个时候就需要excel的高级筛选功能来大展身手了。但是这个时候会遇到最大的阻碍就是公式如何表达?如何让excel清楚得认识到你所需要...
2019-12-25 16:41:36
6412
原创 Once for all, the way to solve the problem Google Chrome Software Reporter Tool 长时间占用CPU
First , What's Software Reporter Tool ???Software Reporter Tool:是一个Chrome清理工具,用于清理谷歌浏览器中不必要或恶意的扩展,应用程序,劫持开始页面等等。当你安装Chrome时,Software_reporter_tool.exe也就会被下载在SwReporter文件夹下的Chrome应用数据文件夹中。这个软件在运行的过程...
2019-12-24 22:50:06
377
原创 Win10系统Jdk环境变量配置遇到'javac' 不是内部或外部命令,也不是可运行的程序 或批处理文件 解决办法。
背景:下载官网的jdk并安装,1.8的不需要配置CLASSPATH,只需要配置JAVA_HOME和PATH;网上很多方式可能能够解决你的问题,但都不是我的原因,比如1、path中的路径由相对路径改为绝对路径2、把两个java bin上移到path最上边,再重启cmd测试我所遇到的奇葩原因是win10系统应该在你新增path的值的时候对%做了加引号的处理。查看环境变量path的值...
2019-11-01 14:22:45
689
原创 JavaSE基础知识点复习整合 - 一个月学习量
目录一.准备知识0.下载JDK到windows1.环境变量path与classpath区别2.Java的一些规定3.Java语言的四大特点4.Java主要组成部分5.Java的核心机制二.关键字三.标识符(文件名称)四.注释五.常量 - 不能改变的数值六.进制七.变量八.数据类型九.数据类型转换十.运算符1.算术运算符(注意细节)...
2019-08-02 17:07:15
1794
翻译 Kafka消费顺序保证
面试被问到如何按照Producer的顺序去消费Consumer?故在此做个记录。首先几个概念Topic,Producertopic-Topic:A topic is a category or feed name to which records are published. Topics in Kafka are always multi-subscriber; that is, a...
2019-07-05 15:31:20
5420
原创 Python-PEP 8-关于line too long引发的一系列操作-Pycharm和sublime text3对py文件的自动换行
1.sublime text3设置每行的长度:点击view - word wrad column选择需要的长度即可;or 点击Preferences - Setting-User 打开该文件添加"word_wrap": true即可(一劳永逸的方式);-- 注意该方法只能view而不能真正将文件的那一行超过长度的代码自动改成两行,从代码行号就能看出;也就是说想要真正按规...
2019-01-22 11:05:25
13902
原创 win10卓越性能模式开启方法
因为现在用的笔记本,开启卓越性能模式增大消耗,所以转回平衡模式,先记录下等回家在台式机上使用;卓越性能 可以替代 高性能模式~输入代码即可添加该模式:powercfg -duplicatescheme e9a42b02-d5df-448d-aa00-03f14749eb61...
2019-01-17 09:48:06
11248
空空如也
Kafka连接数据库,有大佬经历过吗?
2019-07-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅