自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

烤鸭的世界我们不懂。

2026年我希望世界和平。

  • 博客(239)
  • 资源 (8)
  • 收藏
  • 关注

原创 2025 年终总结

大家好,我是烤鸭:又到了一年中回顾今年的自己、展望明年自己的时候了。之前想着干到最低能领退休金的年份就行,没想到这个时间也在延迟。从22年之后,生活进入稳定期,就一直在不务正业的摆烂...

2026-01-01 10:31:48 696

原创 25年12月22日ks直播事故技术复盘

大家好,我是烤鸭:今天聊一下 25年12月22日晚上ks直播失控,主要是技术层面分析一下可能原因是什么,怎么预防。

2025-12-23 18:03:48 1335

原创 技术干货:基于开源生态的视频多语言解决方案,框架选型 + 踩坑总结

大家好,我是烤鸭:前面几篇文章已经把流程拆解的差不多了,现在合一下,具体写一下视频多语言转换。其实国内外成熟的网站挺多的了,性价比也挺高,连x映都有这个功能了。

2025-12-23 07:45:00 1252

原创 赛博 coding 杀器集结!AI 编程黑科技工具炸裂分享

AI编程工具测评:Claude、Cursor、Trae、Comate、ByteBuddy、Lingma对比 本文测评了当前主流AI编程工具,重点比较了Claude、Cursor和Trae三款产品。Claude作为通用型AI助手在逻辑处理上表现突出,但国内使用受限;Cursor基于VS Code重构,支持本地模型运行,适合隐私敏感项目;字节跳动的Trae则定位本地AI编辑器,对国内开发者更友好。

2025-11-28 07:45:00 1896

原创 AI 翻译开源模型:轻量可本地化部署

本文介绍了腾讯开源的多语言翻译模型Hunyuan-MT-7B,并对比了5个主流翻译模型的性能参数。该模型在WMT2025大赛中30/31语种排名第一,支持33种语言和5种民汉方言。测试环境包括Python 3.11、CUDA 12.8和NVIDIA显卡。作者针对ASR文本的上下文翻译需求进行了实际测试,输入包含时间戳的对话文本,评估模型在保持时间戳结构的同时进行整体翻译的能力。表格详细对比了各模型在参数规模、架构、语言支持等方面的差异,特别突出了Hunyuan-MT-7B在多语言API服务场景下的优势。

2025-11-25 07:45:00 1029

原创 干货|多语言 TTS 模型选型、调优与落地实操

本文分享了多个TTS模型的使用体验,包括CosyVoice、IndexTTS-2、Step-Audio-EditX和chatterbox等,主要针对多语种语音合成需求。测试环境为Python 3.11+、CUDA 12.8,分别在Windows和Linux系统上进行。重点评测了chatterbox(支持23种语言,部署简单)、IndexTTS-2(中文表现优秀)和CosyVoice(下载量超百万次,支持多种方言)的实际表现。文章提供了各模型的部署方法、代码示例和音频测试结果。

2025-11-24 07:45:00 1404

原创 人声分离的模型和项目推荐:UVR or Demucs or Spleeter

本文分享了三款主流开源人声分离工具:UVR5、Spleeter和Demucs。UVR5集成多引擎,支持图形界面操作,适合音乐爱好者;Spleeter轻量高效,适合批量处理;Demucs音质最优但硬件要求高,适合专业用户。文章提供了安装指南、功能对比和实际测试结果,推荐UV5作为首选工具,Demucs用于高质量需求,Spleeter适合快速处理。测试显示UVR5在保留人声同时有效过滤背景音,而Demucs模型在本地运行需要较高配置。

2025-11-17 07:11:28 817

原创 Faster-Whisper:更快更好的开源Asr模型

本文介绍了faster-whisper语音识别模型,相比原版Whisper和whisperX在效率和性能上的优势。该模型基于CTranslate2实现,在保持准确率的同时速度提升50%以上,内存占用更低。

2025-11-11 06:54:56 914 5

原创 langchain搭建智能体-更好的理解上下文管理

本文介绍了AI学习路径中的上下文工程,以LangChain为例探讨了上下文管理的演变与应用。文章指出,从单次对话到多任务协作,上下文管理经历了提示词工程到上下文工程的演进,后者更关注输入结构的系统设计。文章总结了Drew Breunig提出的四类上下文失败问题(中毒、干扰、混淆、冲突),并分析了LangChain中的记忆机制(短期/长期记忆)。最后通过代码示例展示了LangGraph在并行无上下文和有上下文场景下的应用,说明了上下文管理在智能体协作中的重要性。

2025-10-29 07:45:00 1903

原创 Qwen-Image微调(含源码)

大家好,我是烤鸭:使用大模型的时候,都遇到过类似的问题,有些概念模型不知道,导致结果不符合预期。比如使用Qwen-Image生成某一个没经训练过的图,这时候就需要进行模型微调。今天这篇文章主要写一下Qwen-Image的微调。

2025-09-19 07:45:00 1200

原创 开源 Agent 平台部署全流程:从环境准备到启动运行

大家好,我是烤鸭:​ 前几天写了一个agent的文章,https://blog.youkuaiyun.com/Angry_Mills/article/details/151369785,今天打算写一篇开源agent的平台dify的非docker部署和aiflowy部署。

2025-09-17 07:45:00 1293

原创 一文讲懂agent&搭建一款属于自己的智能体

大家好,我是烤鸭:最近除了研究开源模型和工具调用,也在看智能体相关,再好的模型或者代码都只是工具,想要有生产力还是得上价值(智能体),谁不想要一个可以7*24h工作的AI助手(牛马)呢。

2025-09-11 07:45:00 943

原创 通义万相2.2-图/文生视频深度体验:附源码

大家好,我是烤鸭: 鲨疯了,最近陆续几个重磅开源,阿里云和openai陆续加入了战场,都是非商用显卡可以跑的,太炸裂了。文本模型: openai_gpt-oss 文本生成,文生图:Qwen-Image文生图,文/图生视频: 通义万相2.2-图生视频。今天重点体验一下 通义万相2.2文/图生视频。

2025-09-09 07:45:00 1216

原创 开源王者 Qwen-Image-Edit:图生图实战代码独家分享

通义千问最新推出的图像编辑模型Qwen-Image-Edit的使用体验,该模型支持图生图功能,效果强大且支持家用4090显卡运行。模型开源地址和示例代码均已给出。

2025-09-05 07:30:00 672

原创 文生图开源王者 Qwen-Image:实战代码与量化代码独家分享

鲨疯了,上周陆续几个重磅开源,阿里云和openai陆续加入了战场,都是非商用显卡可以跑的,太炸裂了。文本模型: openai_gpt-oss 文本生成,文生图:Qwen-Image文生图,文/图生视频: 通义万相2.2-图生视频。今天重点体验一下Qwen-Image文生图。

2025-08-11 07:45:00 1045

原创 从理论到代码:Qwen2.5-vl 视觉识别技术的应用落地思路(含源码)

识别图片或者视频如何使用,在哪些场景比较适合。这里说一个可能应用的场景,如果你有素材,无论是自己拍摄的还是网络上找到的,怎么快速变成自己风格的内容。具体点的案例,做一个主题是某个热点新闻(苏超之类的)的某红书的图文或者视频内容。

2025-07-23 07:45:00 620

原创 内存泄漏终结者:用JProfiler透视Java项目的OOM黑洞

大家好,我是烤鸭:   最近线上的老服务运行一段时间就自动重启,从日志看到是发生了oom,虽然当时打印了dump日志,但由于在容器环境配置了探活,导致节点重启后没有留下dump日志。后来大家根据极少的日志进行了猜测,但效果不明显,由于是历史服务,也不太想改。只能走一步看一步,项目重启的频率差不多两周左右,直到有一天...

2025-05-12 07:45:00 400

原创 别再重复劳动!浏览器自动化实战: browser-use

大家好,我是烤鸭:最近在研究AI的落地应用,满世界都在做AI,以前还在研究大模型、GPT,现在都变成了agent、mcp。manus公布了3天就销声匿迹了,今天看下manus的前置开源工具browser-use。

2025-04-27 08:00:00 780

原创 一文了解transformer(通俗易懂版本)

最近看transformer太难懂了,就想写一篇简单的能看懂的,transformer是如何工作的。本篇不会过渡研究算法, 那玩意一般人也看不懂。

2025-04-14 08:00:00 1227

原创 从规划到执行,从源码角度看Manus如何一手掌控

大家好,我是烤鸭:前几天manus很火,不过最近几天降温了,动机也被人质疑。更可怕的是,发布3小时就有其他团队做了开源版,今天就来看看这个open-manus。

2025-03-20 00:47:43 1132

原创 超乎想象的精准—探索Qwen2.5-vl的识别魔法

大家好,我是烤鸭:今天写一篇使用开源的视频模型来进行图像/视频识别,使用的是千问模型qwen-vl-2B。

2025-03-17 07:45:00 1758

原创 Kubernetes缩容“误伤”Redis数据,问题出在哪?

大家好,我是烤鸭:这次遇到了Kubernetes部署的redis集群数据全部丢失的问题,记录一下。

2025-03-10 07:45:00 931

原创 Nacos实用指南:查看注册服务节点与检索配置

大家好,我是烤鸭:用nacos检索配置是一件很麻烦的事,没有一个全局检索的地方,不过还好开放了api,可以自己写一个页面实现节点查看和快速检索配置。文末有html直接下载地址。

2025-03-06 08:00:00 404

原创 视频卡顿分析之专利解读

nbsp; 这篇主要是写一下视频卡顿分析,去年申请了专利,有一篇文章写了后半部分,这篇写一下前半部分,数据收集的部分。

2025-02-24 07:45:00 694 1

原创 Python + WhisperX:解锁语音识别的高效新姿势

大家好,我是烤鸭: 最近在尝试做视频的质量分析,打算利用asr针对声音判断是否有人声,以及识别出来的文本进行进一步操作。asr看了几个开源的,最终选择了openai的whisper,后来发现性能不行,又换了whisperX。这是一篇实战和代码为主的文章。

2025-02-11 07:45:00 2734 3

原创 DeepSeek本地部署:轻松搭建专属代码助手

大家好,我是烤鸭: 差不多一年没写文章了,幸运的是还没失业,不过早晚会被AI取代。最近deepseek实在太火了,也来蹭一下热度。利用deepseek-r1和qwen2.5-coder搭建自己的代码助手,vscode和idea都可以用。

2025-02-08 18:19:36 2220

原创 揭秘视频音画质量的神秘面纱:探索几种独到的分析方式

我是烤鸭。今年是AI元年,最近sora更是火的不行。正好最近在搞视频质量分析,寻思写篇文章。毕竟sora生成的视频还需要评判标准,我要写的是关于视频质量分析的方式,主要分为有参考的客观打分和无参考的客观打分。

2024-03-05 08:15:00 1967

原创 Copilot:编程助手,你真的需要它吗?使用体验对比分享

最近ai火的狠,想聊聊代码里的copliot,最近几个月也使用了几款不同的copliot。

2024-02-19 08:15:00 11806 9

原创 FFmpeg实战:Java中的音视频处理命令详解

最近在搞视频体验优化脑袋大。再搞能搞过阿b和某音么。

2024-02-05 08:15:00 983

原创 # 2023 年终总结

大家好,我是烤鸭。今年的年终总结来的晚了一些,整个人变得懒惰了,文章写的也少了。

2024-02-02 08:15:00 517

原创 chatgpt驱动的视频卡顿分析.md

最近在尝试做视频卡顿分析,对python不是特别了解。以前也没感觉GPT有能好用,这次用了一下,真的是有点牛了,起码可以节省半天的工作量。使用的是百度AI-文心一言,感觉还是比较好用的。

2024-02-01 08:15:00 657

原创 tidb节点重启后,服务无法重连

tidb节点重启后服务无法重连,确切地说是两个服务,一个可以正常重连,一个不行。

2024-01-31 15:52:47 1582

原创 优化体验差点优化出大问题,imageio真的会用么?

ImageIO.read画的图片多出来了1KB多,搞不懂了。

2023-07-26 08:00:00 1139

原创 redis命令大量超时 连接数突增

这篇文章拖了3周没写出来,最后虽然给出了一个分析,但还是感觉不够说服力。毕竟出了问题、第一时间是解决问题,解决之后只能依靠历史的数据进行复盘、分析。一开始大家都说是由于redis内存刷到报警、内存碎片产生导致的,其实应该没啥关系。由于是老项目,在框架使用上需要注意,可能用了很久的框架,不知道在一些场景上的性能怎么样。比如像这次大量刷入缓存,导致内存急速上、后来停刷之后的大量过期的场景并没有实际运行过。

2023-02-13 08:15:00 2282 2

原创 对技术类的管理和绩效的一些想法

我是烤鸭。看完春晚小品的心情(除了神马组合),就跟下面这哥们一样,尬的抠脚。再加上初一跟家人出去一趟,消费是真的复苏了,哪哪都排队。本来还想去洗温泉,给商家打电话一直占线...就能想象有多少人了。最近这几天就好好在家休息休息,再抽空写篇文章复盘下,对技术类管理和绩效的一些想法。

2023-01-28 08:15:00 1587 3

原创 易盾sdk引起项目的整体耗时问题?

大家好,我是烤鸭。今年年初的时候,项目接入易盾sdk之后,随着接口调用次数增多(用到易盾sdk的接口),项目整体性能变差。写篇文章做个复盘记录,其实同事已经写过了,我借鉴部分再拓展一些。

2023-01-19 08:15:00 2096

原创 rocketmq报错的问题排查和记录 RemotingTooMuchRequestException

连续3天同一时间遇到rocketmq不可用。第一天持续1分钟,第二天持续10分钟,第三天持续40分钟。线上版本使用的4.9.2,以下源码均看的这个版本。

2023-01-16 08:15:00 4933

原创 2022 年终总结

大家好,我是烤鸭。又到了年终总结的时候了,今年是沉闷又兴奋的一年,外边卷着XX浪潮和互联网XX的声音,内心又是矛盾的继续北漂还是回家。XX是审核不让说的词。

2023-01-02 16:25:46 235

原创 再写java探针

以前写过一篇全链路探针实现的文章,最近同事间搞技术分享,再整理一篇。可惜这两年没有继续搞这方面的技术,算是两年前的拓展篇吧。很多技术只放了图,文字就不写了,可以参考下边的拓展阅读。

2022-12-22 08:15:00 774

原创 容器环境 springcloud gateway grafana prometheus采集集成与问题

大家好,我是烤鸭:记录下网关上容器后,监控升级的过程。

2022-11-07 08:15:00 1559

针对马来西亚语和粤语的tts模型实用测试,包含 Chatterbox、Step-Audio-EditX、Qwen3-1.7B-Multilingual-TTS、CosyVoice

针对马来西亚语和粤语的tts模型实用测试,包含 Chatterbox、Step-Audio-EditX、Qwen3-1.7B-Multilingual-TTS、CosyVoice。 每个模型翻了大概7句话。

2025-11-21

智能体平台dify-1.13版本的sql表结构

https://github.com/langgenius 提供的docker版本,开源提供的sql有一些缺失,项目无法运行。 从docker拉出来的结构,已验证,1.13版本可部署运行。

2025-09-11

browser-use调用测试

browser-use调用测试,idea控制台视频录制

2025-04-26

生产环境快速检索nacos注册中心服务和模拟检索配置

生产环境快速检索nacos注册中心服务和模拟检索配置,自行修改地址和用户名、密码,支持多个namespace配置。

2025-03-05

ta-lib依赖,windows-64位

ta-lib依赖,windows-64位,ta_lib 无法解析的外部命令。 TA-Lib_x64-master.zip和ta-libx64.zip结合版

2023-12-07

城市库数据,全国城市+拼音

城市库数据,全国城市+拼音

2022-06-02

springboot 2.x websocket整合

springboot 2.x websocket整合,在页面监听后台的数据(类似需求是输入邮箱后,需要用户打开邮箱,页面监听用户是否点击激活邮件)。之前的实现方式,是每隔几秒发送ajax请求,根据返回值处理。现在用websocket写了一个简化版。

2018-11-13

jqweui的picker插件动态加载数据

jqweui的picker动态加载数据 jqweui是jquery对weui的拓展开发,picker就是其中的一个拓展组件。 如果是动态加载数据的话,可以把加载方法写成一个方法,数据是加载后返回的再填充。但是有一个问题,前台要求的数据一般是key,value的形式,而picker插件只能接收单列数组。我是这么解决的,把要显示的key作为一个数组返回,其他的属性创建一个对象数组存起来。

2017-12-22

vue2省市区三级联动,mysql,html/jsp,js/json

vue2省市区三级联动,mysql,html/jsp,js/json,修复某些地区缺少。

2017-12-18

vue省市区三级联动mysql,js,html/jsp

vue省市区三级联动mysql,js,html/jsp,包含sql,js/json和html/jsp

2017-12-06

JAVA实现类似美团电影价格图片数识别

JAVA实现类似美团电影价格图片数字识别。 最近在研究爬虫,看到有意思的是美团的电影票价,普通的抓取是抓不到的。 不敢说正确率,只是尝试了几个,以上所有内容仅供技术交流,希望大家不要用到其他地方。

2017-12-03

vue2省市区三级联mysql,html/jsp,js/json

vue2省市区三级联动,mysql,html/jsp,js/json,修复某些地区缺少。

2019-02-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除