iwgh-优快云博客

原创【有手就行】SWIFT：花20分钟把大模型的名字变成你的名字

你有没有问过大模型`“你是谁”`？问了的话，拿到的答案清一色都是大模型厂商的名字。而如果你自己部署了一个模型的话，通常都希望有人在你的应用里问你是谁的时候能给出一个`“你的答案”`。**<font color=red>这篇文章就是干这个事情的，20分钟让大模型的名字变成你自己的名字。</font>**

2025-12-20 22:44:36 626

原创【有手就行】LoRA：用你自己的数据来微调大模型，让大模型真正懂你

在现在这个时代，完全可以说，大部分的技术都是没有什么价值的，因为大部分的技术都是**有手就行**。真正的价值都在数据，而且最有价值的数据往往都是一个个的专业领域的数据，决定大模型微调效果的是数据，决定你整个产品成败的也是数据，这个事情一定要搞清楚。

2025-12-14 22:11:51 819

原创【有手就行】自己花20分钟从0开始训练一个“大模型”

本文介绍了一个轻量级中文GPT模型训练项目GPT_teacher-3.37M-cn，该模型仅3.37M参数，可在普通CPU上20分钟内完成训练。文章详细展示了从环境准备、分词器构建到训练测试的完整流程，重点解析了模型采用的RMSNorm、RoPE位置编码等优化技术。虽然小参数模型存在局限性，但该项目为理解大模型训练提供了实践机会。最后还探讨了大模型幻觉成因及使用时的调参技巧，帮助初学者快速入门大模型训练与应用。

2025-12-06 23:51:07 340

原创 OddAgent：轻松手搓一个你自己的“小艺”、“小爱同学”

想自己动手来手搓一个完全属于你自己的“小爱同学”、“小艺”吗？如果有你这么一个想法，而又不知道该如何开始的话，那么OddAgent项目可以成为你非常容易上手的开源项目。

2025-11-09 22:14:17 641

原创 AI编程：国内外主流大模型的集体翻车

摘要：作者尝试用多个AI大模型（包括TRAE、通义灵码、豆包等）生成"OddMeta"的ASCII艺术字，但无一成功。尽管反复修改提示词，各模型要么输出错误文字，要么声称已修改但实际未改。这一简单需求耗费数小时未果，让作者对当前AI的实际能力产生质疑，最终愤而记录这次失败经历。

2025-10-19 22:05:32 408

原创 frp：让你家里的电脑也可以被公网访问

本文介绍了如何利用FRP工具实现内网穿透，将家庭电脑的服务通过阿里云ECS暴露到公网。作者选择了FRP作为解决方案，详细记录了在Linux服务器和Windows客户端的配置步骤，包括安全组设置、防火墙配置、FRP服务端和客户端的安装与参数调整。文章重点演示了HTTP模式的成功配置过程，并简要提及了HTTPS模式的配置方法。通过这一方案，老旧家庭电脑可以继续发挥作用，同时为现有服务扩展功能提供了可能。

2025-10-14 23:58:54 923

原创 OddTTS：基于EdgeTTS、GPTSovits等语音生成的API封装，支持Web前端+API接口

一个开源的TTS引擎API封装，支持EdgeTTS, GPT Sovits（非开箱即用，需要额外部署）,Bert-VITS2等等。

2025-09-14 23:00:39 596

原创 OddASR：基于FunASR的API封装，支持离线转写+流式转写

github上有好多FunASR的API封装，但是全是离线文件转写的，没有一个同时支持离线文件转写和流式转写的API封装项目，想了一下干脆直接把它开源出来吧。希望对有ASR需求的同学有帮助。

2025-06-09 18:54:23 2216

原创快速入手最新的Gemma 3n：一个手机、平板、笔记本皆可运行的多模态文本+图像+音频的全能模型

Google 把这玩意儿一出，好了，我又有得搞了。小落同学又要大改了。但是我又对我的小落同学有了更多的一些期待了。之前的ASR用了一些小模型，结果识别准确率太差；然后用白嫖的百度文心一言LLM API，它的上下文只有8K，稍长一点的记忆他就忘记。这下有了32K上下文并且全能的Gemma 3n，咱可以看来搞搞看，效果会是如何。加油！

2025-05-25 02:12:39 2101

原创 Three.js:经过一番痛苦的思想斗争，我还是放弃了3D虚拟人，转投2D

在过去的一段时间里，我花费了大量精力钻研three.js技术，期望能将小落同学的形象塑造为3D虚拟人，实现与用户的交互功能。为此，我对vrm/obj/fbx模型进行了反复调整，还结合mixamo的动作资源进行适配。然而，无论我如何努力，始终无法达到理想的效果。在实际展示中，模型与动作之间总是存在各种问题，比如部分动作出现模型撕裂现象，或是动作呈现出不自然的颤抖，这让我十分苦恼。经过五一假期的深思熟虑，我决定暂时搁置3D方案，转向2D领域寻求解决办法。

2025-05-04 16:17:00 796

原创 ASR引擎测试：FunASR，再给阿里点一个赞

凭良心讲，阿里在开源FunASR的时候是真的够诚意，很地道。FunASR这玩意儿TMD基本上就是一个商业化的东西直接开源出来给大家用了。

2025-04-27 13:40:33 2653

原创可能是最紧凑、最轻量级的ASR模型：Vosk实战解析

前面在我的笔记本上用FunASR和PaddleSpeech为小落同学整合了一下ASR的功能，但是发现在我的阿里云ECS上跑不动，由于是乎就想找一个最轻量级的ASR模型，让小落同学也可以用上免费白嫖的ASR功能。

2025-04-20 23:24:11 1401

原创 Dify + 知识库预研：性能、部署与测试全揭秘

Dify + 知识库预研：性能、部署与测试全揭秘

2025-04-15 23:02:12 1548

原创关于String转化的问题

现有一个文本文件里边内容如下：0x88;0xB2;0x01; 我把这个文本文件读出来后要把这些数字转换成一个char* szBuffer;szBuffer = (char*)malloc(3);szBuffer[0] = 0x88;szBuffer[1] = 0xB2;szBuffer[2] = 0x01;sscanf( token, "%x", &i );

2006-02-24 13:56:00 674

将TS流文件发送到以太网络上（源码）

一个小工具，将TS流文件发送到以太网络上。支持使用UDP或者RTP协议。根据TS流的PCR值跟踪时间同步发送。我用的GetTickCount进行发送时间同步，线程按照10毫秒进行轮回，按照Win32系统普通线程切换时间，应该可以保证到10毫秒左右的同步精度。但听人提过使用GetTickCount进行时间同步，长时间会有时间漂移现象，而且误差会逐渐累加，直到客户端缓冲溢出。对方提出的解决方案是使用GPS卫星时间同步... 个人以为GetTickCount是使用Win32底层的某个高精度时间结果。在微观上不是很精确，但是宏观上应该是很精确。我实际曾经使用这个工具，发送过同一个文件三天三夜，客户端使用VideoLan进行在线播放，缓冲设置300ms，没有发现VideoLan缓冲有溢出的情况。如果这种同步方式，长时间发送，确实有精度问题，希望有同志给出例证和解决方案(除了使用GPS卫星时间以外的方案...)。以便我改进。 demo中根据以太网通常的MTU值直接按7个TS包进行封装： SetGetTsPacketDataCB(GetTsPacketData, NULL, TS_PACKET_SIZE_MIN*7); 如果是其他网络类型，需要根据网络的MTU值调整TS包数量。

2009-11-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人