自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

罗索工作室

Rosoo Studio

  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 【有手就行】SWIFT:花20分钟把大模型的名字变成你的名字

你有没有问过大模型`“你是谁”`?问了的话,拿到的答案清一色都是大模型厂商的名字。而如果你自己部署了一个模型的话,通常都希望有人在你的应用里问你是谁的时候能给出一个`“你的答案”`。**<font color=red>这篇文章就是干这个事情的,20分钟让大模型的名字变成你自己的名字。</font>**

2025-12-20 22:44:36 626

原创 【有手就行】LoRA:用你自己的数据来微调大模型,让大模型真正懂你

在现在这个时代,完全可以说,大部分的技术都是没有什么价值的,因为大部分的技术都是**有手就行**。真正的价值都在数据,而且最有价值的数据往往都是一个个的专业领域的数据,决定大模型微调效果的是数据,决定你整个产品成败的也是数据,这个事情一定要搞清楚。

2025-12-14 22:11:51 819

原创 【有手就行】自己花20分钟从0开始训练一个“大模型”

本文介绍了一个轻量级中文GPT模型训练项目GPT_teacher-3.37M-cn,该模型仅3.37M参数,可在普通CPU上20分钟内完成训练。文章详细展示了从环境准备、分词器构建到训练测试的完整流程,重点解析了模型采用的RMSNorm、RoPE位置编码等优化技术。虽然小参数模型存在局限性,但该项目为理解大模型训练提供了实践机会。最后还探讨了大模型幻觉成因及使用时的调参技巧,帮助初学者快速入门大模型训练与应用。

2025-12-06 23:51:07 340

原创 OddAgent:轻松手搓一个你自己的“小艺”、“小爱同学”

想自己动手来手搓一个完全属于你自己的“小爱同学”、“小艺”吗?如果有你这么一个想法,而又不知道该如何开始的话,那么OddAgent项目可以成为你非常容易上手的开源项目。

2025-11-09 22:14:17 641

原创 AI编程:国内外主流大模型的集体翻车

摘要:作者尝试用多个AI大模型(包括TRAE、通义灵码、豆包等)生成"OddMeta"的ASCII艺术字,但无一成功。尽管反复修改提示词,各模型要么输出错误文字,要么声称已修改但实际未改。这一简单需求耗费数小时未果,让作者对当前AI的实际能力产生质疑,最终愤而记录这次失败经历。

2025-10-19 22:05:32 408

原创 frp:让你家里的电脑也可以被公网访问

本文介绍了如何利用FRP工具实现内网穿透,将家庭电脑的服务通过阿里云ECS暴露到公网。作者选择了FRP作为解决方案,详细记录了在Linux服务器和Windows客户端的配置步骤,包括安全组设置、防火墙配置、FRP服务端和客户端的安装与参数调整。文章重点演示了HTTP模式的成功配置过程,并简要提及了HTTPS模式的配置方法。通过这一方案,老旧家庭电脑可以继续发挥作用,同时为现有服务扩展功能提供了可能。

2025-10-14 23:58:54 923

原创 OddTTS:基于EdgeTTS、GPTSovits等语音生成的API封装,支持Web前端+API接口

一个开源的TTS引擎API封装,支持EdgeTTS, GPT Sovits(非开箱即用,需要额外部署),Bert-VITS2等等。

2025-09-14 23:00:39 596

原创 OddASR:基于FunASR的API封装,支持离线转写+流式转写

github上有好多FunASR的API封装,但是全是离线文件转写的,没有一个同时支持离线文件转写和流式转写的API封装项目,想了一下干脆直接把它开源出来吧。希望对有ASR需求的同学有帮助。

2025-06-09 18:54:23 2216

原创 快速入手最新的Gemma 3n:一个手机、平板、笔记本皆可运行的多模态文本+图像+音频的全能模型

Google 把这玩意儿一出,好了,我又有得搞了。小落同学又要大改了。但是我又对我的小落同学有了更多的一些期待了。之前的ASR用了一些小模型,结果识别准确率太差;然后用白嫖的百度文心一言LLM API,它的上下文只有8K,稍长一点的记忆他就忘记。这下有了32K上下文并且全能的Gemma 3n,咱可以看来搞搞看,效果会是如何。加油!

2025-05-25 02:12:39 2101

原创 Three.js:经过一番痛苦的思想斗争,我还是放弃了3D虚拟人,转投2D

在过去的一段时间里,我花费了大量精力钻研three.js技术,期望能将小落同学的形象塑造为3D虚拟人,实现与用户的交互功能。为此,我对vrm/obj/fbx模型进行了反复调整,还结合mixamo的动作资源进行适配。然而,无论我如何努力,始终无法达到理想的效果。在实际展示中,模型与动作之间总是存在各种问题,比如部分动作出现模型撕裂现象,或是动作呈现出不自然的颤抖,这让我十分苦恼。经过五一假期的深思熟虑,我决定暂时搁置3D方案,转向2D领域寻求解决办法。

2025-05-04 16:17:00 796

原创 ASR引擎测试:FunASR,再给阿里点一个赞

凭良心讲,阿里在开源FunASR的时候是真的够诚意,很地道。FunASR这玩意儿TMD基本上就是一个商业化的东西直接开源出来给大家用了。

2025-04-27 13:40:33 2653

原创 可能是最紧凑、最轻量级的ASR模型:Vosk实战解析

前面在我的笔记本上用FunASR和PaddleSpeech为小落同学整合了一下ASR的功能,但是发现在我的阿里云ECS上跑不动,由于是乎就想找一个最轻量级的ASR模型,让小落同学也可以用上免费白嫖的ASR功能。

2025-04-20 23:24:11 1401

原创 Dify + 知识库预研:性能、部署与测试全揭秘

Dify + 知识库预研:性能、部署与测试全揭秘

2025-04-15 23:02:12 1548

原创 关于String转化的问题

现有一个文本文件里边内容如下:0x88;0xB2;0x01;  我把这个文本文件读出来后要把这些数字转换成一个char* szBuffer;szBuffer = (char*)malloc(3);szBuffer[0] = 0x88;szBuffer[1] = 0xB2;szBuffer[2] = 0x01;sscanf( token, "%x", &i );

2006-02-24 13:56:00 674

将TS流文件发送到以太网络上(源码)

一个小工具,将TS流文件发送到以太网络上。 支持使用UDP或者RTP协议。 根据TS流的PCR值跟踪时间同步发送。 我用的GetTickCount进行发送时间同步,线程按照10毫秒进行轮回,按照Win32系统普通线程切换时间,应该可以保证到10毫秒左右的同步精度。 但听人提过使用GetTickCount进行时间同步,长时间会有时间漂移现象,而且误差会逐渐累加,直到客户端缓冲溢出。对方提出的解决方案是使用GPS卫星时间同步... 个人以为GetTickCount是使用Win32底层的某个高精度时间结果。在微观上不是很精确,但是宏观上应该是很精确。 我实际曾经使用这个工具,发送过同一个文件三天三夜,客户端使用VideoLan进行在线播放,缓冲设置300ms,没有发现VideoLan缓冲有溢出的情况。 如果这种同步方式,长时间发送,确实有精度问题,希望有同志给出例证和解决方案(除了使用GPS卫星时间以外的方案...)。以便我改进。 demo中根据以太网通常的MTU值直接按7个TS包进行封装: SetGetTsPacketDataCB(GetTsPacketData, NULL, TS_PACKET_SIZE_MIN*7); 如果是其他网络类型,需要根据网络的MTU值调整TS包数量。

2009-11-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除