自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 RTX5090 VS RTX 5080 Laptop 做大模型训练比较

摘要:作者分享了RTX 5080笔记本(16G显存/64G内存/U9 CPU)的大模型开发使用体验。测试显示,使用lmdeploy加载7B模型时需CUDA 12.8编译包,相比vllm可节省1/3显存,但16G显存限制上下文token约5000。微调测试中,在未突破硬件上限时,5080笔记本比云端5090慢3-4倍;突破上限后预计差距达6-8倍。同时发现相同参数下,不同GPU训练效果存在差异。本文为开发者提供了实用的硬件选型参考和性能对比数据。

2025-11-24 15:40:09 200

原创 企业级大模型选型与验证系统架构图

本文探讨企业级大模型应用的两大核心挑战:本地部署的模型选型和效果验证。在选型方面,强调需要寻找资源消耗小、推理速度快,且在各业务场景都能保持良好性能的模型,而非追求极致表现。在效果验证方面,提出需要建立可靠的评估机制来测试训练后的模型表现。文章还展示了一个架构图,呈现了该项目的整体技术框架。这些问题对于企业垂直领域的大模型应用落地至关重要。

2025-11-12 00:04:21 122

原创 Llama_Factory 微调训练批次结果对比

这是一次使用llama_factory局部微调的训练批次效果对比图。总共训练了9876次。通过对比可以发现随着训练批次与模型返回的语法结构及内容方面的相关性。训练模型:Qwen2.5-7B-Instruct。

2025-11-02 00:46:50 251

原创 MT4的交易记录导入“复盘大师3”的解决办法

MT4自动复盘完成后,无法改变时间周期。5m上做的复盘,无法在1h上看复盘历史,缺少全局视角。方案思路:复盘大师3 提供了API接口,通过Dll实现。通过DLL读取EA生成的数据交换文件,即可实现交易记录的导入。

2022-09-15 14:10:49 1313

原创 关于不能在子线程(Thread)中创建 Handler消息的解决方法

如果在一个子线程中创建的类中,创建一个Handler消息对象,会报错。解决方法是在子线程调用主线程的Handler,在执行创建操作。

2020-12-06 14:02:36 295

原创 设置TextView的文字和背景的透明度

textview.setBackgroundColor(Color.argb(55, 0, 255, 0)); ///背景透明度textview.setTextColor(Color.argb(55, 0, 255, 0)); //文字透明度

2020-11-26 17:41:10 290

原创 Android显示圆角的Dialog,并包含从底部滑出的代码

代码调用部分private void showSpecDialog_Pre() { //注意这里需要使用Style AlertDialog.Builder builder = new AlertDialog.Builder(getContext(),R.style.ActionSheetDialogStyle); RelativeLayout relativeLayout = (RelativeLayout) LayoutInflater.from(getConte

2020-11-26 15:48:44 206

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除