- 博客(7)
- 收藏
- 关注
原创 RTX5090 VS RTX 5080 Laptop 做大模型训练比较
摘要:作者分享了RTX 5080笔记本(16G显存/64G内存/U9 CPU)的大模型开发使用体验。测试显示,使用lmdeploy加载7B模型时需CUDA 12.8编译包,相比vllm可节省1/3显存,但16G显存限制上下文token约5000。微调测试中,在未突破硬件上限时,5080笔记本比云端5090慢3-4倍;突破上限后预计差距达6-8倍。同时发现相同参数下,不同GPU训练效果存在差异。本文为开发者提供了实用的硬件选型参考和性能对比数据。
2025-11-24 15:40:09
200
原创 企业级大模型选型与验证系统架构图
本文探讨企业级大模型应用的两大核心挑战:本地部署的模型选型和效果验证。在选型方面,强调需要寻找资源消耗小、推理速度快,且在各业务场景都能保持良好性能的模型,而非追求极致表现。在效果验证方面,提出需要建立可靠的评估机制来测试训练后的模型表现。文章还展示了一个架构图,呈现了该项目的整体技术框架。这些问题对于企业垂直领域的大模型应用落地至关重要。
2025-11-12 00:04:21
122
原创 Llama_Factory 微调训练批次结果对比
这是一次使用llama_factory局部微调的训练批次效果对比图。总共训练了9876次。通过对比可以发现随着训练批次与模型返回的语法结构及内容方面的相关性。训练模型:Qwen2.5-7B-Instruct。
2025-11-02 00:46:50
251
原创 MT4的交易记录导入“复盘大师3”的解决办法
MT4自动复盘完成后,无法改变时间周期。5m上做的复盘,无法在1h上看复盘历史,缺少全局视角。方案思路:复盘大师3 提供了API接口,通过Dll实现。通过DLL读取EA生成的数据交换文件,即可实现交易记录的导入。
2022-09-15 14:10:49
1313
原创 关于不能在子线程(Thread)中创建 Handler消息的解决方法
如果在一个子线程中创建的类中,创建一个Handler消息对象,会报错。解决方法是在子线程调用主线程的Handler,在执行创建操作。
2020-12-06 14:02:36
295
原创 设置TextView的文字和背景的透明度
textview.setBackgroundColor(Color.argb(55, 0, 255, 0)); ///背景透明度textview.setTextColor(Color.argb(55, 0, 255, 0)); //文字透明度
2020-11-26 17:41:10
290
原创 Android显示圆角的Dialog,并包含从底部滑出的代码
代码调用部分private void showSpecDialog_Pre() { //注意这里需要使用Style AlertDialog.Builder builder = new AlertDialog.Builder(getContext(),R.style.ActionSheetDialogStyle); RelativeLayout relativeLayout = (RelativeLayout) LayoutInflater.from(getConte
2020-11-26 15:48:44
206
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅