
机器学习
文章平均质量分 83
花菜回锅肉
这个作者很懒,什么都没留下…
展开
-
【机器学习】基于conda虚拟环境的gcc、g++版本升级
最近在学习大模型部署,需要安装flash-attn,在编译时报错centos7.9默认gcc最高版本为4.8.5以上报错需要高版本的gcc支持,所以需要升级GCC的版本,对应关系参考这里选择9.0版本进行升级。网上搜索教程,多是 基于centos yun 安装替换方式,比较复杂,该文章基于conda虚拟环境来进行升级,操作简单,对原系统侵入少。原创 2025-03-18 11:33:35 · 394 阅读 · 0 评论 -
deepseek 本地私有化部署
deepseek 目前有DeepSeek-V3和DeepSeek-R1两个系列,DeepSeek-V3是由DeepSeek推出的一款拥有6710亿参数的专家混合(MoE)大语言模型,DeepSeek-R1是基于DeepSeek-V3-Base训练的高性能推理模型。这两个模型参数都非常大,性能也非常高,但部署成本非常高,对于小企业和个人不是很现实,但deepseek提供了蒸馏版本的小模型,但可以使用大模型的知识能力,对硬件配置要求较低。让用户以很低的成本,私有化部署大模型。原创 2025-02-06 11:52:32 · 1128 阅读 · 0 评论 -
机器学习-随机森林算法预测房租模型
1、数据预处理阶段,数据缺失值处理,要根据数据集实际含义,去选择合适的处理方式2、机器学习模型训练评估,实际工作量会在数据探索性分析和数据预处理环节,至于建模和训练只需调用封装好的函数即可。原创 2024-04-17 18:21:09 · 1537 阅读 · 0 评论 -
pandas数据分析常用函数(持续更新)
网上教程多分散,需要会员,现将学习机器学习过程中数据探索性分析用到的函数进行整理,方便后续自查。同时,会持续更新。原创 2024-04-17 11:02:18 · 940 阅读 · 0 评论 -
机器学习-随机森林温度预测模型优化
在机器学习-随机森林算法预测温度一文中,通过增大模型训练数据集和训练特征的方式去优化模型的性能,本文将记录第三方种优化方式,通过调整随机森林创建模型参数的方式去优化模型,即调参。这里调参和神经网络使用验证集调整超参数概念不太一样,所以不会去使用验证集。本文调参,将使用RandomizedSearchCV()函数,去交叉验证不同参数组合的模型性能,选择最优性能的参数组合模型。原创 2024-04-14 22:21:49 · 1054 阅读 · 0 评论 -
机器学习-随机森林算法预测温度
机器学习算法,随机森林预测温度原创 2024-04-09 18:06:01 · 2363 阅读 · 0 评论 -
Kaggle网站使用问题汇总
新用户注册Captcha must be filled out问题,数据集无法下载问题原创 2024-04-09 18:06:18 · 765 阅读 · 0 评论