浥青城-优快云博客

原创书生大模型实战营第4期——L1-XTuner

L1G5000XTuner 微调个人小助手认知。

2024-11-14 02:37:30 820

原创书生大模型实战营第4期——L1-Prompt

L1G3000浦语提示词工程实践。

2024-11-13 01:49:10 229

原创书生大模型实战营第4期——L1-LlamaIndex

L1G4000InternLM + LlamaIndex RAG 实践。

2024-11-13 01:17:36 952

原创书生大模型实战营第4期——L1-InternIntro

L1G2000玩转书生「多模态对话」与「AI搜索」产品调研。

2024-11-12 17:56:03 249

原创书生大模型实战营第4期——L1-ToolChain

L1G1000书生大模型全链路开源体系书生·浦语（InternLM）是由上海人工智能实验室主导开发的开源大型语言模型，旨在提供从数据采集、模型训练到实际应用的全流程解决方案。其最新版本InternLM2.5在推理能力和上下文处理容量上实现了显著提升，支持长达百万级别的上下文输入，在多个指标上超越同类开源模型。

2024-11-12 17:38:40 498

原创书生大模型实战营第4期——L1-Evaluation

OpenCompass 提供了和两种方式。其中 API 模式评测针对那些以 API 服务形式部署的模型，而本地直接评测则面向那些可以获取到模型权重文件的情况。

2024-11-09 23:09:35 756

原创书生大模型实战营第4期——L0-maas

这两个板块感觉目前还不是刚需，等以后回来更新。

2024-11-07 21:51:33 321

原创书生大模型实战营第4期——L0-git

【代码】书生大模型实战营第4期——L0-git。

2024-11-07 17:16:34 199

原创书生大模型实战营第4期——L0-Linux

注意终端右边自动配置了端口转发，如果使用SSH的话就要麻烦一些，需要转发到本机的端口访问互联网的图片。

2024-11-03 20:38:43 403

原创 Datawhale X 李宏毅苹果书 AI夏令营（三）：实践方法论

不匹配跟过拟合其实不同，一般的过拟合可以用搜集更多的数据来克服，但是不匹配是指训练集跟测试集的分布不同，训练集再增加其实也没有帮助了。假设数据在分训练集跟测试集的时候，使用 2020年的数据作为训练集，使用2021年的数据作为测试集，不匹配的问颖可能就很严重。实际上我认为就是使用更多合理或者可能合理的自变量，这样一方面确实增大了模型复杂度，但是也让模型更有可能在多维空间里拟合收敛假设存在的那个曲线。但是该函数的集合太小了，没有包含任何一个函数，可以让损失变低的函数不在模型可以描述的范围内。

2024-09-01 23:47:07 396

原创 Datawhale X 李宏毅苹果书 AI夏令营（二）：线性模型

把输入的特征 x 乘上一个权重，再加上一个偏置就得到预测的结果，这样的模型称为线性模型（linear model）。

2024-08-31 23:54:49 269

原创 Datawhale X 李宏毅苹果书 AI夏令营（一）：机器学习定义

这是一个猜测，也许今天的观看次数，总是会跟昨天的观看次数有点关联，所以把昨天的观看次数，乘上一个数值，但是总是不会一模一样，所以再加上一个 b 做修正，当作是对于 2 月 26 日，观看次数的预测，这是一个猜测，它不一定是对的，等一下回头会再来修正这个猜测。模型在机器学习里面，就是一个带有未知的参数的函数，特征（feature） x1 是这个函数里面已知的，它是来自于后台的信息，2 月 25 日点击的总次数是已知的，而 w 跟 b 是未知的参数。代表它们是最好的一组 w 跟 b，可以让损失的值最小。

2024-08-27 23:14:56 646 1

原创 stringstream,istringstream和ostringstream

stringstream,istringstream和ostringstream

2022-07-01 10:55:34 1082 1

Joe66693的博客