- 博客(14)
- 收藏
- 关注
原创 书生大模型实战营第4期——L1-ToolChain
L1G1000书生大模型全链路开源体系书生·浦语(InternLM)是由上海人工智能实验室主导开发的开源大型语言模型,旨在提供从数据采集、模型训练到实际应用的全流程解决方案。其最新版本InternLM2.5在推理能力和上下文处理容量上实现了显著提升,支持长达百万级别的上下文输入,在多个指标上超越同类开源模型。
2024-11-12 17:38:40
498
原创 书生大模型实战营第4期——L1-Evaluation
OpenCompass 提供了和两种方式。其中 API 模式评测针对那些以 API 服务形式部署的模型,而本地直接评测则面向那些可以获取到模型权重文件的情况。
2024-11-09 23:09:35
756
原创 书生大模型实战营第4期——L0-Linux
注意终端右边自动配置了端口转发,如果使用SSH的话就要麻烦一些,需要转发到本机的端口访问互联网的图片。
2024-11-03 20:38:43
403
原创 Datawhale X 李宏毅苹果书 AI夏令营(三):实践方法论
不匹配跟过拟合其实不同,一般的过拟合可以用搜集更多的数据来克服,但是不匹配是指训练集跟测试集的分布不同,训练集再增加其实也没有帮助了。假设数据在分训练集跟测试集的时候,使用 2020年的数据作为训练集,使用2021年的数据作为测试集,不匹配的问颖可能就很严重。实际上我认为就是使用更多合理或者可能合理的自变量,这样一方面确实增大了模型复杂度,但是也让模型更有可能在多维空间里拟合收敛假设存在的那个曲线。但是该函数的集合太小了,没有包含任何一个函数,可以让损失变低的函数不在模型可以描述的范围内。
2024-09-01 23:47:07
396
原创 Datawhale X 李宏毅苹果书 AI夏令营(二):线性模型
把输入的特征 x 乘上一个权重,再加上一个偏置就得到预测的结果,这样的模型称为线性模型(linear model)。
2024-08-31 23:54:49
269
原创 Datawhale X 李宏毅苹果书 AI夏令营(一):机器学习定义
这是一个猜测,也许今天的观看次数,总是会跟昨天的观看次数有点关联,所以把昨天的观看次数,乘上一个数值,但是总是不会一模一样,所以再加上一个 b 做修正,当作是对于 2 月 26 日,观看次数的预测,这是一个猜测,它不一定是对的,等一下回头会再来修正这个猜测。模型在机器学习里面,就是一个带有未知的参数的函数,特征(feature) x1 是这个函数里面已知的,它是来自于后台的信息,2 月 25 日点击的总次数是已知的,而 w 跟 b 是未知的参数。代表它们是最好的一组 w 跟 b,可以让损失的值最小。
2024-08-27 23:14:56
646
1
原创 stringstream,istringstream和ostringstream
stringstream,istringstream和ostringstream
2022-07-01 10:55:34
1082
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅