- 博客(8)
- 收藏
- 关注
原创 Kaggle竞赛 LLM - Detect AI Generated Text
该文章分享我在 Kaggle竞赛 LLM - Detect AI Generated Text 中拿到铜牌的解决方案和具体代码,以及如何在 Kaggle 平台上提交代码结果。主要用了机器学习集成模型投票法以及TF-IDF特征表示,可以用作项目练手。地址:LLM - Detect AI Generated Text | KaggleLLM - Detect AI Generated Text | KaggleLLM - Detect AI Generated Text | Kaggle
2024-02-22 00:19:06
2271
3
原创 如何训练一个简单的stable diffusion模型(附详细注释)
我们的训练计划是,取出这些输入图片然后对它们增添噪声,在这之后把带噪的图片送入模型。在推理阶段,我们将用模型的预测值来不断迭代去除这些噪点。在diffusers中,这两个步骤都是由 管理器(调度器) 来处理的。噪声管理器决定在不同的迭代周期时分别加入多少噪声。# 绘图查看输入 (x) 与噪声是如何在不同迭代周期中量化和叠加的# 使用noise_scheduler.add_noise功能来添加不同程度的噪声# 定义模型),),开始训练模型# 创建了一个对象,用于调度噪声的添加。
2023-10-20 20:37:10
10057
5
原创 Ai4S 生命科学赛道(学习笔记)
本次比赛提供健康人和年龄相关疾病患者的甲基化数据,需要通过分析甲基化数据的模式和特征建立预测模型,可以根据某个人的甲基化数据来预测其生物学年龄。任务:构建一个生物学时钟能够评价所提供样本的生物学年龄,对于健康样本,生物学年龄尽可能接近真实年龄。对于患病样本,生物学年龄比真实年龄更大。公开数据包含10296个样本,其中7833个样本为健康样本。每一个样本提供485512个位点的甲基化数据、年龄与患病情况。抽取80%作为训练样本,20%作为测试样本。
2023-08-24 23:31:50
642
8
原创 AI量化模型预测挑战赛
根据得分,结果在训练集上表现得很好,但在测试集或实际应用中表现不佳,泛化能力差。数据量有240万多条,是足够的,猜测问题可能是采用的交叉验证方式不当和特征选择不当,在未来将继续不断尝试、改进优化。
2023-08-06 02:26:14
306
原创 周报总结1
本周学习时间较少,于是在此将之前学过的一些内容也一并总结一下。一、数据类型转换 1.八种基本数据类型除布尔类型之外剩下的七种类型之间都可以相互转换。 2.小容量向大容量转换,为自动类型转换。 byte<short<int<long<float<double char < char和short可表示的种类数量相同,但char可取更大的正整数。 3.大
2022-11-06 11:14:04
141
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人