浅谈AI落地之分类问题

最新推荐文章于 2025-11-29 12:55:56 发布

原创最新推荐文章于 2025-11-29 12:55:56 发布 · 271 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

部署运行你感兴趣的模型镜像

前言

曾在游戏世界挥洒创意，也曾在前端和后端的浪潮间穿梭，如今，而立的我仰望AI的璀璨星空，心潮澎湃，步履不停！愿你我皆乘风破浪，逐梦星辰！

心得1：

提高模型训练的精度，两方面着手：数据的质量 + 训练的轮次。

心得2：

在处理分类问题时，训练集中每个类别数据量必须均衡。反言之，当训练模型的数据量有多有少的时候，模型最后输出的结果会偏向数据量多的那一方。

心得3：

数据分布不均衡怎么搞？首先，一般来说，在NLP里只能处理占比较多的分类，给他截断成其他类别的数据量。小模型+视觉里的话，除了截断，还可以调整损失函数为focalLoss，这是专门来处理样本分布不均衡的问题的。最早用这个技术解决样本分布不均衡的模型是yolo。

心得4：

imbalanced库可以解决数据不均衡的问题。一般采用欠采样（under sampling），简单地说就是把多的数据变少一点。过采用（over sampling）一般不采用，因为这是在瞎造数据。

心得5：

文本生成模型，举个例子，gpt2-chinese，文本生成的原理就是每次生成判定每个词的概率，当do_sample=True的时候，每次生成概率最大的那个字，这就解释了为什么do_sample=True的时候冻结了生成模型的随机性。

您可能感兴趣的与本文相关的镜像

Qwen3-8B

Qwen3-8B

文本生成

Qwen3

Qwen3 是 Qwen 系列中的最新一代大型语言模型，提供了一整套密集型和专家混合（MoE）模型。基于广泛的训练，Qwen3 在推理、指令执行、代理能力和多语言支持方面取得了突破性进展

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。