线上预测TensorRT

TensorRT入门

模型量化,动态内存优化,层的融合(横向融合,纵向融合),根据不同的输入大小模型大小设备类型选用不同的计算方法,多Stream并行;

多框架集成:支持Tensorflow, Matlab, ONNX

NLP 新闻标题分类 技术应用:Fasttext + Jieba + RoBERTa + XLNET 项目描述:针对新闻资讯场景,为满足用户个性化阅读需求,通过内嵌短文本自动多分类子任 务,精准筛选并推荐用户感兴趣的新闻,进而提升新闻平台的点击量、订阅量和付费量。 参与内容: 1.数据整理:对超10万条新闻标题数据进行系统统计,全面分析其数量及类别分布情况。运 用Jieba 分词工具,对训练集、验证集和测试集进行精细预处理,处理效率达到每小时5000 条数据,有效提升数据质量,为后续模型训练奠定坚实基础。 2.数据训练:采用随机森林和Fasttext模型开展快速评估与预测工作。通过多次迭代训练, 在验证集上随机森林模型准确率达到75%,Fasttext模型达到80%,快速确定项目的初步可行 性和方向。 3.模型优化:实施量化模型策略,引入RoBERTa和XLNET进行知识蒸馏。在量化过程中,不断 调整参数,使模型在保持较高准确率的同时,存储空间大幅缩减。知识蒸馏阶段,深入研究模 型间的知识传递机制,优化蒸馏过程。 工作成果: 1.量化模型成效:量化后,模型精确率从93.64%微降至91.92%,但模型所占空间从409.2M 锐减至152.6M,减少了约63%,极大提升了模型存储和传输效率。 2.知识蒸馏成果:蒸馏后,模型精确率为91.25% ,而模型空间大幅压缩至23.1M,仅为原来 的5.6%左右,显著降低了模型部署成本,同时在保证一定精度的情况下,提升了模型的运行 效率。
03-08
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值