- 博客(9)
- 收藏
- 关注
原创 行业黑话ASR模型训练数据处理方案
若语音为“dongguai”,文本标注需与发音一致(即“dongguai”),否则模型难以建立正确的音素-文字关联。直接标注为“07”会导致模型混淆,影响识别效果。,在保证模型鲁棒性的前提下,通过轻量级后处理满足行业需求。若黑话词汇固定且数据充足,可尝试方案二,但需严密监控模型性能。在处理行业黑话的ASR模型训练时,需根据应用场景和数据特点选择策略。ASR模型的本质是学习。
2025-04-12 16:15:13
287
原创 神经网络代码
步骤 1:数据预处理与分析检查标签分布统计各技能等级的样本数量,若存在类别不平衡,采用以下方法:过采样(如SMOTE) 或 加权损失函数(如class_weight参数)。使用分层抽样确保训练集和测试集的分布一致。特征标准化尽管数据已进行过 Ratio/Log 处理,建议使用 StandardScaler 或 MinMaxScaler 进一步标准化,确保特征尺度一致。数据集划分按比例划分:训练集(70%)、验证集(15%)、测试集(15%)。
2025-02-26 00:56:57
427
转载 Selenium元素查找手册
是最广泛使用的开源 WebUI(用户界面)自动化测试套件之一,他是一套Web网站 的程序自动化操作解决方案。Selenium 支持的语言包括C#,Java,Perl,PHP,Python 和 Ruby。目前,Selenium Web 驱动程序最受 Python 和 C#欢迎。Selenium 测试脚本可以使用任何支持的编程语言进行编码,并且可以直接在大多数现代 Web 浏览器中运行。在爬虫领域 selenium 同样是一把利器,能够解决大部分的网页的反爬问题。
2023-07-13 17:38:21
435
1
原创 Python客户端
Python客户端框架当下流行框架与选择Tkinter python自带,用于简单项目Pyqt 适用与成熟项目kivy 适用于跨平台软件,windows/linux/android/mac都适用
2023-07-05 22:46:49
229
1
原创 技术成长路线 Growth routing
配置中心组件:配置中心组件是微服务架构中管理配置信息的重要组件。服务注册与发现组件是微服务架构中必不可少的组件。主流的服务注册与发现组件包括Consul、Zookeeper、Eureka等。服务调用组件是微服务架构中实现服务之间调用的关键组件。API网关组件是微服务架构中实现API聚合和统一访问的重要组件。深入理解分布式系统的原理和设计思想,掌握分布式系统的常用组件如Zookeeper、Dubbo、Kafka等。掌握微服务架构的设计和实现,了解微服务架构的优缺点以及如何选择和使用微服务组件。
2023-05-31 17:33:43
112
1
https://github.com/explosion/spacy-models/releases?q=zh-core-web
2024-08-15
3 models for chatapi
2024-08-14
model files for table-transformer-structure-recongnition
2024-08-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人