- 博客(5)
- 收藏
- 关注
原创 百川-M1:推动大语言模型的医疗能力 - 论文摘要笔记
本文介绍了百川-M1,一个专为医疗应用优化的系列大语言模型 (LLM)。与那些在现有通用模型上进行微调的方法不同,百川-M1 是的,训练数据量达到,并专注于提升医疗能力,同时平衡了通用技能。它融合了有效的训练方法,使其不仅在数学、编码等通用领域表现强劲,也在专业的医疗领域表现出色。论文强调了已开源的百川-M1-14B(一个较小版本)。
2025-04-23 09:35:07
834
原创 使用PaddleClas完成半导体晶圆图谱缺陷种类识别 - 学习笔记
MIR Lab 公开数据集 (http://mirlab.org/dataSet/public/)。MATLAB.mat文件和 Python.pkl文件。原始包含 811,457 张图,其中 172,950 张带有 9 种缺陷类别标签 (0-8)。从.pkl文件转换得到的.jpg图像格式。选取了部分带标签数据制作成 PaddleClas 要求的格式。位于项目路径。# 查看数据集压缩包!
2025-04-20 08:24:48
1130
原创 学习笔记:基于3D分割实现自动判断脂肪肝和严重程度
该项目成功演示了如何利用 3D 图像分割技术自动化处理一项重复性的临床诊断任务,展示了 AI 在医学影像辅助诊断方面的潜力。方法流程清晰,结合了分割模型和具体的临床计算逻辑。局限性:报告的 Dice 分数(肝 0.92, 脾 0.90)虽然不错,但在细节和边界处可能仍有改进空间,这会影响后续 CT 值计算的准确性。88 个训练样本对于深度学习模型来说可能偏少,尤其是在面对不同扫描设备、不同病患群体的差异时,模型的泛化能力可能有限。随机小立方体采样是一种方法,但其代表性和稳定性可能有待商榷。
2025-04-20 02:40:09
2256
原创 Datawhale AI春训营:高级气象预测技术
将全球气象预测问题转化为结构化回归问题。核心挑战:数百万初始特征(历史时刻 × 变量 × 纬度 × 经度)。需要预测未来12个时间步(72小时)的30个目标变量。相邻格点的气象状态高度相关。
2025-04-20 00:06:43
2174
原创 Datawhale AI春训营:新能源功率预测竞赛 Baseline 解析与实践
(已完成,教程未详述)理解数据特性、变量关系。处理缺失值、异常值等。从原始数据提取、构建有效特征。使用算法(如 LightGBM)学习数据模式。评估模型性能(如 K-Fold 交叉验证)。按要求格式提交预测结果。(已完成,教程未详述)理解数据特性、变量关系。处理缺失值、异常值等。从原始数据提取、构建有效特征。使用算法(如 LightGBM)学习数据模式。评估模型性能(如 K-Fold 交叉验证)。按要求格式提交预测结果。(已完成,教程未详述)理解数据特性、变量关系。
2025-04-19 23:53:00
1708
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅