医疗机器学习应用的挑战与机遇
1. 机器学习应用的技术集成挑战
在设计机器学习应用时,技术集成是一个常见的挑战。例如,在开发聊天机器人应用时,前端应用通常使用对机器友好的语言,如 C# 或 Java 来创建,而聊天机器人的智能部分则在 Python 中运行。这就需要将两者集成在一起,可通过各种插件技术实现,如将 C# 集成到 Python 或反之,然后让它们通过这些插件库进行通信。
如果聊天机器人需要通过网站与人类交互,就需要一种从网页前端 GUI 连接到 Python 代码的方法,像 Flask 这样的服务和技术就能实现这种集成。
2. 原型失败问题
团队构建概念验证并向业务所有者展示原型,但在现实世界中实施时,会面临诸多问题。常见问题与所使用技术的扩展性有关,比如一个为 10 个用户设计的原型,在扩展到数千个用户时可能会出现卡顿。
有时,原型使用的某种技术在开发时未构建某些特定功能,当尝试使用该技术创建这些功能时,就会发现该技术并不适合所构建的原型应用。原型失败是机器学习应用可能面临的设计失败之一,甚至可能导致项目终止。
3. 选择最佳算法
选择最佳算法是机器学习应用失败的另一个重要原因。推荐使用 scikit-learn 速查表来选择算法,它能帮助我们在复杂的算法选择过程中找到合适的算法。
以下是一个选择算法的示例步骤:
1. 从橙色开始按钮进入,回答问题“样本是否大于 50?”,若样本为 125 家医院,大于 50,则无需获取更多数据。
2. 接着回答“是否预测类别?”,若预测的是食物浪费的千克数(数量而非类别),则回答否,进入预测数量环节。 <