智能医疗中的数据分析方法与应用
1. 数据分析方法概述
在当今的数据科学领域,数据科学家常用的方法有深度学习和奇异值分解(SVD)。不同群体使用的算法有所不同,政府和商业计算机科学家使用的算法与大学学者和学生使用的有明显区别。行业数据科学家最常用的方法包括回归、时间序列和随机森林,而不同组织普遍会利用时间序列和模拟方法,同时也会涉及数据挖掘这一信息技术中常见且相互关联的领域。
机器学习(ML)框架能够自动识别和理解输入信息,并根据这些信息提供智能结论。常见的机器学习技术包括推荐、分组和聚类。应用机器学习技术最广泛的两种方法是监督学习和无监督学习。监督学习利用指定的训练记录来学习特征,例如将电子邮件分类为垃圾邮件、对网页进行标记以及语音识别等。常见的监督学习算法有K近邻系统、朴素贝叶斯等。无监督学习则不依赖预先的输入或输出数据,而是尝试将数据分类到特殊、不同的簇中,例如根据人口相关知识将客户数据进行分类。
2. 计算机科学中的常见方法和算法
2.1 分类
分类是一种监督学习方法,也称为分类法。它利用已有的信息来评估当前技术在新信息上的分布,并收集已建立分类的多个样本。例如,iTunes应用程序使用分类来创建播放列表,雅虎和Hotmail等电子邮件服务提供商使用分类方法来判断新邮件是否为垃圾邮件。
2.2 聚类
聚类也称为无监督学习,由于其对观察者的不确定性,它试图将数据分类到特殊、不同的簇中。该技术不为用户指定输出,也不依赖预先的输入或输出数据。例如,在新闻组中,根据相似主题对不同的帖子进行聚类,谷歌和Hotmail利用聚类策略根据共同特征对数据进行分类。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



