人工智能与机器学习入门
1. 人工智能与机器学习基础概念
人工智能用于描述智力任务的自动化,通常由人类执行的任务被称为智力任务。机器学习(ML)是计算机学习执行任务的一组技术,深度学习则是专注于分层技术的机器学习子集。
人工智能起源于符号AI,它由用于处理知识的明确规则组成。但符号AI无法应对许多复杂情况,尤其是在医学领域,问题并非简单的“是”或“否”。符号AI以数据和规则为输入得出答案,而机器学习以数据和答案为输入输出规则。这表明机器学习通过从大量示例中学习并发现其中的模式来进行训练,进而开发出实现任务自动化的规则。
2. 机器学习项目流程
机器学习项目通常从理解问题开始,到呈现结果结束。以下是完成一个机器学习项目的关键步骤:
1. 明确问题 :在查看数据之前,要确保问题陈述清晰,并以能得出有意义答案的方式来构建问题。例如,在研究肿瘤时,是要预测肿瘤是否为癌症,还是关注肿瘤的生长速率,不同问题需要不同的分析方法。
2. 获取和处理数据 :数据是机器学习算法的关键,但高质量的数据往往难以获取,通常需要进行预处理,包括去除或填充缺失数据、确保数据格式合适(如数值型)。例如,化合物对目标的活性测量值可能记录为“≤ 75”,计算机将其识别为字符值,需要决定是分离关系符号和数值,还是直接去除该示例。同时,如果数据单位不同,可能需要进行单位转换。
3. 探索性分析 :通过探索数据观察缺失值和明显模式,可绘制图表查看数据分布,检测数据中的异常情况。例如,对于化合物 - 目标关联的测量活性数据,要考虑数据分布和异常值。还需决定如
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



