
机器学习
文章平均质量分 86
⑨充满智慧与力量⑨
这个作者很懒,什么都没留下…
展开
-
pytorch房价预测练习
任务:基于 pytorch 实现房价预测收集数据,对数据的属性进行介绍编程实现数据预处理并保存数据统计分析并绘制效果图gitee仓库地址个人博客地址数据来源导入包import torchimport torch.nn as nnimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt读取数据train_data = pd.read_csv("../data/train.csv")test_da原创 2022-03-06 22:17:42 · 1892 阅读 · 1 评论 -
机器学习知识梳理
训练集、验证集、测试集训练集用于模型拟合的数据样本用途模型参数调整验证集模型训练过程中单独留出的样本集,它可以用于调整模型的超参数和用于对模型的能力进行初步评估。通常用来在模型迭代训练时,用以验证当前模型泛化能力(准确率,召回率等),以决定是否停止继续训练。用途用于评估模型效果调整超参数判断模型训练情况决定是否继续训练多次使用,不断调参;是非必需的,评估的效果不是模型最终结果测试集用来评估模最终模型的泛化能力。但不能作为调参、选择特征等算法相关的选择的依据。用原创 2022-01-11 00:43:45 · 1652 阅读 · 0 评论 -
员工离职概率预测
从大数据到深数据总述 当今为“数据技术”时代、“大数据”时代,万物联网提供了海量的数据,庞大的数据为当今人工智能蓬勃发展提供了可能。大数据技术创造了许多全新的可能性,人们依靠计算机强大的计算能力,在成千上万条数据中提取“经验”,总结“规律”,并为实践提供指导。 在大数据背景下,面对驳杂无章的数据,如何有效分析数据至关重要。大数据背景在许多应用场景中存在一定局限性,大部分场景得到的数据往往是缺乏经验的,其内容的可靠性欠佳,因而得到的实验结果也将会受到质疑。在一定基础上进行数据清洗,侧重于捕获可用原创 2021-10-31 11:31:12 · 2008 阅读 · 1 评论 -
NoSQL基本原理
1. 什么是CAP原理?CAP原理是否适用于单机环境?CAP原理指分布式系统中Consistency(一致性)、Availability(可用性)、Partition tolerance(分区容错性)。Consistency(一致性)指分布式系统中所有节点都能对某个数据达成共识,即访问所有节点所得到的数据应该是一样的。这里指的一致性为强一致性,即更新操作成功后,所有节点在同一时间数据完全一致。注意区分 弱一致性——最终一致性。Availability(可用性)指系统能够对用户的操作给予反馈,所有原创 2021-09-26 20:40:36 · 730 阅读 · 0 评论 -
机器学习浅要理解(一)
1. 机器学习包括哪几类方法及哪些任务?2. 请简述使用scikit-learn实现机器学习任务过程?3. 简述在机器学习过程中为什么要采用独热编码(one-hot)?4. 谈谈你对机器学习中的降维(Dimension Reduction)理解?5. 简述分类(Classification)与回归(Regression)两者异同之处?6. 简述分类(Classification)与聚类(Clustering)两者异同之处?...原创 2021-09-26 19:20:27 · 564 阅读 · 0 评论