MachineLearning-Sklearn——环境搭建

本文介绍如何在Ubuntu上安装机器学习库Sklearn及其所需依赖,并通过运行一个示例来验证安装的成功。Sklearn提供了丰富的功能,包括分类、回归、聚类等。文中详细记录了安装步骤及示例代码。

概述

本文记录机器学习库SklearnUbuntu上的环境搭建,并在搭建好的环境上运行example以验证环境已经搭建成功;工作之余学习一下,大势所趋,别划了呀!跟上潮流呀!

安装Sklearn

Sklearn是一套通用机器学习开源框架,主要功能有6部分

  1. 分类

  2. 回归

  3. 聚类

  4. 降维

  5. 模型选择

  6. 数据预处理

Sklearn使用的是Python语言,其安装和运行还依赖pipscipynumpy
Sklearn网站:http://scikit-learn.org/stabl...

  • 安装python

这里就不说了,默认机器上都会装的,如果自己装的话注意设置环境变量就行了

  • 安装pip

pip是什么,百度说是一个安装和管理python包的工具,知道这就够了

apt-get install python-pip
  • 安装依赖

以下命令安装sklearn需要的各种依赖库

apt-get install build-essential python-dev python-numpy python-setuptools python-scipy libatlas-dev libatlas3-base  

以下命令安装一个画图工具,用它看程序运行结果

apt-get install python-matplotlib
  • 安装Sklearn

pip install -U scikit-learn
  • 确认安装

以下命令会列出当前系统安装的所有python依赖

pip install -U scikit-learn

如果结果里有scikit-learn,说明已经安装上了

验证环境

到sklearn官网,点击example进入General examples页面,如图

clipboard.png

页面上有很多机器学习的examples,就选取第一个例子,点击进入

clipboard.png

说这是一个Cross-Validated Predictions(交叉验证预测)的例子,下面有代码,可以下载下来,也可以自己写,我是自己照着抄了一遍,熟悉一下python语法,现学现用,前两天刚在w3c shcool上看了一下python语法大概什么样子

这个例子的源码如下,本文不进行代码分析和例子的原理研究,使用这个例子的目的只是为了验证环境搭建是否成功

from sklearn import datasets
from sklearn.model_selection import cross_val_predict
from sklearn import linear_model
import matplotlib.pyplot as plt

lr = linear_model.LinearRegression()
boston = datasets.load_boston()
y = boston.target

# cross_val_predict returns an array of the same size as `y` where each entry
# is a prediction obtained by cross validation:
predicted = cross_val_predict(lr, boston.data, y, cv=10)

fig, ax = plt.subplots()
ax.scatter(y, predicted, edgecolors=(0, 0, 0))
ax.plot([y.min(), y.max()], [y.min(), y.max()], 'k--', lw=4)
ax.set_xlabel('Measured')
ax.set_ylabel('Predicted')
plt.show()

在Ubuntu上写好代码,文件为plot_cv_predict.py,运行代码

python plot_cv_predict.py 

运行结果如图

clipboard.png

说明环境已经搭建完成


关于人工智能的学习资料来源,主要来自以下内容

斯坦福大学 吴恩达机器学习公开课 : 机器学习的动机与应用
开发者头条 普通程序员如何向人工智能靠拢

### Anaconda 在企业环境中的实际应用 #### 1. 数据科学平台支持 Anaconda 是一种广泛应用于数据科学领域的开源发行版工具集,它提供了 Python 和 R 的包管理以及环境管理功能。对于像青岛文达通科技股份有限公司这样的技术型企业来说,Anaconda 可能被用来构建高效的数据分析流水线[^1]。通过集成 Jupyter Notebook 等交互式开发环境,员工可以快速实现数据分析、模型训练和可视化。 #### 2. AI/ML 模型部署 在企业的实际业务场景中,AI 或机器学习 (Machine Learning, ML) 模型的开发与部署是一个重要环节。青岛文达通可能利用 Anaconda 来简化其深度学习框架 TensorFlow 或 PyTorch 的安装过程,并借助 Conda 虚拟环境隔离不同项目之间的依赖冲突[^2]。这种做法有助于提高研发效率并减少维护成本。 #### 3. 大规模计算优化 当处理海量数据时,传统方法往往难以满足性能需求。而 Anaconda 提供的企业版本——Anaconda Enterprise,则能够助企业搭建分布式计算集群来加速复杂运算任务执行速度[^3]。假设青岛文达通涉及智慧城市解决方案领域,则该产品或许会用于交通流量预测或者公共安全监控等方面的大规模实时处理工作。 ```python import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression # 假设这是来自某个传感器网络采集到的时间序列数据 data = { 'time': ['2023-09-01', '2023-09-02'], 'value': [10, 20] } df = pd.DataFrame(data) X_train, X_test, y_train, y_test = train_test_split( df[['time']], df['value'], test_size=0.2, random_state=42 ) model = LinearRegression() model.fit(X_train, y_train) print(f"Coefficients: {model.coef_}") ``` 此代码片段展示了如何基于 Pandas 库加载时间序列数据并通过 Scikit-Learn 构建简单的回归模型来进行趋势预测。这可能是青岛文达通在其内部流程自动化过程中所采用的一种方式之一。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值