常用的数据预处理操作

向量归一化与范数计算

最新推荐文章于 2022-04-16 21:22:32 发布

原创最新推荐文章于 2022-04-16 21:22:32 发布 · 1.7k 阅读

0 ·

CC 4.0 BY-SA版权

Deep Learning 同时被 2 个专栏收录

39 篇文章

订阅专栏

python

20 篇文章

订阅专栏

Normalization：向量的每个元素除以它的二范数（默认情况下）
sklearn.preprocessing.normalize(X, norm=’l2’, axis=1, copy=True)

X = [[ 1., -1., 2.],
… [ 2., 0., 0.],
… [ 0., 1., -1.]]
X_normalized = preprocessing.normalize(X, norm=’l2’)

X_normalized
array([[ 0.40…, -0.40…, 0.81…],
[ 1. …, 0. …, 0. …],
[ 0. …, 0.70…, -0.70…]])

求范数
np.linalg.norm(x, ord=None, axis=None, keepdims=False)

m = np.arange(8).reshape(2,2,2)
LA.norm(m, axis=(1,2))
array([ 3.74165739, 11.22497216])
LA.norm(m[0, :, :]), LA.norm(m[1, :, :])
(3.7416573867739413, 11.224972160321824)

>>> m = np.arange(8).reshape(2,2,2)
>>> m
array([[[0, 1],
        [2, 3]],

       [[4, 5],
        [6, 7]]])
>>> np.linalg.norm(m)
11.832159566199232

即 sqrt(1+4+9+..+79)

>>> np.linalg.norm(m, axis=2)
array([[ 1.        ,  3.60555128],
       [ 6.40312424,  9.21954446]])

即 sqrt(0+1) sqrt(4+9)
sqrt(16+25) sqrt(56+49)

If axis is None then either a vector norm (when x is 1-D) or a matrix norm (when x is 2-D) is returned.

>>> n = np.array([1,2,3])
>>> np.linalg.norm(n)
3.7416573867739413


>>> n = np.arange(4).reshape(2,2)
>>> n
array([[0, 1],
       [2, 3]])
>>> np.linalg.norm(n)
3.7416573867739413

>>> m
array([[[0, 1],
        [2, 3]],

       [[4, 5],
        [6, 7]]])
>>> np.linalg.norm(m, axis=(1,2))
array([  3.74165739,  11.22497216])

sqrt(1+4+9) sqrt(16+25+36+47)

>>> m
array([[[0, 1],
        [2, 3]],

       [[4, 5],
        [6, 7]]])
>>> np.linalg.norm(m, axis=(0,1))
array([ 7.48331477,  9.16515139])

sqrt(4+16+36) sqrt(1+9+25+49)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

iamzhangzhuping

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【数据预处理】Python数据预处理常见操作

WANG_hl的博客

04-30

4720

文章总结了拿到原始数据后，做数据预处理的常见操作。后续会根据总结不断更新。目录一、数据查看二、数据转换三、数据清洗1.异常值2.重复值3.缺失值四、数据获取五、数据合并1.join，基于index连接DataFrame的列2.merge，基于column连接，类似SQL的join3.concat，合并相同的Excel或给DataFrame添加行或列时使用六、其他操作1.数据分组聚合2.列表生...

数据预处理 常见的几种方法

热门推荐

HaLosec_Wei

08-20

4万+

数据的预处理又称属性值的规范化。属性值具有多种类型，包括效益型、成本型、以及区间型等。这三种属性，效益型属性越大越好，成本型属性越小越好，区间型属性是在某个区间最佳。在进行决策时，一般要进行属性值的规范化，主要有如下三个作用：①属性值有多种类型，上述三种属性放在同一个表中不便于直接从数值大小判断方案的优劣，因此需要对数据进行预处理，使得表中任一属性下性能约优的方案变换后的属性值越大。②非量...

参与评论您还未登录，请先登录后发表或查看评论

数据预处理常用操作

qq_53074677的博客

12-13

1803

数据预处理常用操作数据导入数据分析查看数据大小查看数据类型，缺失值，缺失值占比查看数据相关性-热力图表示数据处理数据类型转换pd.to_numeric函数散点图观察缺失值处理数据删除文本数据处理合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入

数据预处理 一般操作

qq_50909707的博客

01-13

681

1、首先查看数据字段情况 data = pd.read_csv(res.FILE_PATH['test'], encoding="utf-8") print(data.info()) 查看前几行数据 data = pd.read_csv(res.FILE_PATH['test'], encoding="utf-8") print(data.head()) 2、查看字符串类型数字的具体数据类别 # 查看字符串类型数字的具体数据类别 data_types = data..

简单的预处理操作

weixin_34280237的博客

09-14

161

运用opencv完成的基本的预处理操作 # -*- coding: UTF-8 -*-import cv2import numpy as npdef recognition(img): #灰度化 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) cv2.imshow('gray', gray) cv2.waitKey(0) #...

数据预处理_BP_预处理_数据预处理_

10-03

数据预处理是机器学习流程中的关键步骤，尤其在构建BP...综上，数据预处理在BP神经网络模型构建中起着至关重要的作用，有效的预处理能提升模型的性能，而"BP_预处理_数据预处理_"这一主题则涵盖了这一领域的核心操作。

包括常用数据预处理方法，以及经典实例.zip

03-02

在"Python_Practice-master"这个项目中，你将有机会实践以上各种数据预处理技术，通过实际操作提升对数据预处理的理解和应用能力。这不仅有助于你更好地理解机器学习模型的工作原理，也将为你的项目开发提供坚实的...

数据预处理从入门到实战基于 SQL 、R 、Python.zip

03-03

7. **R语言**：R语言是统计分析和图形展示的强大工具，提供丰富的数据预处理包，如dplyr用于数据操作，tidyr用于数据整理，imputeTS用于时间序列数据的缺失值处理等。 8. **Python**：Python是目前最流行的数据科学...

人工智能-项目实践-数据预处理-对采集的数据进行预处理

最新发布

03-04

以下将详细阐述数据预处理的重要性和具体步骤，以及在Java环境下实施这些操作的可能方法。首先，数据预处理的目的是为了清洗、转换和规范化原始数据，使之更适合机器学习算法的输入需求。这通常包括以下几个方面：...

数据预处理代码_数据预处理_

10-03

在本项目中，我们关注的是“数据预处理_数据预处理”，这涉及到一系列旨在优化原始数据质量的操作，以使数据更适合进行机器学习或统计分析。首先，数据预处理通常从数据导入开始。在R语言环境中，我们可能会使用`...

预处理操作

liyaoliy的博客

07-27

114

1.#表示预处理符号 2.#if…#endif是c++中条件编译预处理命令格式有两种： 1.#ifdef 标示符程序段1 #else 程序段2 #endif 表示：如果标示符已经被#define命令定义过了，则编译程序段1，否则编译程序段2. #if 表达式程序段1 #else 程序段2 #endif 表示：如果表达式为真，则编译程序段1，否则编译程序段2. ...

数据预处理常用方法总结

积跬步，慕至千里的博客

06-28

1万+

目录一、数据清理1 处理缺失值2 噪声数据二、数据集成1 实体识别2 冗余和相关分析3 数值冲突的检测与处理三、数据变换1 数据规范化2 数据离散化3 概念分层数据预处理包括多种方法，诸如数据清理、数据集成、数据变换等。一、数据清理数据清理主要是处理缺失数据、噪声数据等。 1 处理缺失值处理缺失值常用方法：删除数据：根据缺失情况，按行删除或者按列删除度量填补缺失值：可以根据数据属性，采用均值、中位数、众数等中心度量值来填补缺失数据预测填补缺失值：可以将缺失属性作为因变量，建立分类或回归模.

预处理操作（C）

qq_46659801的博客

07-19

204

程序的翻译环境和执行环境翻译环境：源代码被转换为可执行的机器指令执行环境：用于实际执行代码 预处理选项 gcc -E test.c -o test.i 预处理完成之后就停下来，预处理之后产生的结果都放在test.i文件中。编译选项 gcc -S test.c 编译完成之后就停下来，结果保存在test.s中。汇编 gcc -c test.c 汇编完成之后就停下来，结果保存在test.o中。程序执行的过程: 程序必须载入内存中。在有操作系统的环境中：一般这个由操作系统完成。在独立的环境中，

机器学习-常见的数据预处理

yehui_qy的博客

12-21

2万+

背景常见的数据预处理方法

笔记：常用数据预处理总结

人生是一场修行

10-21

925

数据清理主要使将数据中缺失的值补充完整、消除噪声数据、识别和删除离群点并解决不一致性。主要达到目标是:将数据格式标准化、异常数据清楚、错误纠正、重复数据的清楚 1.异常数据处理寻找异常数据：使用统计量进行判断：设有一个合理的范围，如果某个数据远远的超出其它数据，那么这个数据或者这些个数据就有可能是异常值。使用3&原则，根据正态分布的定义，距离平均值3&以外的数值出现...

Pandas数据预处理操作

qq_39112101的博客

12-15

1612

（1）数据的升序与降序 import pandas food_info = pandas.read_csv(r"E:\PyCharm\food_info.csv") food_info.sort_values("Sodium_(mg)", inplace= True) #对某列数据按照升序进行排列, ascending默认值为True(升序) foo...

程序的操作（预处理）第一部分

uytuytgu的博客

04-16

1751

本章重点： 1.程序的翻译环境 2.程序的执行环境 3.详解：C语言程序的编译+链接 4.预定义符号介绍 5.预处理指令 #define 6.宏和函数的对比 7.预处理操作符#和##的介绍 8.命令定义 9.预处理指令 #include 10.预处理指令 #undef 11.条件编译 ...

数据预处理常用操作之 pickle保存数据

phil的博客

06-23

335

import pickle a_dict = {'da': 111, 2: [23,1,4], '23': {1:2,'d':'sad'}} # pickle a variable to a file file = open('pickle_example.pickle', 'wb') pickle.dump(a_dict, file) file.close() # reload a fil...

Python数据分析处理库（Pandas）基础篇（IDE为Pycharm）- 数据预处理的常用函数

LIANGQISE的博客

11-29

3094

前四篇博客将Python科学计算库（Numpy）中的常用的一些函数讲了一下，下面开始讲解Python中的数据分析预处理库（Pandas）的一些常用函数，当然会分好几篇博客，请大家耐心看完。如果大家想要我代码所使用的数据集，可以加QQ：920133676或者发邮箱920133676@qq.com。（1）读取数据，输出结果为DataFrame格式，并且讲数据的行和列给出 import pandas as pd df = pd.read_csv('titanic_train.csv') ...

简述数据预处理的常用操作

06-09

常用的数据预处理操作包括： 1. 数据清洗：删除重复数据、处理缺失值、处理异常值等。 2. 数据变换：对数据进行缩放、平移、归一化、标准化等变换，以便使不同特征之间具有可比性。 3. 特征选择：选择与目标变量...