numpy教程

本文详细介绍了numpy教程中的数组定义、创建、类型判断、切片与拼接,以及使用sklearn进行数据普通编码的过程,包括LabelEncoder应用和自定义编码方法的性能对比。作者呼吁读者提供优化建议。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一章 数组定义和分类

第二章 数组操作

2.1 创建数组

2.2 数组类型

2.3 数组判断

2.4 数组切片

2.5 数组拼接

第三章 数组应用

3.1 数据普通编码

1. 数据下载地址

https://archive.ics.uci.edu/static/public/73/mushroom.zip

2. 数据加载

import pandas as pd
f_path = r"../../datasets/mushroom/raw_data/agaricus-lepiota.data"
data = pd.read_csv(f_path, header=None)

3. 数据普通编码
1) 使用sklearn进行普通编码

from sklearn.preprocessing import LabelEncoder

start = time.time()

le = LabelEncoder()
for column_name, column_data in data.items():
    le.fit(column_data)
    data.loc[:, column_name] = le.transform(column_data)

print(time.time() - start)

2) 去掉校验后,sklearn内部代码

def _map_to_integer(values, uniques):
    """Map values based on its position in uniques."""
    table = {val: i for i, val in enumerate(uniques)}
    return np.array([table[v] for v in values])

start2 = time.time()

data = np.asarray(data)
for i in range(data.shape[1]):
    temp = data[:, i]
    classes = np.unique(temp)
    data[:, i] = _map_to_integer(temp, classes)
    
print(time.time() - start2)

3) 模仿

start1 = time.time()

data = np.asarray(data)
for i in range(data.shape[1]):
    temp = data[:, i]
    classes = np.unique(data[:, i])
    for idx, j in enumerate(classes):
        temp[temp == j] = idx
    data[:, i] = temp

print(time.time() - start1)

4. 对比分析

调用sklearn编码时间:0.03752398490905762
仿写的时间: 0.06799888610839844
sklearn内部代码:0.06450891494750977

        根据上述结果可以看出,自己的代码还有很大的优化空间,欢迎大家提供思路。

极化码(Polar Code)是由土耳其科学家Erdal Arıkan在2009年提出的一种新型纠错编码技术。它通过利用信道的极化现象,将虚拟信道分为误码率接近0和接近1/2的两类。在编码设计中,数据被放置在误码率极低的信道上,从而实现高效的数据传输。极化码的主要优势在于其理论编码容量能够达到香农限,并且构造方法较为简单。 MATLAB是一种功能强大的数学计算和编程工具,广泛应用于科学研究和工程领域。在极化码的研究中,MATLAB可用于构建编码和解码算法,模拟数据在不同信道条件下的传输效果,验证理论性能,并优化相关参数。 SC(Successive Cancellation,逐位取消)译码是极化码的基本解码方法。它从最可靠的比特开始,依次解码每个虚拟信道,且每个比特的解码结果会影响后续比特的解码,因为它们之间存在依赖关系。虽然SC译码的实现较为简单,但其计算复杂度较高,随着码长的增加,解码时间会线性增长。 SCL(Successive Cancellation List,逐位取消列表)译码是SC译码的改进版本。它通过引入列表机制,同时处理多个路径,从而增强了错误校正能力,并在一定程度上降低了错误率。与SC译码相比,SCL译码虽然需要消耗更多的计算资源,但能够提供更好的性能。 一个完整的MATLAB仿真资源通常包含以下内容: 编码模块:用于实现极化码的生成,包括码字构造和极化矩阵操作等。 信道模型:用于模拟各种通信信道,例如AWGN(加性高斯白噪声)信道或衰落信道。 SC/SCL译码模块:包含SC译码和SCL译码的算法实现。 误码率(BER)计算:通过比较发送和接收的码字,计算误码率,以评估编码性能。 性能曲线绘制:绘制误码率与信噪比(SNR)之间的关系曲线,展示不同译码策略的性能差异。 使用说明:指导用户如何运行仿真,理解代码结构,以及如何调整参数以进行自定义实验。 代码注
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值