day08课件代码

该博客分享了关于航空用户聚类的案例分析,通过代码详细展示了如何进行数据处理和聚类操作。

01-案例:航空用户聚类案例.py

"""
目标:
    对用户进行聚类
    对聚类后的用户评估其价值
    对不同价值的客户实行不同营销策略

客户价值:
    收入来源于20%的顶端客户
    90%收入来自于现有客户
    大量资金被投入拓展用户上面

了解航空公司的现状
    行业内存在竞争
    行业间存在竞争
    2012-03-31 ---2014-3-31两年的数据 ---62988样本,44个特征

加载数据并进行数据处理
    数据清洗
    # 丢弃票价为空的数据  ---保留存在票价的数据
    # 丢弃票价为0,折扣不为0,飞行里程>0 的数据 ----航空公司没有盈利的数据
    # 保留盈利的数据---保留票价>0,折扣>0,飞行里程>0
    特征筛选与特征构建 ---LRFMC
    数据规约 ---标准化

进行客户聚类
    (1)实例化算法对象
    (2)训练数据并构建模型
    (3)预测--将客户聚为不同簇

结果展示
    # 雷达图

根据结果--取划分不同重要程度的客户
    #

应用--针对于不同的客户实行不同的营销策略
"""
import pandas as pd
import numpy as np

def build_data():
    """
    加载数据
    :return: data
    """
    data = pd.read_csv('./air_data.csv', encoding='ansi')
    return data

def desc_sca(data):
    """
    小数定标标准化
    :param data: df 或者series
    :return: 标准化之后的数据
    """
    # np.floor() --->向下取整
    data = data / (10 ** int(np.ceil(np.log10(data.abs().max()))))

    return data

def deal_data(data):
    """
    数据处理
    :param data: 需要的数据
    :return: 数据处理之后的data
    """
    # 数据清洗
    # (1)丢弃票价为空的数据
    # ---保留存在票价的数据 -- SUM_YR_1  SUM_YR_2
    # 个人认为 :SUM_YR_1  SUM_YR_2 同时不为空的情况下,票价才不为空
    bool_index_1 = data.loc[:, 'SUM_YR_1'].notnull()
    bool_index_2 = data.loc[:, 'SUM_YR_2'].notnull()
    # 同时满足
    bool_index = bool_index_1 & bool_index_2
    # 筛选数据
    data = data.loc[bool_index, :]
    # (2)丢弃票价为0,折扣不为0,飞行里程>0 的数据 ----航空公司没有盈利的数据
    # 保留盈利的数据---保留票价>0,折扣>0,飞行里程>0
    # 个人认为:SUM_YR_1  SUM_YR_2 只要有一个 > 0 ,就认为票价>0
    bool_id_1 = data.loc[:, 'SUM_YR_1'] > 0
    bool_id_2 = data.loc[:, 'SUM_YR_2'] > 0

    # 折扣系数 > 0
    bool_id_3 = data.loc[:, 'avg_discount'] > 0

    # 飞行里程 > 0
    bool_id_4 = data.loc[:, 'SEG_KM_SUM'] > 0

    #
    bool_id = (bool_id_1 | bool_id_2) & bool_id_3 & bool_id_4

    # 筛选满足条件的数据
    data = data.loc[bool_id, :]

    # print('清洗之后的数据:\n', data)

    # 筛选特征 --并构建特征 ----LRFMC
    # FFP_DATE --入会时间
    # LOAD_TIME --窗口结束时间
    # LAST_TO_END --最后一次乘机时间距窗口结束的时长
    # FLIGHT_COUNT --飞行次数
    # SEG_KM_SUM --飞行里程
    # avg_discount ---折扣系数
    data = data.loc[:, ['FFP_DATE', 'LOAD_TIME', 'LAST_TO_END', 'FLIGHT_COUNT', 'SEG_KM_SUM', 'avg_discount']]

    # print('筛选结束之后的结果:\n',data)

    # 构建特征---LRFMC
    # 构建L
    # 将 FFP_DATE、LOAD_TIME转化为pandas默认支持的时间序列
    data.loc[:, 'FFP_DATE'] = pd.to_datetime(data.loc[:, 'FFP_DATE'])
    data.loc[:, 'LOAD_TIME'] = pd.to_datetime(data.loc[:, 'LOAD_TIME'])

    # 结束 - 入会
    data.loc[:, 'L_days'] = data.loc[:, 'LOAD_TIME'] - data.loc[:, 'FFP_DATE']

    data.loc[:, 'L'] = [tmp.days / 30 for tmp in data.loc[:, 'L_days']]

    # print(data.loc[:, 'L'])
    # 构建R
    data.loc[:, 'R'] = data.loc[:, 'LAST_TO_END'] / 30
    # print(data.loc[:, 'R'])

    # 构建F
    data.loc[:, 'F'] = data.loc[:, 'FLIGHT_COUNT']

    # 构建M
    data.loc[:, 'M'] = data.loc[:, 'SEG_KM_SUM']

    # 构建C
    data.loc[:, 'C'] = data.loc[:, 'avg_discount']

    # 筛选出最终的特征
    data = data.loc[:, ['L', 'R', 'F', 'M', 'C']]

    # 标准化数据
    # 小数定标标准化
    for column in data.columns:
        data.loc[:, column] = desc_sca(data.loc[:, column])
    # print('构建好特征之后的结果:\n', data)

    return data


def main():
    """
    主函数
    :return:
    """
    # 加载数据
    data = build_data()
    print('data:\n', data)
    print('data 的列索引:\n', data.columns)
    print('*' * 100)

    # 数据处理
    data = deal_data(data)
    print('data:\n', data)

    # 聚类

    # 结果展示


if __name__ == '__main__':
    main()

代码下载地址: https://pan.quark.cn/s/bc087ffa872a "测控电路课后习题详解"文件.pdf是一份极具价值的学术资料,其中系统地阐述了测控电路的基础理论、系统构造、核心特性及其实际应用领域。 以下是对该文献的深入解读和系统梳理:1.1测控电路在测控系统中的核心功能测控电路在测控系统的整体架构中扮演着不可或缺的角色。 它承担着对传感器输出信号进行放大、滤除杂音、提取有效信息等关键任务,并且依据测量与控制的需求,执行必要的计算、处理与变换操作,最终输出能够驱动执行机构运作的指令信号。 测控电路作为测控系统中最具可塑性的部分,具备易于放大信号、转换模式、传输数据以及适应多样化应用场景的优势。 1.2决定测控电路精确度的关键要素影响测控电路精确度的核心要素包括:(1)噪声与干扰的存在;(2)失调现象与漂移效应,尤其是温度引起的漂移;(3)线性表现与保真度水平;(4)输入输出阻抗的特性影响。 在这些要素中,噪声干扰与失调漂移(含温度效应)是最为关键的因素,需要给予高度关注。 1.3测控电路的适应性表现测控电路在测控系统中展现出高度的适应性,具体表现在:* 具备选择特定信号、灵活实施各类转换以及进行信号处理与运算的能力* 实现模数转换与数模转换功能* 在直流与交流、电压与电流信号之间进行灵活转换* 在幅值、相位、频率与脉宽信号等不同参数间进行转换* 实现量程调整功能* 对信号实施多样化的处理与运算,如计算平均值、差值、峰值、绝对值,进行求导数、积分运算等,以及实现非线性环节的线性化处理、逻辑判断等操作1.4测量电路输入信号类型对电路结构设计的影响测量电路的输入信号类型对其电路结构设计产生显著影响。 依据传感器的类型差异,输入信号的形态也呈现多样性。 主要可分为...
(IHAOAVOABPvsAOBPvsAVOABPvsPSOBP)非洲秃鹫融合天鹰优化BP天鹰优化BP非州秃鹫BP粒子群(Matlab代码实现)内容概要:本文档主要围绕多种智能优化算法在不同工程领域的应用展开,重点介绍了非洲秃鹫优化算法(AVOA)、天鹰优化算法(AO)与BP神经网络的融合改进,并与其他经典算法如粒子群优化(PSO)进行对比分析。所有案例均提供Matlab代码实现,涵盖电力系统优化、路径规划、微电网调度、无人机控制、信号处理等多个方向,强调算法的科研复现能力与实际仿真价值。文档还展示了丰富的技术服务体系,涉及机器学习、深度学习、路径规划、通信与电力系统等多个前沿领域。; 适合人群:具备一定Matlab编程基础,从事科研工作或工程仿真的研究生、高校教师及企业研发人员,尤其适用于从事智能优化算法研究与应用的相关技术人员。; 使用场景及目标:①用于学术论文复现,特别是SCI/EI期刊中关于优化算法的实验部分;②为电力系统、无人机、储能调度等领域提供算法仿真技术支持;③帮助研究人员快速掌握多种智能算法的实现方法并进行性能对比。; 阅读建议:建议结合文档提供的网盘资源下载完整代码,按照目录顺序逐步学习,重点关注算法原理与Matlab实现的结合方式,同时可将文中案例作为自身课题的参考模板进行二次开发与创新。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值