Python3.0+学习记录-元组

本文介绍了Python中元组的基本概念,包括元组的创建、访问、修改、删除等操作方法,同时还详细讲解了元组的索引、截取、内置函数等特性。

Python3 元组

Python 的元组与列表类似,不同之处在于元组的元素不能修改。

元组使用小括号,列表使用方括号。

元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。

如下实例:

tup1 = ('Google', 'Runoob', 1997, 2000);
tup2 = (1, 2, 3, 4, 5 );
tup3 = "a", "b", "c", "d";

创建空元组

tup1 = ();

元组中只包含一个元素时,需要在元素后面添加逗号

tup1 = (50,);

元组与字符串类似,下标索引从0开始,可以进行截取,组合等。


访问元组

元组可以使用下标索引来访问元组中的值,如下实例:

#!/usr/bin/python3

tup1 = ('Google', 'Runoob', 1997, 2000)
tup2 = (1, 2, 3, 4, 5, 6, 7 )

print ("tup1[0]: ", tup1[0])
print ("tup2[1:5]: ", tup2[1:5])

以上实例输出结果:

tup1[0]:  Google
tup2[1:5]:  (2, 3, 4, 5)

修改元组

元组中的元素值是不允许修改的,但我们可以对元组进行连接组合,如下实例:

#!/usr/bin/python3

tup1 = (12, 34.56);
tup2 = ('abc', 'xyz')

# 以下修改元组元素操作是非法的。
# tup1[0] = 100

# 创建一个新的元组
tup3 = tup1 + tup2;
print (tup3)

以上实例输出结果:

(12, 34.56, 'abc', 'xyz')

删除元组

元组中的元素值是不允许删除的,但我们可以使用del语句来删除整个元组,如下实例:

#!/usr/bin/python3

tup = ('Google', 'Runoob', 1997, 2000)

print (tup)
del tup;
print ("删除后的元组 tup : ")
print (tup)

以上实例元组被删除后,输出变量会有异常信息,输出如下所示:

删除后的元组 tup : 
Traceback (most recent call last):
  File "test.py", line 8, in <module>
    print (tup)
NameError: name 'tup' is not defined

元组运算符

与字符串一样,元组之间可以使用 + 号和 * 号进行运算。这就意味着他们可以组合和复制,运算后会生成一个新的元组。

Python 表达式 结果 描述
len((1, 2, 3)) 3 计算元素个数
(1, 2, 3) + (4, 5, 6) (1, 2, 3, 4, 5, 6) 连接
('Hi!',) * 4 ('Hi!', 'Hi!', 'Hi!', 'Hi!') 复制
3 in (1, 2, 3) True 元素是否存在
for x in (1, 2, 3): print x, 1 2 3 迭代

元组索引,截取

因为元组也是一个序列,所以我们可以访问元组中的指定位置的元素,也可以截取索引中的一段元素,如下所示:

元组:

L = ('Google', 'Taobao', 'Runoob')
Python 表达式 结果 描述
L[2] 'Runoob!' 读取第三个元素
L[-2] 'Taobao' 反向读取;读取倒数第二个元素
L[1:] ('Taobao', 'Runoob!') 截取元素,从第二个开始后的所有元素。

运行实例如下:

>>> L = ('Google', 'Taobao', 'Runoob')
>>> L[2]
'Runoob'
>>> L[-2]
'Taobao'
>>> L[1:]
('Taobao', 'Runoob')

元组内置函数

Python元组包含了以下内置函数

序号 方法及描述 实例
1 len(tuple)
计算元组元素个数。
>>> tuple1 = ('Google', 'Runoob', 'Taobao')
>>> len(tuple1)
3
>>> 
2 max(tuple)
返回元组中元素最大值。
>>> tuple2 = ('5', '4', '8')
>>> max(tuple2)
'8'
>>> 
3 min(tuple)
返回元组中元素最小值。
>>> tuple2 = ('5', '4', '8')
>>> min(tuple2)
'4'
>>> 
4 tuple(seq)
将列表转换为元组。
>>> list1= ['Google', 'Taobao', 'Runoob', 'Baidu']
>>> tuple1=tuple(list1)
>>> tuple1
('Google', 'Taobao', 'Runoob', 'Baidu')
第1关:Iris 分类 100 学习内容 参考答案 记录 评论 任务描述 相关知识 观察数据集 RFormula 特征提取 pandas 的 concat 函数 编程要求 测试说明 任务描述 本关任务:使用 pyspark ml 的LogisticRegression分类器完成 Iris 分类任务。 相关知识 观察数据集 我们本次使用的数据集是sklearn自带的数据集Iris。 接下来,我们来了解下Iris数据集的数据吧! 示例代码: iris = load_iris() features = pandas.DataFrame(iris.data, columns=iris.feature_names) target = pandas.DataFrame(iris.target, columns=[&#39;label&#39;]) print(features.head()) print(target.head()) 打印结果: sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) 0 5.1 3.5 1.4 0.2 1 4.9 3.0 1.4 0.2 2 4.7 3.2 1.3 0.2 3 4.6 3.1 1.5 0.2 4 5.0 3.6 1.4 0.2 label 0 0 1 0 2 0 3 0 4 0 简单来说明下数据集,我们第一个打印输出的结果集是Iris的特征,第二个打印输出的结果集是Iris的标签,也就是说我们接下来就是通过这些特征来训练模型,再通过模型预期一些没有标签的特征数据的标签。 RFormula 特征提取 RFormula 借鉴了 R 语言的 R model formula 进行特征选择。 RFormula 仅支持部分 R 操作,包括: ~ 分隔因变量(LHS 左侧)和自变量(RHS 右侧); + 合并变量,+0 意为移除截距; - 移除变量,-1 意为移除截距; : 变量相交,(数字型值相乘,类别型值二值化); . 除了因变量的所有变量。 上面的介绍是否有点抽象? 接下来,我们看下面的例子进行案例讲解吧! 假设有一个4列的dataframe: id country hour clicked 7 “US” 18 1.0 8 “CA” 12 0.0 9 “NZ” 15 0.0 如果使用RFormula,并且构建公式: clicked ~ country + hour,它表示通过country,hour这两个特征去预测clicked这个因变量。于是我们会得到以下dataframe: id country hour clicked features label 7 “US” 18 1.0 [0.0, 0.0, 18.0] 1.0 8 “CA” 12 0.0 [0.0, 1.0, 12.0] 0.0 9 “NZ” 15 0.0 [1.0, 0.0, 15.0] 0.0 features列为转换后的特征表示,因为country是字符串类型的类编变量,故进行one-hot编码变成了两列, hour是数值型的,故转换成double类型。label列是因变量click列,双精度的类型保持不变。 示例: from pyspark.sql import SparkSession from pyspark.ml.feature import RFormula if __name__ == &#39;__main__&#39;: spark = SparkSession.builder.appName("demo").master("local[*]").getOrCreate() df = spark.createDataFrame(( (7, "US", 18, 1.0), (8, "CA", 12, 0.0), (9, "NZ", 15, 0.0) )).toDF("id", "country", "hour", "clicked") df.show() formula = RFormula(formula="clicked ~ country + hour") formula.fit(df).transform(df).show() 打印结果: +---+-------+----+-------+--------------+-----+ |id |country|hour|clicked|feature |label| +---+-------+----+-------+--------------+-----+ |7 |US |18 |1.0 |[0.0,0.0,18.0]|1.0 | |8 |CA |12 |0.0 |[1.0,0.0,12.0]|0.0 | |9 |NZ |15 |0.0 |[0.0,1.0,15.0]|0.0 | +---+-------+----+-------+--------------+-----+ +--------------+-----+ |feature |label| +--------------+-----+ |[0.0,0.0,18.0]|1.0 | |[1.0,0.0,12.0]|0.0 | |[0.0,1.0,15.0]|0.0 | +--------------+-----+ pandas 的 concat 函数 concat 函数是在pandas的方法,可以将数据根据不同的轴作简单的融合。 源码: def concat( objs, axis=0, join="outer", join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=None, copy=True, ):# 省略 常用参数: objs: series,dataframe 或者是 panel 构成的序列 lsit ; axis: 需要合并链接的轴,0是行,1是列 ; join:连接的方式 inner,或者 outer。 示例: import pandas df1 = pandas.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) df2 = pandas.DataFrame([["A", "B", "C"], ["D", "E", "F"], ["G", "H", "I"]]) df3 = pandas.concat([df1, df2], axis=1) print(df3.head()) df4 = pandas.concat([df1, df2], axis=0) print(df4.head()) 打印结果: 0 1 2 0 1 2 0 1 2 3 A B C 1 4 5 6 D E F 2 7 8 9 G H I 0 1 2 0 1 2 3 1 4 5 6 2 7 8 9 0 A B C 1 D E F 编程要求 请仔细阅读右侧代码,结合相关知识,在Begin-End区域内进行代码补充,实现Iris 种类分类的模型训练,具体需求如下: 利用pandas将原始数组转换成DataFrame矩阵; 利用concat将特征与目标矩阵按行连接; 利用SparkSession将本地的pandas.DataFrame上传到Spark集群中,变成了Spark中的分布式DataFrame; 利用RFormula将DataFrame中属于特征的列提取到features字段中,将目标提取到labal字段; 将数据随机切分成8:2的训练集与测试集; 利用spark的逻辑回归分类器进行分布式训练fit; 然后返回元组元组构造为(模型、测试集)。 测试说明 平台会使用利用 Spark 的一个Metrics库对你训练的模型进行统计模型得分,如果模型的AUC值符合预期值,则通关。 代码框架为: # -*- coding: utf-8 -*- from pyspark.sql import SparkSession from sklearn.datasets import load_iris import pandas from pyspark.ml.classification import LogisticRegression from pyspark.mllib.evaluation import BinaryClassificationMetrics from pyspark.ml.feature import RFormula # 训练模型 def trainingModel(spark): # ********** Begin ********** # # 1.加载sklearn的训练数据 # 2.特征矩阵 # 3.目标矩阵 # 4.合并矩阵 # 5.创建spark DataFrame # 6.提取特征与目标 # 7.拆分训练集和测试集 # 8.创建LR分类器 # 9.训练 # 10.返回(模型、测试集) # ********** End ********** # —— 预期输出 —— AUC值为:1.0 请给完整正确能运行的代码
最新发布
12-06
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值