
数据分析+机器学习
文章平均质量分 61
多用于案例分析
深海漫步鹅
弱小和无知不是生存的障碍,傲慢才是!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
流水线调度问题
分布式流水车间调度问题(Distribute flow shop scheduling problem)例子:3个工作单元,10个工件,4道工序。随机生成数据:工件在工作单元1、2、3机器上的加工时间[array([[30.52, 5.46, 5.74, 5.19],[ 7.31, 29.18, 13.78, 16.88],[30.74, 6.33, 14.47, 25.09],[30.4 , 15.29, 13.66, 18.01],[28.92, 21.26, 30.36, 10.07]原创 2022-03-07 17:17:30 · 1032 阅读 · 0 评论 -
python中zip()内置函数07
描述zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。下面一步步来解析下 zip 干了些什么。In [1]: headerOut[1]: ['a', 'b', 'c']In [2]: valuesOut[2]: [['1', '2', '3'], ['1', '2', '3', '4']]In [3]: zipped = zi原创 2022-01-21 12:04:22 · 317 阅读 · 0 评论 -
模型选择与调优06
交叉验证与网格搜索什么是交叉验证(cross validation)交叉验证:将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成4份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果。又称4折交叉验证。我们之前知道数据分为训练集和测试集,但是为了让从训练得到模型结果更加准确。做以下处理训练集:训练集+验证集测试集:测试集为什么需要交叉验证交叉验证目的:为了让被评估的模型更加准确可信问题:这个只是让被评估的模型更加.原创 2021-05-19 10:14:34 · 124 阅读 · 0 评论 -
朴素贝叶斯算法05
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法思考,某个类别为0合适吗?from sklearn.datasets import fetch_20newsgroupsfrom sklearn.model_selection import train_test_split,GridSearchCVfrom sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizerfrom sklearn.原创 2021-05-19 09:56:47 · 131 阅读 · 0 评论 -
转换器和估计器04
转换器fit_transform():输入数据直接转换fit():输入数据,但不做事情,输入数据后会进行一些计算比如,均值,方差,特征抽取transform() :进行数据转换fit_transform() = fit() + transform()fit如下数据【【1,2,3】,【4,5,6】】计算平均值为【2.5,3.5,4.5】按照上面的平均数和方差再去转换transform的数据。...原创 2021-05-14 14:32:21 · 125 阅读 · 0 评论 -
sklearn中数据集03
sklearn数据集load* 和fetch*返回的数据类型datasets.base.Bunch(字典格式)data:特征数组target:标签数组DENCR:数据描述feature_names:特征名target_names:标签名原创 2021-05-14 14:12:35 · 223 阅读 · 0 评论 -
特征工程-归一化,标准化,降维02
标准缩放1.归一化,标准化from sklearn.preprocessing import MinMaxScalerdef mm(): """ 归一化 :return: """ mm = MinMaxScaler(feature_range=(2,3)) data = mm.fit_transform([[90,2,10,40],[60,4,15,45],[75,3,13,46]]) print(data)[[3. 2.原创 2021-05-14 14:11:44 · 275 阅读 · 2 评论 -
特征工程-特征抽取01
特征抽取是对文本等数据进行特征值化(把文本转化为数值化,api是Sklearn.feature_extraction 对字典数据进行特征值化下面介绍几种特征抽取的函数样式。字典数据抽取是把字典中一些类别数据,分别进行转换成特征值from sklearn.feature_extraction import DictVectorizerdef dictvect(): """ 字典数据特征抽取 :return: None """ #实例化 dict原创 2021-05-14 08:17:35 · 139 阅读 · 0 评论