- 博客(49)
- 问答 (1)
- 收藏
- 关注
原创 Band gap and band alignment prediction of nitride-based semiconductors using machine learning复现
论文部分复现
2022-07-21 16:09:59
620
原创 Compare and plot experimental band gaps from Citrine and computed band gaps from MP
Compare and plot experimental band gaps from Citrine and computed band gaps from MP
2022-07-05 20:47:31
308
1
原创 Machine-learning-aided-design-of-aluminum-alloys复现
Machine-learning-aided-design-of-aluminum-alloys-_2021_Materials-Today-Commu复现
2022-07-05 12:19:48
238
原创 第7章 集成学习
7.2多投票集成学习import numpy as npimport pandas as pdimport matplotlib.pyplot as plt#实现概率质量函数from scipy.special import combimport mathdef ensemble_error(n_classifier,error): k_start=int(math.ceil(n_classifier/2)) probs=[comb(n_classifier,k)*(err
2022-05-11 10:41:51
637
原创 吴恩达ex1——多元线性回归实现
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt#读取数据df=pd.read_csv('ex1data2.txt',header=None, names=['siez of housing ','numbers of bedroom','house price'])df.head() siez of housing
2022-05-05 16:15:18
135
原创 吴恩达ex1——单变量线性回归
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt#加载数据df=pd.read_csv('ex1data1-Copy1.txt',header=None,names=['population','profit'])df.head() population profit 0 6.1101
2022-05-05 16:12:55
146
原创 决策树sklearn实现
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt#从sklearn导入数据from sklearn.datasets import fetch_california_housinghousing = fetch_california_housing()print(housing.DESCR).. _california_housing_dataset:California Housing datas
2022-05-04 11:54:13
408
原创 第六章 模型评估和超参数调优的最佳实践
6.1 管道方法简化工作流6.1.1 威斯康星乳腺癌数据集569个恶性和良性细胞的样本数据集前两列:ID和诊断结果(M=恶性,B=良性)列3-32包含30个根据细胞核的数字化图像计算出的特征值import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdf=pd.read_csv('wdbc.data',header=None)df.head() 0
2022-05-02 17:43:08
3083
原创 机器学习之降维压缩数据
特征提取:将原始数据压缩为低纬度的5.1用主成分分析实现无监督降维5.1完成以下步骤:标准化数据构建协方差矩阵获取协方差矩阵特征值和特征向量以降序对特征值排序,从而对特征排序import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdf=pd.read_csv('wine-Copy1.data',names=['分类标签','酒精','苹果酸',
2022-04-28 16:46:22
781
原创 逻辑回归实战(动手实践)
题目:我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会。你有以前的申请人的历史数据,你可以用它作为逻辑回归的训练集。对于每一个培训例子,你有两个考试的申请人的分数和录取决定。为了做到这一点,我们将建立一个分类模型,根据考试成绩估计入学概率。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdf=pd.read_table('Log
2022-04-22 11:13:14
2215
原创 第9章 可视化
9.1matplotlib API入门#简单图形创建import numpy as npimport matplotlib.pyplot as pltdata=np.arange(10)dataarray([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])plt.plot(data)[<matplotlib.lines.Line2D at 0x1dc96438cd0>]#创建figurefig=plt.figure()#创建子图ax1=fig.
2022-04-21 18:46:20
1626
1
原创 第4章节 机器学习之预处理
4.1处理缺失数据常见缺失:数据表中的空白或占位符,如NaN数据库中的未知指示符,如NULLimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport sysfrom io import StringIOcsv_data = \'''A,B,C,D1.0,2.0,3.0,4.05.0,6.0,,8.010.0,11.0,12.0,'''df=pd.read_csv(StringIO
2022-04-21 10:18:25
327
原创 第8章 数据规整
8.1层次化索引import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdata=pd.Series(np.random.randn(9),index=[['a','a','a','b','b','c','c','d','d'], [1,2,3,1,3,1,2,2,3]])#外层和内层标签按顺序写下来dataa 1 -1.101
2022-04-19 16:54:33
265
原创 第三章 使用stick-learn实现分类算法
3.1分类算法选择分类算法步骤:1.特征的选择2.确定性能评价标准3.选择分类器及其优化算法4.对模型性能的评估5.算法调优“没有免费午餐理论”:没有任何分类器在所有可能的场景下都有良好的表现,只有比较多种学习算法的性能,才能为特定问题挑选合适的模型3.2scikit-learn 的使用#训练感知器from sklearn import datasetsimport numpy as npimport matplotlib.pyplot as pltiris=datasets
2022-04-17 18:39:24
1422
原创 第七章 数据清洗和处理
7.1处理缺失数据Nan(not a number )在pandas表示缺失值import pandas as pdimport numpy as npstring_data=pd.Series(['aardvark','artichoke',np.nan,'avocado'])string_data0 aardvark1 artichoke2 NaN3 avocadodtype: object#判断缺失数据string_data.isn
2022-04-15 20:00:18
2660
原创 第二章 机器学习分类算法
第二章节 训练简单的机器学习分类算法##感知器实现import numpy as npclass Perceptron(object): """ 参数: 1.eta:学习速率 2.n_iter:训练集上迭代次数 3.w:权重 4.errors:每次迭代错误分类数目 """ def __init__(self,eta=0.01,n_iter=10): self.eta=eta self.n_it
2022-04-15 15:33:00
1367
原创 第6章节 数据加载、储存和文件格式
6.1读写文本格式的数据import pandas as pddf=pd.read_csv('pydata-book/examples/ex1.csv')df a b c d message 0 1 2 3 4 hello 1 5 6
2022-04-15 09:14:32
350
原创 第四章节 numpy基础
4.1 numpy的ndarray#4,1 numpy的ndarray:一种多维组对象import numpy as np#标准的NumPy惯用法 import numpy as np#产生随机数data=np.random.randn(2,3)dataarray([[-0.27834773, -0.43252429, 0.39315821], [-0.89037325, 1.06415737, -0.15804215]])data*10array([[-
2022-04-14 15:19:50
196
原创 第五章节 pandas入门
5.1pandas的数据结构介绍seriesimport pandas as pdfrom pandas import Series,DataFrame#1.Series是一种类似于一维数组的对象,由一组数据以及一组与之相关的索引组成obj=pd.Series([4,7,-5,3])obj0 41 72 -53 3dtype: int642.#Series的字符串表现形式为:索引在左边,值在右边。#可以通过Series 的values和index属性获取
2022-04-14 15:11:11
161
原创 第1、2、3章节
第一、二章安装包:conda install pack_name或者pip install package_name升级包:conda update package_name代码运行按ctrl+c终止运行第三章3.1 数据结构和序列#元组tup=4,5,6#创建元组最简单方式:逗号分隔一列值tup(4, 5, 6)#复杂表达式定义元组nested_up=(4,5,6),(7,8)nested_up((4, 5, 6), (7, 8))#tuple可将序列转化为元组tup
2022-04-14 09:28:34
292
原创 第11章节 测试代码
11.1测试代码from name_function import name_function_nameprint("Enter 'q' at any time to quit.")while True: first=input("\nPlease gice me as a first name:") if first =='q': break last=input("\nPlease gice me as a last name:")
2022-04-13 08:35:57
404
空空如也
在判断模型是否欠拟合遇到问题?
2022-05-11
TA创建的收藏夹 TA关注的收藏夹
TA关注的人