0826我回来了~

陪领导出差一个月没有敲代码了我不知道是不是都就饭吃掉了。

休歇两天我又回归正常生活了~继续敲敲代码看看美剧

虽然一个月没有写代码但是还是有很多人在鼓励我,真的很感谢

现在渐渐的我也对it这个行业有了更多的了解,更认识了这么多优秀的人。

更重要的是真的改变了人生的很多规划。

先不说那么多,总之我还会继续敲代码的,

可能写不出什么厉害的东西,但是编程这件事情已经带给我太多的惊喜和收获!!

今天我有很认真的看了一遍基础的东西,还写了一段小代码

由于真的忘了的太多,每一行我都做了注释,相信还是有很多错误,谢谢大家指正。


数据类型:字符串 整数 小数(浮点数)bool类型

数据类型转换

int(x) #把x转换成整数
float(x) #把x转换成浮点数
str(x) #把x转换成字符串
bool(x) #把x转换成bool值
并不是所有的值都能做类型转换

关于bool值

除以下bool值为False,其他的值都认为是True

1.为0的数字,包括0,0.0

2.空字符串,包括'',""

3.表示空值的None,是一个特殊值,表示什么都没有,它和0、空字符、False、空集合都不一样。

4.空集合,包括(),[],{}

注意下面!!

1.bool('False')的值为True

2.bool(' ')的值为True,一个空格也不能算作空字符串

3.if bool(a) 或者 if a != ''

拆开来

a = '123' 

if a:

print 'this is not a blank string'


字符串 

''' '''三重引号块

r“”raw字符串 不可转译
u“”unicode字符串
s1+s2合并字符串
s*3重复字符串
s[数字]索引第几个字符
s[数字:数字]分片一个范围
len(s)求长度,也就是里面有几个字符
“a %code parrot ”%type 格式化字符串

字符串的方法

1搜索  s.find('pa') 返回第一次出现的位置

2移除右边的空格  s.rstrip()

3替换s.replace('pa','xx')

4用分隔符拆分 s.split(" , ")

5内容测试s.isdigit()

6转换s.lower() 转换大小写

7迭代 for x in s 循环字符串中的某个元素x

8成员关系 判断“sth” in s2是否定是s的成员


编写字符串常量的方法

raw字符串  r“c/new/test” 其中不转义

unicode字符串 u"sth"

转义序列代替特殊字符 s

                  /n换行 

                  /t  表示tab空白

                  /'和/“转义单引号双引号


# -*- coding: utf-8 -*-	

f = file('score.txt')#打开文件
lines = f.readlines()#lines是读取f中的每行作为字符串组成的一个list
print lines
f.close()#关闭f


results = []#results的类型是list


for line in lines:#line在列表lines中循环
    print line
    data = line.split()#把line以空白字格分割成字符串然后这些字符串组成一个list
    print data

    sum = 0
    for score in data[1:]:#让score在列表data从第二个元素开始循环到结束
        sum += int(score)#把score转化成整数一直加
        result = '%s \t: %d\n' % (data[0], sum)#返回的结果是data中的第一个元素后面空四个后面是sum
        print result

    results.append(result)#列表results中添加result

print results
output = file('result.txt', 'w')#打开一个可写入文件
output.writelines(results)
output.close()





%% 清空环境变量 warning off % 关闭报警信息 close all % 关闭开启的图窗 clear % 清空变量 clc % 清空命令行 %% 导入数据 res = xlsread('数据集.xlsx');%数据为132×4002 %% 划分训练集和测试集 temp = randperm(132); P_train = res(temp(1: 100), 1: 4001)'; T_train = res(temp(1: 100), 4002)'; M = size(P_train, 2); P_test = res(temp(101: end), 1: 4001)'; T_test = res(temp(101: end), 4002)'; N = size(P_test, 2); %% 数据归一化 [p_train, ps_input] = mapminmax(P_train, 0, 1); p_test = mapminmax('apply', P_test, ps_input); [t_train, ps_output] = mapminmax(T_train, 0, 1); t_test = mapminmax('apply', T_test, ps_output); %% 转置以适应模型 p_train = p_train'; p_test = p_test'; t_train = t_train'; t_test = t_test'; %% 创建模型 k = 5; % 保留主成分个数 [Xloadings, Yloadings, Xscores, Yscores, betaPLS, PLSPctVar, MSE, stats] = plsregress(p_train, t_train, k); % https://blog.youkuaiyun.com/linping_/article/details/110193946 %% 预测拟合 t_sim1 = [ones(M, 1), p_train] * betaPLS; t_sim2 = [ones(N, 1), p_test ] * betaPLS; %% 数据反归一化 T_sim1 = mapminmax('reverse', t_sim1, ps_output); T_sim2 = mapminmax('reverse', t_sim2, ps_output); %% 均方根误差 error1 = sqrt(sum((T_sim1' - T_train).^2) ./ M); error2 = sqrt(sum((T_sim2' - T_test ).^2) ./ N); %% 绘图 figure plot(1: M, T_train, 'r-*', 1: M, T_sim1, 'b-o', 'LineWidth', 1) legend('真实值', '预测值') xlabel('预测样本') ylabel('预测结果') string = {'训练集预测结果对比'; ['RMSE=' num2str(error1)]}; title(string) xlim([1, M]) grid figure plot(1: N, T_test, 'r-*', 1: N, T_sim2, 'b-o', 'LineWidth', 1) legend('真实值', '预测值') xlabel('预测样本') ylabel('预测结果') string = {'测试集预测结果对比'; ['RMSE=' num2str(error2)]}; title(string) xlim([1, N]) grid %% 相关指标计算 % R2 R1 = 1 - norm(T_train - T_sim1')^2 / norm(T_train - mean(T_train))^2; R2 = 1 - norm(T_test - T_sim2')^2 / norm(T_test - mean(T_test ))^2; disp(['训练集数据的R2为:', num2str(R1)]) disp(['测试集数据的R2为:', num2str(R2)]) % MAE mae1 = sum(abs(T_sim1' - T_train)) ./ M ; mae2 = sum(abs(T_sim2' - T_test )) ./ N ; disp(['训练集数据的MAE为:', num2str(mae1)]) disp(['测试集数据的MAE为:', num2str(mae2)]) % MBE mbe1 = sum(T_sim1' - T_train) ./ M ; mbe2 = sum(T_sim2' - T_test ) ./ N ; disp(['训练集数据的MBE为:', num2str(mbe1)]) disp(['测试集数据的MBE为:', num2str(mbe2)]) %% 绘制散点图 sz = 25; c = 'b'; figure scatter(T_train, T_sim1, sz, c) hold on plot(xlim, ylim, '--k') xlabel('训练集真实值'); ylabel('训练集预测值'); xlim([min(T_train) max(T_train)]) ylim([min(T_sim1) max(T_sim1)]) title('训练集预测值 vs. 训练集真实值') figure scatter(T_test, T_sim2, sz, c) hold on plot(xlim, ylim, '--k') xlabel('测试集真实值'); ylabel('测试集预测值'); xlim([min(T_test) max(T_test)]) ylim([min(T_sim2) max(T_sim2)]) title('测试集预测值 vs. 测试集真实值') 利用此matlab程序建立的模型结果: 训练集数据的R2为:0.98599 测试集数据的R2为:0.45759 训练集数据的MAE为:0.59726 测试集数据的MAE为:3.0826 训练集数据的MBE为:-4.0723e-15 测试集数据的MBE为:0.66068 老师说这个程序建模效果不好,老师让我修改一下,说结果过拟合了,选取的建模主成分不对,可以从交互均方根误差最小来进行调整,你可以帮我调整一下么,给我你修改后的代码(代码中需解释,让人可以看懂)
03-11
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值