[2019-08-20]学习记录

博主分享了关于博士申请的准备工作,包括确定学校、专业、联系导师,以及论文写作的心得,强调创新点和快速高效转换的重要性。

今天从家里回学校,有点累。17号回家,暑假就在家待了这几天,然后回学校继续“工作”,时间宝贵。

15号,也就是上周四,终于把论文搞好了,然后16号给版权转让书盖好章就把文章投出去了。静待下文,很是漫长。

回家这两三天看了一些学校的博士招生简章,大概知道了自己想申请的专业是什么,同时再次觉得考博一类事手续好繁琐。

这个月还剩十一天,接下来的主要任务有两个。

任务一:

大概确定好要申请的学校和专业相关申请条件,时间,申请考核方式,以及要联系的导师,导师邮箱;

给各个学校的老师发送邮件,广撒网,希望能得到回复;

确定好两三所一定会报考的学校,做好复习前的计划和准备,未来是场持久战;

暂时自己还有很多不足,尽量都选晚一点报考的,因为打算跨考,跨专业甚至是跨学院,所以很多基础知识需要逐个扩充,

希望未来这段时间,能对自己的知识和能力进行一场全面升华,那样也就不枉走过这一场了;

难,很难,当然会很难,但这不是你不去努力,不去尽全力的理由,尽人事,听天命。

“行路难!行路难!多歧路,今安在?
长风破浪会有时直挂云帆济沧海。”

任务二:

第二篇论文。

主题,框架和上一篇类似,模型什么的还需要再思考一下有没有需要优化的地方,

当然最重要的还是主题,要解决什么问题,以及如何实现。

希望通过这两篇论文的练习,能掌握一些写论文的关键诀窍;

核心是及格线,还需要不断向上攀登,距离峰顶还有很长的路要走。

写论文有两个关键之处,第一,创新点;第二,如何更加快速高效地将创新点转换成一篇高规格的论文;

前者需要想象力、创造力,后者需要流水线式的制造能力。

 

 

综上,没有好文章就读不了博,没有进行申请更没得读,两个都很重要。

时间很紧张,但意味着未来的日子会过得更加充实,而且是自己心甘情愿为之努力的。

很不幸,这或许是人生第一次感觉到命运掌握在自己手中,搞学术是为数不多自己不讨厌的创造性工作。

高考的时候我很茫然,考研的时候我也很茫然,如今终于明白自己的价值,明白自己这一生的路到底该怎么走。

大道难行,且行且珍惜。

import org.apache.spark.SparkConf import org.apache.spark.sql.{DataFrame, SparkSession} import org.apache.spark.sql.functions._ object turbine_Cleaning { def main(args: Array[String]): Unit = { //创建SparkSQL的运行环境 val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Task01") val spark =SparkSession.builder().config(sparkConf).getOrCreate() //文件路径 val path = "/data/bigfiles/19b9adb8-8665-468f-b161-f09a038c4ce2.csv" /********** Begin **********/ // 过滤出有功功率 'ActivePower' 列和无功功率 'ReactivePower' 列大于 0 的数据 // 修改日期 'Date' 列中数据为 'yyyy-MM-dd HH:mm:ss' 格式 // 修改有功功率 'ActivePower' 列、无功功率 'ReactivePower' 列、转子转速 'RotorRPM' 列,将其精度统一设置为小数点后 9 位 // 将环境温度 'AmbientTemperatue' 列、主机箱温度 'MainBoxTemperature' 列、风速 'WindSpeed' 列四舍五入并且保留小数点后 1 位;仅将发电机转速 'GeneratorRPM' 列四舍五入即可 // 清洗订单数据无用列,保留日期 'Date' 列,有功功率 'ActivePower' 列,环境温度 'AmbientTemperatue' 列,发电机转速 'GeneratorRPM' 列,主机箱温度 'MainBoxTemperature' 列,无功功率 'ReactivePower' 列,转子转速 'RotorRPM' 列,涡轮状态 'TurbineStatus' 列,风速 'WindSpeed' 列 // 对获取的数据进行去空操作;并将清洗后的数据存储为 CSV 文件存放至'/root/files'下,字符之间分割符为',' /********** End **********/ spark.close() } }第1关:风车数据清洗 100 学习内容 参考答案 记录 评论 任务描述 编程要求 测试说明 任务描述 本关任务:基于平台提供的初始数据集 Turbine_Data.csv( /data/bigfiles/19b9adb8-8665-468f-b161-f09a038c4ce2.csv ),按照下列编程要求完成数据清洗和数据存储工作。 数据说明(清洗前): 字段 说明 Date 日期 ActivePower 有功功率 AmbientTemperatue 环境温度 BearingShaftTemperature 轴承轴温度 Blade1PitchAngle 刀片 1 俯仰角 Blade2PitchAngle 刀片 2 俯仰角 Blade3PitchAngle 刀片 3 俯仰角 ControlBoxTemperature 控制箱温度 GearboxBearingTemperature 变速箱轴承温度 GearboxOilTemperature 变速箱油温 GeneratorRPM 发电机转速 GeneratorWinding1Temperature 发电机绕组 1 温度 GeneratorWinding2Temperature 发电机绕组 2 温度 HubTemperature 集线器温度 MainBoxTemperature 主机箱温度 NacellePosition 摇篮位置 ReactivePower 无功功率 RotorRPM 转子转速 TurbineStatus 涡轮状态 WTG 风力发电机组 WindDirection 风向 WindSpeed 风速 数据集中含有列名,且分隔符为 , 。 部分数据如下所示: Date,ActivePower,AmbientTemperatue,BearingShaftTemperature,Blade1PitchAngle,Blade2PitchAngle,Blade3PitchAngle,ControlBoxTemperature,GearboxBearingTemperature,GearboxOilTemperature,GeneratorRPM,GeneratorWinding1Temperature,GeneratorWinding2Temperature,HubTemperature,MainBoxTemperature,NacellePosition,ReactivePower,RotorRPM,TurbineStatus,WTG,WindDirection,WindSpeed 2019-07-03 17:20:00+00:00,1724.375756,29.98179389,45.79668656,7.646934817,7.935634389,7.935634389,0,69.92352689,66.35293333,1752.2221,108.8125833,108.339104,39.11450222,38.12821244,345,349.6620656,15.70000456,2,G01,345,10.13141038 2019-07-03 17:30:00+00:00,1719.876495,29.8722224,51.4004874,5.88336812,6.238426305,6.238426305,0,78.9207846,66.650838,1748.91851,110.6371391,110.1370616,44.003815,42.9683575,354,348.7708455,15.6882436,2,G01,354,9.652454225 2019-07-03 17:40:00+00:00,1721.776467,29.77718633,45.64748133,5.600642289,5.675354983,5.675354983,0,70.342879,66.917404,1761.488889,112.1641028,111.6656892,39.11450222,38.24288667,345,350.6697211,15.80790856,2,G01,345,9.913594028 2019-07-03 17:50:00+00:00,1719.185715,29.6936817,51.3619705,6.0005353,6.542133735,6.542133735,0,79.314967,67.1325294,1759.76463,113.2616121,112.7458068,44.003815,43.08125,,348.968216,15.7716449,2,G01,,9.580389325 编程要求 根据提示,在右侧编辑器补充代码,具体要求如下所示: 过滤出有功功率 ActivePower 列和无功功率 ReactivePower 列大于 0 的数据; 修改日期 Date 列中数据为 yyyy-MM-dd HH:mm:ss 格式; 修改有功功率 ActivePower 列、无功功率 ReactivePower 列、转子转速 RotorRPM 列,将其精度统一设置为小数点后 9 位; 将环境温度 AmbientTemperatue 列、主机箱温度 MainBoxTemperature 列、风速 WindSpeed 列四舍五入并且保留小数点后 1 位;仅将发电机转速 GeneratorRPM 列四舍五入即可。 清洗订单数据无用列,保留日期 Date 列,有功功率 ActivePower 列,环境温度 AmbientTemperatue 列,发电机转速 GeneratorRPM 列,主机箱温度 MainBoxTemperature 列,无功功率 ReactivePower 列,转子转速 RotorRPM 列,涡轮状态 TurbineStatus 列,风速 WindSpeed 列; 对获取的数据进行去空操作;并将清洗后的数据存储为 CSV 文件存放至/root/files下,字符之间分割符为,。 数据说明(清洗后) 字段 说明 Date 日期 ActivePower 有功功率 AmbientTemperatue 环境温度 GeneratorRPM 发电机转速 MainBoxTemperature 主机箱温度 ReactivePower 无功功率 RotorRPM 转子转速 TurbineStatus 涡轮状态 WindSpeed 风速 注意:清洗后,数据中保留表头且数据分隔符为,。 部分数据展示(清洗后): Date,ActivePower,AmbientTemperatue,GeneratorRPM,MainBoxTemperature,ReactivePower,RotorRPM,TurbineStatus,WindSpeed 2018-08-19 17:50:00,1728.174735000,27.1,1755.0,39.9,1.939745794,15.720688300,2,11.5 2018-08-20 03:30:00,1722.660313000,26.2,1749.0,39.3,1.731873479,15.681803330,2,11.0 2018-08-20 03:40:00,1728.820000000,26.4,1767.0,39.7,4.416215175,15.850615670,2,11.1
最新发布
06-06
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值