参加比赛的缘故,新学python,奈何代码接触有限,学习起来难度多多。
1. 未接触过Linux系统,而今才知道python与Linux无缝兼容。基本的语言都不会。
2. 没有服务器权限,在自己的Windows上跑程序老是报“ValueError: Input contains NaN, infinity or a value too large for dtype('float32').”错,可是在服务器上就是OK。
这里把学习到的内容记录一下吧。
1. 使用python最好用Linux系统,可以考虑装个虚拟机,否则在Windows上运行程序会报很多错。
推荐使用https://www.anaconda.com/download/下载Anaconda,可以避免机器学习相关python库没有安装的情况。
2. python可以在cmd运行窗口中执行。
方法是:先用cd命令定位到要执行的python程序所在的文件夹,然后执行python xx.py即可。
如果执行python后,这是使用带有代码解释器的交互界面进行程序的执行。并且开头以">>>"表示。
3. print语句在python 3.6与python 2.7的区别为
python 2.7 print "XX"
python 3.6 print("XX")
4. 想到了调试的方法,查找“ValueError: Input contains NaN, infinity or a value too large for dtype('float32').”的意思是数值为空,过大或不存在。
可能是我的输入数据量太大了吧。我把两个表格里的数据都减少到几十行。果然跑出了结果。
中间还有个小插曲,程序运行报错“pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2”,经查是.csv表格创建时是直接改excel后缀的,这样不行,需要另存为选择.csv格式保存。