- 博客(22)
- 资源 (6)
- 收藏
- 关注
原创 2019华为机试
因为时间关系,没有通过率验证,输出形式的0 2 0 4 0 6 0 8 0 10 0 8 0 6 0 4 0 2事后试着奇数位输出‘0’,偶数位输出 实部与虚部之和,这样结果符合测试样例感觉不出来原因错在哪里。。。。有大佬知道的话请留言告诉我。。。。示例:输入为20行 数字‘1’,输出18行 附上个人代码;#include<iostream>...
2018-08-29 21:36:22
10671
2
原创 排序算法心得
1.选择排序与冒泡排序的区别 选择排序(每轮计算得到每轮的最小或者最大)是进行判别,符合条件进行交换。冒泡排序则是在每次循环中依次对元素进行判断和交换位置。主要差异就在于交换位置的频繁程度上。2.双向冒泡排序 复杂度上来说,和传统冒泡排序没有什么大的改动。但数据量非常大的时候,双向冒泡排序可以提高排列顺序的效率。从前往后确定本轮最大值,right-1,从后向前确定本轮最小值,left+...
2018-06-24 12:17:02
2344
1
原创 平安极客挑战赛总结(极度不平衡样本预测总结)
首先还是要感谢平安的这次比赛,让自己对数据处理有了更深层次的一些了解。话不多说,进入正题。最优成绩为0.2878.主要比赛流程(结合自身经验总结)1.基本数据的分析EDA以及随机森林或者Xgboost方法进行对应主要特征的提取。(红色部分是参赛心得)2.在对有序多值特征时,需要结合实际问题来对具体参数进行map赋值处理,对于多值无序的特征需要进行独热编码处理(one-hot编码),这样不仅扩充了特...
2018-05-02 18:31:40
1925
原创 处理数据极度不均衡的数据集2
实现过程个人觉得很坎坷。下午找到了sklearn库中有个 imblearn包,可以无脑运算,基于完成任务考虑,看了之后确实有很多收货。更加熟悉了模型的原理,数据处理的过程和结果优化的一些理论。排除朴素随机抽样之外的其他方法,在增加小样本和删除大样本的时候,时间消耗过于巨大,对于讲求效率的我而言,理论的优越并不能是我信服imblearn的优越性。在面对几十万条数据的时候,确实感到了个人计算机的无力。...
2018-04-22 21:53:14
1711
1
原创 处理数据极度不均衡的数据集
num = 0print("len(y_train_df):\n",len(y_train_df))for i in range(len(y_train_df)): if y_train_df[i] == 1: num = num + 1print("{}{}".format("y_train_df中0的个数是:",num))显示的结果为:len(y_train_d...
2018-04-22 11:52:05
2166
转载 程序员有趣面试题
转载请标明出处,原文地址:http://blog.youkuaiyun.com/hackbuteer1/article/details/6726419 偶然间在网上看到几个原来没见过的面试智力题,有几个题目在国内流传相当广,什么n个人怎么分饼最公平,屋里的三个灯泡分别由哪个开关控制,三架飞机环游世界,用火柴和两根绳子测量45分钟之类的题目,火星得已经可以考古了,这里就不再说了。 1、考虑...
2018-04-10 21:39:20
744
原创 计数排序法
计数排序的法原理是牺牲了空间来转换为时间的效率。具体流程可以参考《算法导论》的相关章节。实现的Python代码如下:# 2 1 3 4 2 5 6 1 8 11 0a0 = input("输入整数数据 \n")a1 = a0.strip().split(' ')n = len(a1)a = [int(a1[i]) for i in range(n)]c = [0 for i in range(n...
2018-03-29 17:06:29
324
原创 第8章:高效算法设计
最大连续子列求和问题具体代码请参考:https://www.cnblogs.com/conw/p/5896155.html8.1.1 渐进时间复杂度提示8-1:统计程序中“基本操作”的数量,可以排除机器速度的影响,衡量算法本身的优劣程度。提示8-2:基本操作的数量往往可以写成关于“输入规模”的表达式,保留最大项并忽略系数后的简单表达式称为算法的渐进时间复杂度,用于衡量算法中基本操作数随规模的增长情...
2018-03-05 21:10:16
316
原创 2018天池比赛首战落幕
印象盐城·数创未来大数据竞赛 - 盐城汽车上牌量预测从本次经历来看这份成绩我还是满意的。毕竟我并没有像那些大佬们从数据的行列之间进行关联性分析,独立性检验之类的专业技术流操作。我只是个机器学习的小浪花。通过这次比赛,我明白了要更多的联系社会实际生活的话,还是需要时间序列这块的理论知识和技能手段作支撑才能走的更远。接下来分享一下大佬做比赛的思路流程,我只是复现。...
2018-02-27 10:40:22
2393
6
转载 Pandas导入数据后的,关于特征合并的细节
import pandas as pddatapath = 'data/'train_df = pd.read_csv(datapath+'yancheng_train_20171226.csv')test_df = pd.read_csv(datapath+'yancheng_testA_20171225.csv')train_sum10=train_df[(train_df.sale_date...
2018-02-25 23:00:09
2112
转载 Scikit-learn Preprocessing 预处理
http://blog.youkuaiyun.com/dream_angel_z/article/details/49406573本文主要是对照scikit-learn的preprocessing章节结合代码简单的回顾下预处理技术的几种方法,主要包括标准化、数据最大最小缩放处理、正则化、特征二值化和数据缺失值处理。内容比较简单,仅供参考!首先来回顾一下下面要用到的基本知识。一、知识回顾
2018-01-24 22:26:09
370
转载 特征选取2-机器学习中,有哪些特征选择的工程方法?
https://www.zhihu.com/question/28641663作者:城东链接:https://www.zhihu.com/question/28641663/answer/110165221来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1
2018-01-24 22:24:46
434
转载 干货满满,阿里天池CIKM2017 Rank4比赛经验分享
https://www.leiphone.com/news/201708/MKRS661BYVttJRxJ.html雷锋网 AI 科技评论按:由深圳气象局与阿里巴巴联合承办的CIKM AnalytiCup 2017第一赛季已经宣告结束。本次比赛的目标是利用雷达数据(多普勒雷达回波外推数据),来建立一个准确的降水预报模型。这次比赛吸引了1395支队伍参赛,排行榜也已在阿里天池平台进行公示
2018-01-23 19:49:49
1572
原创 2017年琐事记
2017年上半年我还在碌碌无为的学着C++,意识到找工作要经历而自己实验室全是自己不感兴趣的理论,没有项目之后。在朋友的帮助下,人生中第一次完成了算法比赛的基本目标的实现(众星捧月,中兴公司的算法比赛)。然后,获得了应届校招中兴的免笔试资格,那个时候觉得自己研一学C++没有白费。6,7月的时候,由于想找个更好的工作,Python和机器学习最火。为了钱吧,就开始学了。8月底到现在12月底的4个月
2017-12-28 09:26:18
380
转载 协同过滤推荐算法总结(转载)
(欢迎转载,转载请注明出处。欢迎沟通交流: pinard.liu@ericsson.com)推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究。推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤类别的推荐算法做一个概括总结,后续也会对一些典型的协同过滤推荐算法做原理总结。1. 推荐算法概述 推荐算法是非常古老的,在机器学习还没
2017-11-29 09:40:34
6495
转载 机器学习 决策树 转载
这篇文章我认为是对于python新手(学习python 3.x)的好文章。原文链接如下:https://www.cnblogs.com/ybjourney/p/4770559.html
2017-11-28 11:27:50
235
转载 Python中的sorted函数以及operator.itemgetter函数 【转载】
operator.itemgetter函数operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号),下面看例子。a = [1,2,3] >>> b=operator.itemgetter(1) //定义函数b,获取对象的第1个域的值>>> b(a) 2 >>> b=operator.itemge
2017-11-28 09:39:53
230
原创 MySQL必知必会(一)
我安装的是MySQL官网上最新的版本,安装成功以后就开始入坑了。(单机版/FULL)SQL,可以理解为数据库,也可以理解为调用数据库的语句。但是为了操作,还是把SQL理解成语句吧。一、数据库基础1.数据库,表,行列我的理解。数据库就是保存各种数据类型的容器(对于了解C++的人来说还是很亲切的)表作为某种特定类型的数据结构化清单,所以可以理解为数据库就是来存放表的。表的名称是
2017-11-14 14:58:37
355
转载 python学习笔记1-numpy/enumerate
转载地址:http://www.cnblogs.com/Joyce-song94/p/7142050.html1. np.size和np.prodcode:1 import numpy as np2 x = np.zeros((3, 5, 2), dtype=np.complex128)3 # ndarray.size is the number of elements
2017-11-02 10:34:16
1378
原创 numpy中shape函数的一些用法
shape函数是numpy库中一个函数,它的功能是查看矩阵的维数,和数组的列数(相当于选择矩阵中维数较大的那个)。借着做周志华《机器学习》 7.3的机会,掌握了这个小技巧。import numpy as np D = np.array([ [1, 1, 1, 1, 1, 1, 0.697, 0.460, 1], [2, 1, 2, 1, 1, 1,
2017-11-02 09:29:15
1347
转载 pandas.read_csv参数详解
pandas.read_csv参数整理(转)读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.
2017-10-31 21:19:47
572
转载 python常用的一些东西——sys、os等(转)
原文地址:http://blog.chinaunix.net/uid-25508301-id-3352833.html1.常用内置函数:(不用import就可以直接使用) help(obj) 在线帮助, obj可是任何类型 callable(obj) 查看一个obj是不是可以像函数一样调用 repr(obj) 得到obj的表示字符串,可以利用这个字符串
2017-10-24 21:33:27
318
3自由度并联机器人的运动学与动力学分析_刘善增.pdf
2018-05-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人