- 博客(11)
- 收藏
- 关注
原创 OGeek算法挑战赛总结
断断续续地结束了这个比赛,对我而言,这是入门自然语言处理的第一课,也是搜索推荐中,根据用户query与预测列表prediction_List,预测用户的点击率。参赛总结:1. 首先,json、list相加、读写文件以及一些pandas的操作,都需要用的足够多,才会越熟练。2. 这次遇到的两个最大的挑战是:1)数据泄露;2)进行groupby后,样本乱序对结果产生影响。3. 数据泄露...
2018-11-07 11:52:24
1511
1
原创 Python使用总结(2)
继续接着上次的,总结这段时间在使用Python过程中遇到的问题与解决方法。1. 正则表达式的使用(re)import re# 表达式编译pattern = re.compile(r'^1[35789]\d{9}$') # 如果存在匹配结果为True,否则为Falsepattern.match(inst)2. 在数据量特别大时,直接使用dataframe分片的效率优于使用gr...
2018-10-16 20:55:29
401
原创 Python使用总结(1)
机器学习的编程语言,相较于R,python好像更容易一些,函数式编程也挺形象。但是,每一门语言都有一些自己约定俗成的特点,更别说那些接口、包的使用。这些在具体的使用中,会让人焦头烂额。这篇博客是总结我这段时间使用python的一些经验,并不是python的特点总结,只是总结一些我遇到的坑和解决方法,以及我对于python的理解。1.将时间戳转成格式化的时间表示(datetime)t...
2018-10-16 20:55:11
313
原创 感知机模型[实现]
感知机模型:感知机学习策略:通过改变w,b,使损失函数最小感知机学习算法:随机梯度下降(每次仅对一个误分点进行学习)import numpy as npdef f(w, x, b): y = np.sum(np.dot(w, x)) + b if y > 0: return 1 return -1def loss(w, x, ...
2018-09-30 15:34:29
463
原创 java实现深度优先搜索(以含重复元的全排列为例)
java在实现多次调用函数,由函数中间结果产生全局解时,需要定义一个全局变量,用于跟踪结果并随时保存。C++可以使用指针完成此操作,而不需要定义全局变量。题目:含有重复元的全排列import java.util.ArrayList;import java.util.Arrays;public class permutation_ii { static ArrayList&l...
2018-08-24 15:39:42
378
原创 美团2017CodeM初赛A轮题解[C题]
合并回文子串题意:输入两个字符串A和B,合并成一个串C,属于A和B的字符在C中顺序保持不变。如"abc"和"xyz"可以被组合成"axbycz"或"abxcyz"等。求最长回文子串的长度(回文串表示从正反两边看完全一致的字符串,如"aba"和"xyyx")。...
2018-05-28 14:36:23
605
原创 美团2017CodeM初赛A轮题解[E题]
数列互质题意:给出一个长度为 n 的数列 { a[1] , a[2] , a[3] , ... , a[n] },以及 m 组询问 ( l[i] , r[i], k[i])。 求数列下标区间在 [ l[i] , r[i] ] 中有多少数在该区间中的出现次数与 k[i] 互质(最大公约数为1)。输入描述:第一行,两个正整数 n , m (1 ≤ n, m ≤ 50000)。第二行,n 个正整数 a...
2018-05-27 21:30:19
390
原创 美团2017CodeM初赛A轮题解[D题]
美团2017CodeM初赛A轮题解[D题]题意:n个人排成一列跑步,前后两人之间相隔 u 米,每个人正常速度均为 v 米/秒。 当某个配送员排在最后的时候,他需要以当时自己的最高速度往前跑,直到超过排头的人 u 米,然后降回到原始速度 v米/秒。每个人最初的最高速度为c[i] 米/秒,每轮衰减d[i]米/秒,也就是说,如果i是第j个跑的,那么他的速度就是c[i]-(j-1)*d[i] 米/秒。 n...
2018-05-27 21:16:45
270
原创 美团2017CodeM初赛A轮题解[A题]
美团2017CodeM初赛A轮题解[A题]题意:有一个大水缸,里面水的温度为T单位,体积为C升。另有n杯水(假设每个杯子的容量是无限的),每杯水的温度为t[i]单位,体积为c[i]升。现在要把大水缸的水倒入n杯水中,使得n杯水的温度相同,请问这可能吗?并求出可行的最高温度,保留4位小数。 注意:一杯温度为t1单位、体积为c1升的水与另一杯温度为t2单位、体积为c2升的水混合后,温度变为(t1*c1...
2018-05-27 20:52:26
845
1
原创 美团2017年CodeM资格赛题解
最近想要参加今年的CodeM竞赛,所以把去年的题做了一遍,顺便写个题解,做个记录。资格赛有A-F,共6道题,资格赛不限时,而且只要完成一道题就可以了。A、数码题意:给定两个整数 l 和 r ,对于所有满足1 ≤ l ≤ x ≤ r ≤ 10^9 的 x ,把 x 的所有约数全部写下来。对于每个写下来的数,只保留最高位的那个数码。求1~9每个数码出现的次数。示例1输入1 4输出421100...
2018-05-23 13:28:46
933
原创 Lightgbm调参经验
一周前开始接触Lightgbm,关于它的原理和主要思想很多地方都有,这里就不再赘述。这篇博文是我在参加天池数据挖掘比赛时的Lightgbm调参经验总结,希望对后续的工作有帮助。1. 数据特征选择除了数据集中的基本数据特征外,很多时候还需要从基本数据特征中通过统计或组合获得新的特征,这时候获得的新特征与原来的基本数据特征之间存在着相关性。新特征可能作为基本特征的补充更好地划分数据集,可能与原...
2018-04-23 13:40:36
8441
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人