- 博客(15)
- 收藏
- 关注
原创 [Python笔记] 剑指offer刷题记录——进度75/75
剑指offer刷题记录LeetCode上的剑指offer题刷题ing49. 丑数#1.dp_转化成数组合并问题,用上个状态的数class Solution: def nthUglyNumber(self, n: int) -> int: #丑数的规律,从前向后看,每个数都是前边的乘以2,3,5得到的 #三指针:三个有序数组(*2,*3,*5)无重复元素合并 if not n: return 0 u
2020-06-01 14:50:59
720
原创 [Python笔记] 剑指offer刷题记录——进度50/75
剑指offer刷题记录LeetCode上的剑指offer题刷题ing26.树的子结构#1.双递归class Solution: def isSubStructure(self, A: TreeNode, B: TreeNode) -> bool: ''' 先序遍历树A中的每个节点An,对应函数isSubStructure(A, B) 判断树A中以An为根节点的子树是否包含树B,对应函数helper(A, B) ''' #有点双递
2020-05-29 12:58:46
294
原创 [Python笔记] 剑指offer刷题记录——进度25/75
剑指offer刷题记录LeetCode上的剑指offer题刷题ing…3.数组中重复的数字#遇见了得先问面试官时间和空间复杂度的要求#1.排序+一个下一个#时间O(nlogn) 空间O(1)class Solution: def findRepeatNumber(self, nums: List[int]) -> int: nums.sort() for i in range(len(nums)-1): if nums[i]
2020-05-26 21:32:58
474
原创 [Python笔记] Keras-LSTM学习笔记
LSTM网络是一种循环神经网络。循环神经网络是一种神经网络,它试图对依赖于时间或顺序的行为(如语言、股价、电力需求等)进行建模。1.结构 2.Embedding 3.Keras LSTM
2020-02-12 18:44:30
1820
原创 [Kaggle竞赛] IEEE-CIS Fraud Detection
Kaggle竞赛——[IEEE-CIS Fraud Detection]1.EDA2.特征工程3.特征筛选+降维4.LightGBM本次比赛的结果是铜牌:373/6381-Top 6% Private Leaderboard:0.928512
2019-10-10 16:56:48
4506
5
原创 [Python笔记] 用LDA(隐含狄利克雷分布)抽取主题分布+用户特征生成
特征工程中应用LDA-Latent Dirichlet Allocation 处理APP文本生成主题模型,利用gensim包中多核lda训练模型并将结果转化为稀疏矩阵,加入基于lightGBM的baseline模型中,旨在提升模型表现。
2019-09-13 17:09:02
1685
原创 [Kaggle竞赛] Ames房价回归预测Part2:多模型Stacking进行房价预测
Kaggle入门竞赛——房价预测问题:House Prices: Advanced Regression TechniquesPart1详见:[Kaggle竞赛] Part1:特征工程+利用XGBoost进行房价预测内含数据初步分析、特征工程处理以及简单地用XGBoost实现预测的方法。本篇的模型stacking基于Part1所进行的分析与处理之上,如对整个赛题感兴趣的话请在阅读Part1之后...
2019-08-28 11:48:12
5224
1
原创 [Scala学习笔记] Spark开发小笔记
Spark开发小笔记:从0开始的Spark建图生活持续更新中……1.开发平台Zeppelin支持多种语言,默认是scala(背后是spark shell),SparkSQL, Markdown 和 Shell。是一个基于web的笔记本,支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。2.importHive + sql(数据类型) + 参数配置(Spa...
2019-08-16 17:40:53
583
原创 [豆知識]分析遇到的业务名词整理
1.utmパラメータ:URL に追加できるパラメータは次の 5 種類です。utm_source: プロパティにトラフィックを誘導した広告主、サイト、出版物、その他を識別します(Google、ニュースレター 4、屋外広告など)。utm_medium: 広告メディアやマーケティング メディアを識別します(CPC 広告、バナー、メール ニュースレターなど)。utm_campaign: 商品のキャ...
2019-08-12 17:43:45
670
原创 [Python笔记] 开发中遇到的部分实用小问题
python 部分实用小问题1.读入列名csv转df后,如何转为可hash的list给别的df当索引用?适用于如下场合:特征工程中初步选取的top特征集存在csv里了,想大批pd.read_csv直接用,但是直接df.values.tolist()的话会报unhashable type ‘list’。这是因为转完的list长成[[‘a’],[‘b’],[‘c’]],而不是我们所需要的可以直接...
2019-08-12 12:26:12
530
原创 [贴贴板]快速Hive SQL语句
持续更新中,是用来应对ETL基本操作的贴贴板和一点笔记。把变量名改掉直接套用结构的快速贴贴板。建表-->分区-->视图-->统计函数-->select搭配用
2019-07-18 11:04:33
619
原创 [Kaggle竞赛]利用RandomForest进行Titanic乘客生存预测
参加了Kaggle的Getting Started Competition体验一下参赛流程。在此记录一下赛题思路和Python实现代码。Kaggle-Getting Started Prediction CompetitionTitanic: Machine Learning from Disasterimport pandas as pdimport numpy as npcsv_data = pd.read_csv("C:\\Users\\rinnki\\Desktop\\train.csv
2019-05-16 20:38:23
1281
4
原创 [Matlab]2018国赛 A题思路以及Matlab代码实现
CUMCM2018 A题解题思路以及代码实现一些关于CUMCM的思考CUMCM2018 A题第一问第二问第三问结语参考文献一些关于CUMCM的思考CUMCM2018 A题A题 高温作业专用服装设计在高温环境下工作时,人们需要穿着专用服装以避免灼伤。专用服装通常由三层织物材料构成,记为I、II、III层,其中I层与外界环境接触,III层与皮肤之间还存在空隙,将此空隙记为IV层。为设计专...
2019-03-26 15:17:57
46942
57
原创 [Python笔记]部分经典排序的实现
[Python笔记]部分经典排序的实现0、部分排序算法相关术语1、选择排序 Selection sort2、插入排序 Insertion sort3、冒泡排序 Bubble sort4、快速排序 Quick sort5、归并排序 Merge sort0、部分排序算法相关术语(1)稳定or不稳定若在待排序的记录中,存在两个或两个以上的关键码值相等的记录,经排序后这些记录的相对次序仍然保持不变,...
2019-03-12 15:55:38
860
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人