自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 剑指offer-面试题43:n个骰子的点数

扔n个骰子,求所有点数之和出现的概率 思路1:递归思想,扔一颗骰子,然后跟n-1个骰子的结果做计算 思路2:动态规划思想,递推,用一个数组保存n-1个骰子的概率结果。 class Solution1: """ 递归方法 """ def getDicePointProbRecursively(self, n): if n == 0: return ...

2019-11-20 17:58:21 324

原创 vim常用编辑命令-linux兄弟连笔记

三种模式 vi进去命令模式 命令模式通过aio转insert模式,esc退出 命令模式通过冒号(:)进去编辑模式,回车结束运行 insert模式 指令 说明 i(infront) 在光标前面插入 I 在光标所在行首插入 a(ass) 在光标后面插入 A 在光标所在行尾插入 o 在光标所在行下面插入一行新的 O 在光标所在行的上面插入一行新的 定位命令 ...

2019-11-12 17:40:21 257

原创 Hadoop数据分析-第二章大数据操作系统-读书笔记

二 大数据操作系统 2.1 基本概念 1. 分布式系统的要求: 容错性:组件失败不能导致整个系统故障,可以影响性能 可恢复性:发生故障不能丢数据 一致性:一个作业或任务的失败不能影响最后的结果 可扩展性:负载增加导致性能的下降,资源增加使得存储和计算能力增强 2. 为了满足以上的要求提出了一些抽象概念: 节点处理本地存储的数据,以将网络流量最小化 每个数据块跨系统多次复制,以提供冗余和数据安...

2019-11-10 11:00:11 550

原创 word embedding-论文笔记总结

文章目录词嵌入word2vec(2013 Tomas Mikolov)GloVefasttext中文词嵌入CWEJWEcw2vec 词嵌入 word2vec(2013 Tomas Mikolov) 假设你已经对word embedding有初步的了解,至少知道skipgram是用中心词去预测上下文词汇,而CBOW是用上下文词来预测中心词。 假设个鬼哦,还是从头开始整理吧哭泣。我不!!! 网上有好多...

2019-05-29 23:25:25 1390

原创 复盘一下刚通过的预选赛-大数据挑战赛门槛(哇的一声哭出来)

过程: 模型从简单到复杂的试:朴素贝叶斯,结果0.82左右,距离参赛群的大佬们说的0.85通过线还差挺多,然后就word2vec+LSTM,结果是0.83-0.84的范围浮动,考虑到数据量才6k多,开始调参,主要的方向是调那些可以降低模型复杂度的参数(embedding size, hidden dim…),以及容易导致过拟合的(lr,epoch,…),然鹅,调了一段时间发现,对验证集结果影响最大...

2019-05-27 21:59:22 636 2

原创 随机采样方法代码实现-python

文章目录1. 均匀分布,使用线性同余器2. Box-Muller变换正态分布3. 接受-拒绝采样4. MCMC采样变体-Metropolis-Hastings算法5. Gibbs抽样 1. 均匀分布,使用线性同余器 from datetime import datetime from math import sqrt, cos, pi, log import matplotlib.pyplot a...

2019-05-25 20:59:58 4429

原创 剑指offer-删除链表中重复的节点-python

使用了三个指针 # -*- coding:utf-8 -*- # class ListNode: # def __init__(self, x): # self.val = x # self.next = None class Solution: def deleteDuplication(self, pHead): # write ...

2019-05-01 15:22:43 250

原创 剑指offer-表示数值的字符串-python

题目描述 请实现一个函数用来判断字符串是否表示数值(包括整数和小数)。例如,字符串"+100",“5e2”,"-123",“3.1416"和”-1E-16"都表示数值。 但是"12e",“1a3.14”,“1.2.3”,"±5"和"12e+4.3"都不是。 # -*- coding:utf-8 -*- class Solution: # s字符串 def isNumeric(sel...

2019-05-01 13:52:34 397

原创 剑指offer-和为S的连续正数序列-python

找规律版 # -*- coding:utf-8 -*- from math import sqrt, ceil class Solution: def FindContinuousSequence(self, tsum): # write code here if tsum<=2: return [] maxn ...

2019-04-29 17:44:55 375

原创 剑指offer-数组中只出现一次的数字-hashmap-异或-python

hashmap做法 def FindNumsAppearOnce(array): # write code here candicate = set() for element in array: if element in candicate: candicate.remove(element) else: ...

2019-04-29 11:39:23 388

原创 快速排序-python-递归

def quick_sort(arr): if len(arr) <= 1: return arr mid = arr[0] left = [] equal = [] right = [] while arr: element = arr[0] if element > mid: ...

2019-04-28 21:35:22 145

原创 剑指offer-二叉树层次遍历求树深度-python

# -*- coding:utf-8 -*- # class TreeNode: # def __init__(self, x): # self.val = x # self.left = None # self.right = None class Solution: def TreeDepth(self, pRoot): ...

2019-04-27 13:08:56 478

原创 剑指offer-逆序对-归并排序-非递归-python

def InversePairs(data): # write code here count = 0 length = len(data) grp_cnt = length grp_len = 1 result = data.copy() while grp_cnt >= 1: cur = 0 whil...

2019-04-26 21:48:33 420

原创 hadoop3.x+scala+spark-mac血泪安装经验!!

hadoop3.x+scala+spark-mac血泪安装经验!!总结:hadoop3.x 安装踩坑填坑配置环境变量(hadoop3+scala+spark)scala安装spark安装 总结: 最折腾的步骤是在hadoop的安装,我尝试安装了4次,前两次直接用brew install hadoop+其他博客上的安装教程,后面两次直接按照hadoop官网说的安,第三次是因为我安装在/usr/loc...

2019-02-28 14:37:01 1018

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除