
计算机算法
sdulibh
心中无敌
展开
-
LSM-tree最透彻的解释
LevelDB is an open source key-value store that originatedfrom Google’s BigTable [18]. It is an implementation ofLSM-tree, and it has received increased attention in bothindustry and academia [6][34][2...转载 2018-03-20 19:48:52 · 5826 阅读 · 0 评论 -
最短路径—Dijkstra算法和Floyd算法
Dijkstra算法1.定义概览Dijkstra(迪杰斯特拉)算法是典型的单源最短路径算法,用于计算一个节点到其他所有节点的最短路径。主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。Dijkstra算法是很有代表性的最短路径算法,在很多专业课程中都作为基本内容有详细的介绍,如数据结构,图论,运筹学等等。注意该算法要求图中不存在负权边。问题描述:在无向图 G=(V,转载 2016-01-30 17:41:39 · 575 阅读 · 0 评论 -
局部敏感哈希
局部敏感哈希在检索技术中,索引一直需要研究的核心技术。当下,索引技术主要分为三类:基于树的索引技术(tree-based index)、基于哈希的索引技术(hashing-based index)与基于词的倒排索引(visual words based inverted index)[1]。本文主要对哈希索引技术进行介绍。哈希技术概述在检索中,需要解决的问题是给定一转载 2016-01-21 22:47:10 · 9638 阅读 · 1 评论 -
我爱数学
导读:让我们面对它;总的来说数学是不容易的,但当你征服了问题,并达到新的理解高度,这就是它给你的回报。” ——Danica McKellar数学是很难的科学,但因为它是科学家用数学来解释宇宙的语言,我们无可避免的要学习它。看看下面的这些GIF动图,它们提供了视觉的方式来帮助你理解各种数学技巧。NO.1椭圆的画法NO转载 2015-12-04 19:45:38 · 650 阅读 · 0 评论 -
深度学习与计算机视觉系列(4)_最优化与随机梯度下降\数据预处理,正则化与损失函数
1. 引言上一节深度学习与计算机视觉系列(3)_线性SVM与SoftMax分类器中提到两个对图像识别至关重要的概念:用于把原始像素信息映射到不同类别得分的得分函数/score function用于评估参数W效果(评估该参数下每类得分和实际得分的吻合度)的损失函数/loss function其中对于线性SVM,我们有:得分函数f(xi,W)=Wxi损失函数L=1N∑i转载 2016-01-19 09:35:34 · 3385 阅读 · 0 评论 -
机器学习
正在学习林轩田的机器学习基石和吴恩达的机器学习,感觉讲的还不错,数学基础还是蛮重要的。机器学习入门资源不完全汇总感谢贡献者: tang_Kaka_back@新浪微博欢迎补充指正,转载请保留原作者和原文链接。 本文是 机器学习日报的一个专题合集,欢迎订阅:请给hao@memect.com发邮件,标题"订阅机器学习日报"。机器学习入门资源不完全汇总基本概念机器学习 机器转载 2015-11-06 16:08:09 · 933 阅读 · 0 评论 -
线性回归、逻辑回归、损失函数
回归问题的条件/前提:1) 收集的数据2) 假设的模型,即一个函数,这个函数里含有未知的参数,通过学习,可以估计出参数。然后利用这个模型去预测/分类新的数据。1. 线性回归假设 特征 和 结果 都满足线性。即不大于一次方。这个是针对 收集的数据而言。收集的数据中,每一个分量,就可以看做一个特征数据。每个特征至少对应一个未知的参数。这样就形成了一个线性转载 2015-11-23 16:54:17 · 2489 阅读 · 0 评论 -
Surrogate Loss Functions in Machine Learning
TL; DR These are some notes on calibration of surrogate loss functions in the context of machine learning. But mostly it is an excuse to post some images I made.In the binary-class classificatio转载 2015-11-19 18:33:34 · 1420 阅读 · 0 评论 -
对频率论(Frequentist)方法和贝叶斯方法(Bayesian Methods)的一个总结
本文是对《IPython Interactive Computing and Visualization Cookbook》一书中第七章【Introduction to statistical data analysis in Python – frequentist and Bayesian methods】的简单翻译和整理,这部分内容主要将对统计学习中的频率论方法和贝叶斯统计方法进行介绍。转载 2015-11-21 14:49:58 · 7592 阅读 · 0 评论 -
算法思路
转载 2015-09-23 17:07:58 · 558 阅读 · 0 评论 -
26条深度学习经验
八月初,我有幸有机会参加了蒙特利尔深度学习暑期学校的课程,由最知名的神经网络研究人员组成的为期10天的讲座。在此期间,我学到了很多,用一篇博客也说不完。我不会用60个小时的时间来讲解神经网络知识的价值,而会以段落的方式来总结我学到的一些有趣的知识点。在撰写本文时,暑期学校网站仍可以访问,并附有全部的演示文稿。所有的资料和插图都是来自原作者。暑期学校的讲座已经录制成了视频,它们也可能会被上传转载 2015-09-18 07:29:30 · 1055 阅读 · 0 评论 -
复数的物理意义
复数不仅有意义,而且可以用图示来优雅地解释。1、实函数与数轴变换大家都认识,对于这样的初等函数,我们从小就学会使用直角坐标系来刻画它们:它们的特点都大同小异:把实数轴对应到实数轴。然而,既然是一维函数,用二维图像来描述未免太过奢侈。如果我们把数轴涂上不同颜色,再把一条新数轴上对应的函数值涂上相应颜色,就可以清晰地用数轴-数轴对应来展示函数这一关系:可以发现每个函数的作用无非是在转载 2016-02-13 10:31:09 · 5777 阅读 · 0 评论 -
理解矩阵
理解矩阵(一)标签: 教育工具作业blog生活扩展2006-04-02 00:30 156048人阅读 评论(186) 收藏 举报版权声明:本文为博主原创文章,未经博主允许不得转载。前不久chensh出于不可告人的目的,要充当老师,教别人线性代数。于是我被揪住就线性代数中一些务虚性的问题与他讨论了几次。很明显,chensh觉得,要让自己在讲线性代数的时候转载 2016-01-31 15:52:08 · 636 阅读 · 0 评论 -
图知识
图的基本知识2013-02-05 12:32 1036人阅读 评论(0) 收藏 举报 分类:数据结构版权声明:本文为博主原创文章,未经博主允许不得转载。=================================图的定义和术语=============================图是一种基本的数据结构,表示为 ,其中转载 2016-01-31 15:18:58 · 1505 阅读 · 0 评论 -
关于机器学习的领悟与反思
近年来,人工智能的强势崛起,特别是去年AlphaGo和韩国九段棋手李世石的人机大战,让我们深刻地领略到了人工智能技术的巨大潜力。数据是载体,智能是目标,而机器学习是从数据通往智能的技术、方法途径。因此,机器学习是数据科学的核心,是现代人工智能的本质。通俗地说,机器学习就是从数据中挖掘出有价值的信息。数据本身是无意识的,它不能自动呈现出有用的信息。怎样才能找出有价值的东西呢?第一步要给数据一转载 2017-01-16 15:41:26 · 852 阅读 · 0 评论 -
Hinton 亲传弟子 Ilya Sutskever 的深度学习综述及实际建议
A Brief Overview of Deep Learning(This is a guest post by Ilya Sutskever12 on the intuition behind deep learning as well as some very useful practical advice. Many thanks to Ilya for such a heroic转载 2016-10-08 10:37:36 · 654 阅读 · 0 评论 -
数字签名是什么?
今天,我读到一篇好文章。它用图片通俗易懂地解释了,"数字签名"(digital signature)和"数字证书"(digital certificate)到底是什么。我对这些问题的理解,一直是模模糊糊的,很多细节搞不清楚。读完这篇文章后,发现思路一下子就理清了。为了加深记忆,我把文字和图片都翻译出来了。文中涉及的密码学基本知识,可以参见我以前的笔记。=======转载 2016-10-10 22:01:23 · 315 阅读 · 0 评论 -
机器学习的若干问题解释
本篇文章主要介绍梯度下降优化方法、损失函数及过拟合处理方法等问题:梯度下降优化算法综述 该文翻译自An overview of gradient descent optimization algorithms。 总所周知,梯度下降算法是机器学习中使用非常广泛的优化算法,也是众多机器学习算法中最常用的优化方法。几乎当前每一个先进的(state-of-the-a转载 2016-09-14 21:44:01 · 7428 阅读 · 0 评论 -
对于二叉树三种非递归遍历方式的理解
利用栈实现二叉树的先序,中序,后序遍历的非递归操作栈是一种先进后出的数据结构,其本质应是记录作用,支撑回溯(即按原路线返回);因此,基于其的二叉树遍历操作深刻的体现了其特性:1.先入、后出,只有不能再进入时才能出栈2.对于栈中的某一元素而言,需要判断是否还需要其的记忆作用,因此,回溯时,当不需要其记忆时则让其出栈,否则,对其做再次访问标记,这就是需要对从栈中弹出条件进行设定原创 2016-01-24 11:25:30 · 11856 阅读 · 2 评论 -
Lambda演算学习笔记
前言blog好久没有更新了,上次更新还是4月28号。这段时间实在是很忙,4月的最后一周为了赶一篇论文,累死累活,最后在tom的帮助下总算在4月30号截稿之前完成了。4月29号的晚上一直改到了第二天凌晨3点才睡。4月30号下午回家,可是没有料到长沙的八一路修路,路上堵车。打的从学校到火车站花了40分钟,平时只要15分钟的。于是在最后10分钟一路狂奔,终于在开车前1分钟上车了。五一长假的第转载 2016-05-04 08:26:57 · 4690 阅读 · 0 评论 -
神经网络
机器学习之神经网络模型-上(Neural Networks: Representation)在这篇文章中,我们一起来讨论一种叫作“神经网络”(Neural Network)的机器学习算法,这也是我硕士阶段的研究方向。我们将首先讨论神经网络的表层结构,在之后再具体讨论神经网络学习算法。神经网络实际上是一个相对古老的算法,并且沉寂了一段时间,不过到了现在它又成为许多机器学习问题转载 2016-02-02 17:43:53 · 925 阅读 · 0 评论 -
The Elements of Statistical Learning的笔记
第二章最近在阅读这本elements of statistical learning,这本书的题目翻译成中文可以叫做统计学系基础。但是我认为这本书非常之不基础。需要读者具备比较扎实的数理统计和概率论的功底,对于统计推断,统计决策以及基本的机器学习的概念有所了解。我所阅读的是从学校图书馆借来的影印本,内容为本书第一版(2001)。据说第二版有700多页那么厚。这本书有中文翻译版,但是翻译作者可能转载 2016-01-19 10:32:11 · 8216 阅读 · 0 评论 -
人脑理解递归与递推
递归真是个奇妙的思维方式。自打我大二学习递归以来,对一些简单的递归问题,我总是惊叹于递归描述问题和编写代码的简洁。但是总感觉没能融会贯通地理解递归,有时尝试用大脑去深入“递归”,层次较深时便常产生进不去,出不来的感觉。这种状态也导致我很难灵活地运用递归解决问题。有一天,我看到一句英文:“To Iterate is Human, to Recurse, Divine.”中文译为:“人理解迭代,神理解转载 2016-01-24 11:45:16 · 1494 阅读 · 0 评论 -
SVM入门
按:之前的文章重新汇编一下,修改了一些错误和不当的说法,一起复习,然后继续SVM之旅.(一)SVM的八股简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC 维转载 2015-08-22 11:06:45 · 571 阅读 · 0 评论 -
机器学习
【编者按】本文作者指出了关于数据科学书上很少提及的三点经验:模型评价方法是关键,特征提取是根本,模型选择而非数据集规模最费时间。文章指出,处理上万维的特征和几十万的样本的现代算法是愚蠢的,而特征工程理论还不完善,更像是一门艺术。这是数据科学大行其道的时代。各类课程、博客、培训学校如雨后春笋般出现。然而,每次我浏览这些学习资料时,我发现它们过于强调一些具体的算法。理解逻辑回归或者深度学习的原转载 2015-09-11 18:45:07 · 597 阅读 · 0 评论 -
十张图解释机器学习的基本概念
在解释机器学习的基本概念的时候,我发现自己总是回到有限的几幅图中。以下是我认为最有启发性的条目列表。1. Test and training error: 为什么低训练误差并不总是一件好的事情呢:ESL 图2.11.以模型复杂度为变量的测试及训练错误函数。2. Under and overfitting: 低度拟合或者过度拟合的例子。PRML 图1.4.多项式曲线有转载 2015-05-27 20:03:12 · 683 阅读 · 1 评论 -
计算机的潜意识--从机器学习谈起
在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。 在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常长的文章呢?转载 2015-04-16 18:55:30 · 2184 阅读 · 0 评论 -
对计算机科学的反思
从第1台电子计算机问世到现在已经60年了,尽管计算机科学和技术继续保持高速发展的态势,但是计算机科学与技术不能再采用以往一样的方式发展,需要革命性的突破。如果一直顺着过去形成的惯性发展,计算机科学的路子可能会越走越窄。我们需要静下心来,认真进行反思,总结经验和教训,以便将来更快更好地发展。一、计算机科学的迷途1.计算机科学不应以把解决方案搞复杂为荣 普遍认为,计算机科学是“算法的转载 2015-01-12 22:31:06 · 830 阅读 · 0 评论 -
论文写作注意事项
Tips and Guidance for Students Writing Papers and ReportsGernot HeiserContentsIntroductionGeneral Advice on Technical Writing About (Honours) Thesis Writing General AdviceStructur转载 2014-11-03 10:04:10 · 2181 阅读 · 0 评论 -
常见算法在实际项目中的应用
近日Emanuele Viola在Stackexchange上提了这样的一个问题,他希望有人能够列举一些目前软件、硬件中正在使用的算法的实际案例来证明算法的重要性,对于大家可能给到的回答,他还提出了几点要求:使用这些算法的软件或者硬件应该是被广泛应用的;例子需要具体,并给出确切的系统、算法的引用地址;在经典的本科生或者博士的课程中应该教过这些算法或者数据结构;Vijay D的回复获得了转载 2014-01-22 14:27:40 · 1093 阅读 · 0 评论 -
动态规划算法
在数学与计算机科学领域,动态规划用于解决那些可分解为重复子问题(overlapping subproblems,想想递归求阶乘吧)并具有最优子结构(optimal substructure,想想最短路径算法)(如下所述)的问题,动态规划比通常算法花费更少时间。 上世纪40年代,Richard Bellman最早使用动态规划这一概念表述通过遍历寻找最优决策解问题的求解过程。1953年转载 2013-12-27 18:03:04 · 2150 阅读 · 0 评论 -
Texmaker使用方法、Latex的优缺点
模板下载:http://pan.baidu.com/s/1rELinLatex的优势就是在排公式,如果你的论文是纯文本的话,还是用word好了。字体不是想用就能用的,字体配置一直是LaTeX里面的难点,这是一个专业级别的排版软件,要想玩好,那就得花一到两年的时间,这不是逗着玩的。首先跟大家谈一谈什么是Latex。以下两段段文字直接引自或修改自Leibniz(http://hi.baid转载 2014-01-11 10:58:50 · 6153 阅读 · 2 评论 -
英语学术论文常用经典句型
Beginning 1. In this paper, we focus on the need for2. This paper proceeds as follow.3. The structure of the paper is as follows.4. In this paper, we shall first briefly introduce fuzzy se转载 2014-01-11 10:52:08 · 1785 阅读 · 0 评论 -
四位科研牛人介绍的文献阅读经验
每天保持读至少2-3 篇的文献的习惯。读文献有不同的读法,但最重要的自己总结概括这篇文献到底说了什么,否则就是白读,读的时候好像什么都明白,一合上就什么都不知道,这是读文献的大忌,既浪费时间,最重要的是没有养成良好的习惯,导致以后不愿意读文献。 1、每次读完文献 (不管是细读还是粗读), 合上文献后,想想看,文章最重要的take home message是什么,如果不知道,就从abs转载 2013-12-26 15:54:20 · 1606 阅读 · 0 评论 -
算法之道:形而之上谓之道
1966年3月的一天,美国加州大学洛杉矶分校的Andrew J. Viterbi教授在给研究生讲解缠绕编码的时序译码算法SDCD。但不管他如何讲解,学生就是听不明白。思来想去,Viterbi觉得学生不能理解的原因是该算法的证明过于复杂。于是他开始考虑如何简化这个证明。在经历了持久的烦躁和困惑后,他灵感顿现:需要简化的不是算法的证明,而是算法本身。于是Viterbi对SDCD算法进行了少许修改,提出转载 2013-12-26 17:53:50 · 948 阅读 · 0 评论 -
CAP理论十二年回顾:"规则"变了
CAP理论断言任何基于网络的数据共享系统,最多只能满足数据一致性、可用性、分区容忍性三要素中的两个要素。但是通过显式处理分区情形,系统设计师可以做到优化数据一致性和可用性,进而取得三者之间的平衡。自打引入CAP理论的十几年里,设计师和研究者已经以它为理论基础探索了各式各样新颖的分布式系统,甚至到了滥用的程度。NoSQL运动也将CAP理论当作对抗传统关系型数据库的依据。CAP理论转载 2015-05-18 22:02:55 · 695 阅读 · 0 评论 -
ECC加密算法入门介绍
作者 :ZMWorm[CCG] E-Mail:zmworm@sohu.com" style="margin:0px; padding:0px; border:0px; text-decoration:none; color:rgb(0,153,204); font-family:Times; line-height:18px">zmworm@sohu.com 主页 :Http://ZM转载 2015-07-09 22:47:53 · 1875 阅读 · 0 评论 -
The Log: What every software engineer should know about real-time data's unifying abstraction
I joined LinkedIn about six years ago at a particularly interesting time. We were just beginning to run up against the limits of our monolithic, centralized database and needed to start the transition转载 2015-07-18 09:31:38 · 2324 阅读 · 0 评论 -
卷积的物理意义
对于初学者,我推荐用复利的例子来理解卷积可能更直观一些:小明存入100元钱,年利率是5%,按复利计算(即将每一年所获利息加入本金,以计算下一年的利息),那么在五年之后他能拿到的钱数是,如下表所示:将这笔钱存入银行的一年之后,小明又往银行中存入了100元钱,年利率仍为5%,那么这笔钱按复利计算,到了第五年,将收回的钱数是,我们将这一结果作为新的一行加入上面的表格中:以此类推,如果小明转载 2015-08-22 16:23:30 · 654 阅读 · 0 评论 -
最大似然估计学习总结
1. 作用在已知试验结果(即是样本)的情况下,用来估计满足这些样本分布的参数,把可能性最大的那个参数作为真实的参数估计。2. 离散型设为离散型随机变量,为多维参数向量,如果随机变量相互独立且概率计算式为P{,则可得概率函数为P{}=,在固定时,上式表示的概率;当已知的时候,它又变成的函数,可以把它记为,称此函数为似然函数。似然函数值的大小意味着该样本值出现的可能性的大小,既转载 2015-08-21 17:07:10 · 830 阅读 · 0 评论