- 博客(67)
- 收藏
- 关注
转载 [编程工具篇]史上最简单的 IntelliJ IDEA 教程
史上最简单的 IntelliJ IDEA 教程 前言IntelliJ IDEA(简称 IDEA),是 Java 语言开发的集成环境,IDEA 在业界被公认为最好的 Java 开发工具之一,尤其在智能代码助手、代码自动提示、重构、J2EE 支持、各类版本工具(Git、SVN、GitHub 等)、JUnit、CVS 整合、代码分析和创新的 GU...
2019-04-16 21:23:55
566
翻译 [论文笔记]Representation Learning on Graphs: Methods and Applications
Representation Learning on Network 网络表示学习笔记 Embedding NodesEncoder-decoder ViewEncoding Methods1 Factorization based2 Random Walk based3 Deep Learning based...
2019-01-26 19:33:44
3754
1
原创 [Python] TypeError: 'set' object is not callable”解决方案
Python setset() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。注:set中无index今天读取两个文件合并,并去重。文件格式如下: 下面程序在29行报错’set’ object is not callable(当前程序中注释掉的行),此错误表示您可能已将变量名称设置为set,如果这样做,则会覆盖内置函数集 built-in就会报...
2019-01-23 16:32:47
24524
翻译 [论文笔记]Graph Embedding Techniques, Applications, and Performance: A Survey
【论文笔记】Graph Embedding Techniques, Applications, and Performance: A Survey 这篇论文列举了目前graph embedding算法,将其分为“因式分解”、“随机游走”、“深度学习”三类,在不同的任务上评估其效果,最后提了点发展方向...
2019-01-22 15:35:40
1049
转载 [Kmeans 评价指标]标准化互信息NMI计算步骤及其Python实现
转载链接 标准化互信息NMI计算步骤及其Python实现 Excellence is a continuous process and not an accident.卓越是一个持续的过程而不是一个偶然事件.标准化互信息NMI计算步骤及其Python实现 本文介绍其计算步骤和代码实现 假设对于17个样本点(v1,v2,...,v17)(v...
2019-01-17 13:24:17
5567
原创 [分类问题的评估指标] Macro-F1和Micro-F1
分类问题的评估指标 在利用K_means 聚类、LR、SVM 分类,评估Embedding 结果的好坏时,遇到如下代码,不理解当中 micro_f1,macro_f1 的含义,开此篇学习记录。 def classification(x, y, method='XGBoost'): x_train, x_valid...
2019-01-16 20:40:40
11010
1
转载 [Math]时间复杂度O(1)的离散采样算法—— Alias method/别名采样方法
关于Alias Method的介绍的比较好的是一个外国Blog:Darts, Dice, and Coins: Sampling from a Discrete Distribution,以下的介绍也主要参考这篇Blog里的算法。问题:比如一个随机事件包含四种情况,每种情况发生的概率分别为: 12,13,112,11212,13,112,112,问怎么用产生符合...
2019-01-15 20:06:05
833
转载 基于meta-path的异质网络Embedding-metapath2vec
基于meta-path的异质网络Embedding-metapath2vec 转载自:https://blog.youkuaiyun.com/hy_jz/article/details/78877483metapath2vec https://dl.acm.org/citation.cfm?id=3098036是17年发表的,使用基于meta-path...
2019-01-14 14:33:38
2120
原创 [shell 编程]几个基本知识点
开一贴篇,记录shell编程入门学习最近发现shell脚本真的很好用,可以节约很多跑实验的时间,so决定学习一哈。Shell 脚本Shell 脚本(shell script),是一种为shell编写的程序。shell 编程Java 、PHP语言一样,需要有一个文本编辑器和一个能解释执行的脚本解释器。第一个shell程序Linux 下 vi test.sh,新建一个文件test.sh, 扩...
2019-01-12 14:03:20
231
转载 Word2Vec原理详解
Word2Vec原理详解 word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解...
2018-12-24 15:46:56
249
原创 知识图谱技术综述
一.知识图谱技术综述 知识图谱技术是人工智能技术的组成部分,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础。以下内容涵盖了基本定义与架构、代表性知识图谱库、构建技术、开源库和典型应用。 引言 随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(...
2018-12-20 17:10:38
7429
1
翻译 [Trans 系列之一]TransE算法(Translating Embedding)
TransE算法(Translating Embedding) 一、引言       网络上已经存在了大量知识库(KBs),比如OpenCyc,WordNet,Freebase,Dbpedia等等。这些知识库是为了各种各样的目的建立的,因此很难用到其他系统上面。为了发挥知识库的图(graph)性,也...
2018-12-20 16:28:43
2038
原创 GBDT原理及利用GBDT构造新的特征-Python实现
GBDT原理及利用GBDT构造新的特征-Python实现 背景1 Gradient Boosting2 Gradient Boosting Decision Tree3 GBDT应用-回归和分类GBDT构建新的特征思想GBDT与LR融合方案源码内容generate GBDT featuresgenerate fea...
2018-11-15 20:34:45
563
原创 Arrays.copyOf() 的使用:
Arrays.copyOf() 用法: Arrays的copyOf()方法传回的数组是新的数组对象,改变传回数组中的元素值,不会影响原来的数组。copyOf()的第二个自变量指定要建立的新数组长度,如果新数组的长度超过原数组的长度,则保留数组默认值,例如:代码块:import java.util.Arrays;public...
2018-10-26 09:47:53
15056
1
原创 [牛客算法系列] BFPRT算法
BFPRT算法O(n)解决第k小的数我们通常会简单地进行一个快速排序后,得到第k个位置上的数字即可。我们都知道的是快速排序是个不稳定的排序,它的排序过程简单的理解主要是两个概念Partion,pivot(基准数)一趟快速排序的过程如下先从序列中选取一个数作为基准数将比这个数大的数全部放到它的右边,把小于或者等于它的数全部放到它的左边一趟快速排序也叫做Partion...
2018-10-13 16:09:46
1746
转载 LR的公式推导和过拟合问题解决方案
原文链接 Stanford机器学习课程笔记——LR的公式推导和过拟合问题解决方案 1. Logistic Regression 前面说的单变量线性回归模型和多变量线性回归模型,它们都是线性的回归模型。实际上,很多应用情况下,数据的模型不是一个简单的线性表示就可以搞定的...
2018-10-09 15:53:06
1577
转载 [面试笔试整理3]:项目问题准备
面试笔试整理5:项目问题准备 1、课题从目的 -> 意义 -> 难点 -> 如何解决的 -> 用了什么方法为什么要用这些方法 -> 创新点。 2、实习经历 实习期间主要负责华为HC大会的推荐算法以及数据分析,用过SQL Server,制作过报表。 3、自己曾经做过一些比赛,但是结果不是很好,不过还是准备写到简历里
2018-09-26 15:34:21
308
转载 [面试笔试整理2]:机器学习面试问题准备(进阶)
面试笔试整理4:机器学习面试问题准备(进阶) 一、问题杂烩1、PCA的第二主成分 第二个主成分时域第一成分方向正教的差异性次大方向。 2、什么时候用组合的学习模型 只有当各个模型之间没有相关性的时候组合起来是最好用的。但是一般来说,弱相关的模型组合比较好用。 3、多重共线性 多重共线性是指当两个特征的相关性很大的时候,会对参数模型...
2018-09-26 15:30:36
481
转载 [面试笔试整理1]:深度学习机器学习面试问题准备(必会)
此系列三篇文章的原文链接 面试笔试整理1:深度学习机器学习面试问题准备(必会) 1、神经网络基础问题(1)Backpropagation(要能推倒) 后向传播是在求解损失函数L对参数w求导时候用到的方法,目的是通过链式法则对参数进行一层一层的求导。这里重点强调:要将参数进行随机初始化而不是全部置0,否则所有隐层的数值都会与输入相关...
2018-09-26 15:28:44
455
转载 梯度消失问题与如何选择激活函数
梯度消失问题与如何选择激活函数什么是梯度消失?梯度消失有什么影响?是什么原因?解决方案有哪些?如何选择激活函数?1. 什么是梯度消失?梯度消失,常常发生在用基于梯度的方法训练神经网络的过程中。当我们在做反向传播,计算损失函数对权重的梯度时,随着越向后传播,梯度变得越来越小,这就意味着在网络的前面一些层的神经元,会比后面的训练的要慢很多,甚至不会...
2018-09-23 16:32:44
446
原创 [LeetCode] Spiral Matrix II 螺旋矩阵之二
题目Given an integer n, generate a square matrix filled with elements from 1 to n2 in spiral order.For example,Given n = 3,You should return the following matrix:[[ 1, 2, 3 ],[ 8, 9, 4 ],[...
2018-09-21 09:48:02
169
原创 Tensorflow在训练模型的时候如何指定GPU进行训练
tensorflow在训练模型的时候如何指定GPU进行训练实验室共用一个深度学习服务器,两块GPU,在用tensorflow训练深度学习模型的时候,假设我们在训练之前没有指定GPU来进行训练,则默认的是选用第0块GPU来训练我们的模型,而且其它几块GPU的也会显示被占用。有些时候,我们更希望可以通过自己指定一块或者几块GPU来训练我们的模型,而不是用这种默认的方法。接下来将简单介绍两种简单的方法...
2018-09-20 15:25:18
14133
5
原创 [LeetCode] Largest Plus Sign 最大的加型符号
题目In a 2D grid from (0, 0) to (N-1, N-1), every cell contains a 1, except those cells in the given list mines which are 0. What is the largest axis-aligned plus sign of 1s contained in the grid? Re...
2018-09-13 14:39:51
211
翻译 [Deep Learning 译文] LeCun、Bengio和Hinton三大牛的联合综述(下)
【翻译】本文为该综述文章中文译文的下半部分,详细介绍了CNN、分布式特征表示、RNN及其不同的应用,并对深度学习技术的未来发展进行展望。接上文:[Deep Learning 译文] LeCun、Bengio和Hinton三大牛的联合综述(上)卷积神经网络卷积神经网络被设计用来处理到多维数组数据的,比如一个有3个包含了像素值2-D图像组合成的一个具有3个颜色通道的...
2018-09-11 16:03:56
2255
翻译 [Deep Learning 译文] LeCun、Bengio和Hinton三大牛的联合综述(上)
英文原文链接:Deep Learning 三大牛人 联合综述 译文下篇链接:[Deep Learning 译文] LeCun、Bengio和Hinton三大牛的联合综述(下) 【翻译】本文为该综述文章中文译文的上半部分,深入浅出地介绍了深度学习的基本原理和核心优势。原文摘要:深度学习可以让那些拥有多个处理层的计算模型来学习具有多层次抽象的数据的表示。这些方法...
2018-09-11 15:56:42
1494
原创 [LeetCode] Unique Binary Search Trees 独一无二的二叉搜索树
题目 Given n, how many structurally unique BST’s (binary search trees) that store values 1…n?For example,Given n = 3, the
2018-09-11 09:44:13
141
转载 计算机视觉四大基本任务(分类、定位、检测、分割)
计算机视觉四大基本任务(分类、定位、检测、分割)深度学习目前已成为发展最快、最令人兴奋的机器学习领域之一,许多卓有建树的论文已经发表,而且已有很多高质量的开源深度学习框架可供使用。然而,论文通常非常简明扼要并假设读者已对深度学习有相当的理解,这使得初学者经常卡在一些概念的理解上,读论文似懂非懂,十分吃力。另一方面,即使有了简单易用的深度学习框架,如果对深度学习常见概念和基本思路不了解,面对现实任务...
2018-09-10 18:00:20
17493
转载 [目标检测算法] 从R-CNN、Fast R-CNN、Faster R-CNN、R-FCN 到 FPN
「目标检测算法」从Faster R-CNN 、 R-FCN 到 FPN ...
2018-09-10 15:13:24
647
原创 [LeetCode] Combination Sum IV 组合之和之四
题目Given an integer array with all positive numbers and no duplicates, find the number of possible combinations that add up to a positive integer target.Example: nums = [1, 2, 3] target = 4 The...
2018-09-10 10:53:38
314
转载 图像处理之特征提取
图像处理之特征提取 知乎上看到一个话题——目前火热的 Deep Learning 会灭绝传统的 SIFT / SURF 特征提取方法吗?由于之前研究过SIFT和HOG这两种传统的特征提取方法,故本篇文章先对SIFT和HOG作一综述,并比较二者优缺点。之后,将SIFT和HOG同神经网络特征...
2018-09-04 16:10:04
20563
原创 [LeetCode] Longest Palindromic Subsequence 最长回文子序列
题目Given a string s, find the longest palindromic subsequence’s length in s. You may assume that the maximum length of s is 1000.Example 1: Input: “bbbab” Output: 4 One possible longest palin...
2018-09-04 14:04:24
136
转载 从线性分类器到卷积神经网络
从线性分类器到卷积神经网络前言本文大致分成两大部分,第一部分尝试将本文涉及的分类器统一到神经元类模型中,第二部分阐述卷积神经网络(CNN)的发展简述和目前的相关工作。本文涉及的分类器(分类方法)有:线性回归逻辑回归(即神经元模型)神经网络(NN)支持向量机(SVM)卷积神经网络(CN...
2018-09-03 14:54:43
3312
原创 [LeetCode] Target Sum 目标和
题目You are given a list of non-negative integers, a1, a2, …, an, and a target, S. Now you have 2 symbols + and -. For each integer, you should choose one from + and - as its new symbol. Find out ho...
2018-09-02 14:23:26
412
原创 [LeetCode] Predict the Winner 预测赢家
题目Given an array of scores that are non-negative integers. Player 1 picks one of the numbers from either end of the array followed by the player 2 and then player 1 and so on. Each time a player pic...
2018-08-30 11:18:35
353
转载 神经网络训练中的Tricks之高效BP(反向传播算法)
神经网络训练中的Tricks之高效BP(反向传播算法) ...
2018-08-29 16:39:02
678
原创 [LeetCode] Shopping Offers 购物优惠
题目In LeetCode Store, there are some kinds of items to sell. Each item has a price.However, there are some special offers, and a special offer consists of one or more different kinds of items with ...
2018-08-29 14:56:18
583
转载 梯度下降算法分类总结
梯度下降算法分类总结 引言 梯度下降法 (Gradient Descent Algorithm,GD) 是为目标函数J(θ),如代价函数(cost function), 求解全局最小值(Global Minimum)的一种迭代算法。为什么...
2018-08-27 15:41:23
7345
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人