- 博客(23)
- 资源 (5)
- 收藏
- 关注
原创 再见
明天就要离校了,感谢导师两年多的指导与帮助,让我得以入门科研,感谢同实验室同宿舍的朋友的陪伴,让这段日子不那么孤单。感谢丰富人生的另一些事,让我苦恼、开心与悲伤,可惜我不是作家,不然可以增加很多可写的东西...
2019-01-06 19:19:54
353
原创 Confession:关于本博客以及实习
本来写这些博客有很大原因是因为觉得对找工作有用,其实面试了两个实习我也从来没提过这个博客,想着帮助可能也不大。已经大半年没有更新了,今天谈谈实习那些事。首先是找实习工作,我真正准备的有华为、百度、招商银行fintech训练营三个。百度笔试被刷了,也是意料之中,编程都没编出来,问答题也一窍不通,选择题估计错误也不少,还是准备的不足。招商银行是我挺想去的一个公司,因为不太喜欢互联网公司的加班文化,同时...
2018-07-03 22:07:00
448
1
原创 关于投稿
从十月份到上周二,我投了两篇论文。一篇是在导师会议论文上做延伸,投到一篇逻辑学的SCI期刊上。另一篇是这段时间一直做的一个课题,投到了数据挖掘领域还可以的一个会议PAKDD上。写这两篇论文我深切地体会到了导师的重要性。首先,他会和你就课题展开讨论,去明确问题定义与算法实现等。然后,基于他在这一领域上的研究,他会给出很多有价值的参考文献。最后,在论文写作上,他又可以给出专业的指导,尤其是规范化英语写作
2017-11-28 10:07:07
589
原创 换个角度思考问题——频繁项集挖掘的两个优化策略
在以前的博客中介绍过数据挖掘的一个基本问题频繁项集挖掘。对于这一问题,有很多不同思想的算法。同时,也有一些优化策略可以在算法基本不变的情况下大大提高算法的效率。今天介绍两个:竖向数据库(Vertical database)、Diffsets
2017-07-12 17:45:45
916
翻译 使用LaTeX写论文
许多研究人员喜欢用Microsoft Word写论文。然而Word会有一些问题和局限。在本博文中,我会讨论用LaTeX代替Word去写论文
2017-06-11 21:38:30
20407
1
原创 自然语言处理Java开源包FNLP(FudanNLP)的使用
自然语言处理是如今计算机科学领域比较火热的一个方向,其也确实有很大的应用场景。前面说过,我参加了微软编程之美的比赛,这个比赛其所基于的就是自然语言处理。我本身并不是学自然语言处理的,甚至连这门课也没有选过,可是为了完成资格赛我自己在网上找了一些资料。时间所限,也是能力所限,我当然不会自己去实现一些诸如中文分词与词性标注的自然语言处理算法。自然的,我想到了在网上找一些开源包。我主要考虑的是三个包...
2017-05-21 21:17:43
19600
1
原创 参加了一个比赛
学计算机的,项目经历还是很重要的,参加一些竞赛对找工作也很有帮助。周围同学基本上都报名了一些比赛,我准备参加微软的编程之美比赛。原因是我比较喜欢它的赛制,它的时间比较宽裕,而且也有一定的培训。困难在于我不太熟悉C#编程昨天找了三个队友,一位是清华深研院先进制造部的博士学长,一位是我隔壁寝室的同学,还有一位是大一的本科生。我对于队员配置还比较满意,之后就靠我们的努力了。。。
2017-05-01 12:04:35
478
原创 Ubuntu 初步使用经验(虚拟机安装、命令行简单操作、常见问题)
因为我们实验室将于近期购买一批服务器,并会在后续开展大数据的相关研究。所以为了对以后的大数据技术(spark、Hadoop)的学习做一些准备,我决定熟悉一下Linux环境。在这篇博客里面我将介绍在VMware workstation里安装Ubuntu,Ubuntu使用中的一些问题,远程连接Ubuntu。一、 VMware workstation下安装Ubuntu首先是在VMware官网上下载安装包,
2017-04-22 16:37:02
3836
原创 反向传播神经网络(BP网络)介绍及Java实现
介绍了神经网络的经典算法反向传播神经网络(Backpropagation Neural Network),介绍了算法过程以及网络分类过程、训练过程。也详细介绍了推导过程,并提供了java实现
2017-04-01 21:03:27
4140
原创 HUI-Miner:高效的高效用项集(high-utility itemset)挖掘算法
在之前的博客中我介绍过我的研究方向高效用挖掘算法。今天我将介绍解决这一问题的一个运行速度很快,并且很容易理解的一个算法–HUI-Miner,并会提供Java实现。
2017-03-25 18:18:30
2939
原创 关联规则(association rule)挖掘与频繁项集挖掘算法Apriori Java实现
简单介绍关联规则挖掘,并由此引出频繁项集挖掘,并介绍了Apriori算法,并提供了Java实现
2017-03-18 20:03:58
2876
原创 动态规划(dynamic programming)及示例(矩阵连乘、最长公共子序列、三角剖分)
动态规划是一个比较重要的算法思想,只要学了算法相关课程,一定会有这一章节。我会介绍动态规划的主要思想,也会在后面用Java实现几个经典算法(矩阵连乘、最长公共子序列、多边形三角剖分)作为示例加深理解。
2017-02-25 13:33:02
909
原创 2/14-2/24
提前大约两周回到学校,发现同学也都差不多到了。一是导师都想叫学生提前返校;二是今年寒假也确实较长,尽管已经提前大约两周,还是已经放了一个月的假。导师已经布置了研究任务,计划让我在八月前发一篇文章,给的研究课题是寻找高效用项集产生较高效用的时间段 。这一课题基本就是在传统的高效用项集挖掘的基础上加上时间。举个例子,假设{香蕉、苹果}是一个商店比较赚钱的一个组合,我们还想知道这一组合在什么时间段产生的利
2017-02-24 17:41:09
551
原创 高效用项集(High-Utility Itemset)挖掘介绍
高效用挖掘是数据挖掘子领域模式挖掘(pattern mining) 的一个研究方向。我将以交易数据库对其进行简单介绍,并提供一个开源网站,里面包含了该领域几乎所有的算法。
2017-02-18 19:26:51
3856
原创 人工智能之我见
如今人工智能(AI)相当火爆,各大互联网公司都将人工智能视为下一个“风口”,都设立了相关研究机构,唯恐在下一个技术热潮中落下队来。最近将AI 带到普通人视野中的是谷歌旗下DeepMind一个团队研发的AlphaGo 击败了众多世界级围棋高手。 我个人也认为AI是大势所趋,它将深刻地改变这个世界地运行方式,而且在不久的将来会有成熟的应用产品(我认为像Siri、Google Now、Cortana等
2017-01-24 16:18:04
1907
原创 K近邻分类器(KNN)手写数字(MNIST)识别
KNN(K-Nearest-Neighbor) 是分类算法中比较简单的一个算法。算法思想非常简单:对于一个未知类别的样例,我们在很多已知类别的样本中找出跟它最相近的K个样本,赋予该样例这K个样本中占多数的类别。 在这里我将用KNN算法做手写体识别,用的数据集是MNIST,最后准确率为94%左右。附带数据集与源码
2017-01-21 19:46:48
8563
原创 开始写博客
研一第一次寒假,有一些空闲时间,开始写一些博客记录自己研究生第一学期学到的东西,也是一次梳理与总结。 我的专业方向是数据挖掘,更确切一点导师的研究方向主要是高效用项集挖掘(high utility itemset mining)。我现在是研一,还没有具体的参与导师的科研项目,这一学期的主要学习任务也是上课,学一些和自己研究方向相关的、较本科来说稍困难的一些课程。 在这里我稍微
2017-01-21 17:22:02
330
反向传播神经网络(BP网络)java实现(手写体识别)
2017-04-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人