
科研文献
文章平均质量分 60
雨梦
专注移动互联网及编程技术。
具体内容交流,请微博私信:
www.weibo.com/yumengkk
展开
-
“简单事务操作”数据库(NO-SQL数据库)应用系统的可扩展性设计的十条原则
原文:《Ten Rules for Scalable Performance in “Simple Operation” Datastores 》By Michael Stonebraker and Rick Cattell作者简介:(MIT教授,多家公司和项目翻译 2011-09-19 22:33:44 · 1759 阅读 · 0 评论 -
图数据库模型简介
图数据库模型简介一、 数据模型1、Data model:一组描述真实世界事务及其关系的概念组合。在数据库领域,数据模型包括:数据结果,操作+推理规则和通用的集成规则。2、Graph database model:1、data和schema是以图的方式表示的;2、操作是以graph transformation(比如path、neighborhood、graph pattern等原创 2012-03-07 11:15:50 · 4553 阅读 · 0 评论 -
两个开源的社会网络分析工具(NodeXL,ORA)
社会网络分析十个热门的领域,好的分析工具很重要,这里归纳一下自己了解的内容。NodeXL:http://nodexl.codeplex.com/基于微软Excel的社会网络分析工具,简单,不需要程序开发;适合中小企业用户。CMU的ORA:http://www.casos.cs.cmu.edu/projects/ora/index.php融合多种已有的开源代码,基于Java。原创 2012-03-17 13:09:51 · 7913 阅读 · 5 评论 -
本体在背景感知应用中的使用
“孤零零的个体毫无意思!”——因此,我们需要探索复杂、交互的世界!一、本体介绍1、本体是大家对事物的一个共同认识的描述,该描述可以在不同人之间进行知识共享。可以有效的支持互操作,推理。比如W3C的语义网本体,采取标准化的方法,实现机器可以理解的规范化知识描述,并且采用RDF格式支持串行化。2、本体解决的问题:这是什么?确定世界上存在的实体,为其建立分类,说明各个类别和实体间的关系。原创 2012-04-12 21:35:45 · 1205 阅读 · 0 评论 -
IT研究员是产品经理中的工程师和工程师中的计算机专家——geek
我一直在考虑计算机领域中的科研应该怎么定位,需要解决什么问题。而我最敬佩的研究人员所在地 是Stanford,MIT,UCLA等高校,和IBM,微软、谷歌等企业。归纳他们的研究成就,个人认为主要是两类:1、(产品经理中的工程师)深入的探究真正的需求,然后亲自实现他们:处理器,操作系统,办公软件,搜索引擎,社交网络。 首先这些人有优秀产品经理的特质,然后有工程师的执行力。原创 2012-04-25 22:43:21 · 2047 阅读 · 0 评论 -
Word排版计算机类科研论文的格式保证
基本原则:遵循会议或者期刊给出的模板;但是,其中困难的是:如何保证代码(伪代码)的风格,图表的清晰度和公式的大小一致。下面,根据自己的一些经验,探讨一下:1、代码的风格:可以借助Nodepad++的插件nppExport,可以将写的代码copy成RTF格式,RTF是微软支持的格式,兼容性很好;2、图标,如果用visio格式,则将图片保存为图元模式,或者增强图元模式,Matlab画的的图原创 2012-04-14 23:27:03 · 10463 阅读 · 0 评论 -
关于微软研究院(谢幸、郑宇研究员主导的)“智能城市”“智能生活”研究的一个归纳
微软亚洲研究院基于GPS数据展开的研究工作,取得了另学术界瞩目的成就。从2008年开始每年都在顶级的计算机类会议上有文章发出,掀起了研究GPS数据智能化处理的热潮。 他们的工作由谢幸研究员和郑宇研究员主导。实验数据采集主要有两个工程:1、Geolife工程使用的,170多个志愿者4年左右的GPS轨迹;2、北京市2万多出租车约3个月的行驶轨迹。参见:http://rese原创 2012-04-29 23:11:06 · 15977 阅读 · 2 评论 -
移动互联网领域为什么不是P2P或者网格模式,而是云模式
做数据处理时深感资源不足,这是学术圈的共识,因此有人提出,实验资源(计算资源)通过网络互联实现共享。从计算的角度来讲,同当年网格计算的思路非常相似;从内容共享的角度来看,同P2P的内容分享非常相似,如迅雷等。 由此想到当年的P2P和网格为什么现在很少被提及,而云成为了主流。这里暂且不谈学术领域这个较窄的圈子,而是从更高的层面探讨下,移动互联网时代P2P和网格技术的没落,云计算模式兴原创 2012-06-10 10:53:24 · 2170 阅读 · 0 评论 -
Latex中如何高效的查找到参考文献
ACM的会议,需要bibtex管理参考文献;而如何找到自己引用的文章,并且快速获得其bibtex的数据呢。1、可以采用:Dblp的搜索功能:可以搜作者也可以搜题目http://www.dblp.org/search/#2、找到需要的文献后,点击其下面的bibtex图标,就可以得到同acm格式兼容的参考文献数据;3、将参考文献信息,黏贴到自己的bib文件中即可。原创 2012-05-25 23:44:57 · 3329 阅读 · 0 评论 -
SigMOD2012感兴趣的论文(时空数据处理)——记下慢慢看
图中联合做距离数据处理:Efficient Processing of Distance Queries in Large Graphs: A Vertex Cover Approach, James Cheng, Nanyang Technological University; Yiping Ke, Institute of High Performance Computing, Sing原创 2012-06-15 00:18:47 · 2536 阅读 · 0 评论 -
LaTeX 中算法有关宏包和命令的使用
留存:插入表格 如果一项内容太多需要换行 加入 \newcommand{\tabincell}[2]{\begin{tabular}{@{}#1@{}}#2\end{tabular}}命令: \tabincell{c}{aa\\bb} 公式太长,需要分割为两行是:可以用如下方法:可以使用下面的语句,使得编号显示在两个等式的中间:\begin{equati转载 2012-05-07 03:22:05 · 20443 阅读 · 0 评论 -
后端程序员的前端修养:需要知道的HTML+CSS+Javascript
网页前端可以看做一个松散的MVC架构,Model是内容即有HTML标记语言说明;View是视图有CSS实现;control有Javascript实现。原则一CSS:内容与样式的分离 HTMl是用标签说明内容,有浏览器负责渲染;HTML的标签可以看做一个可以设置样式、进行操作的对象,因此网页中的内容都可以通过 “标签类别+ID”寻找到。 比如: 则该输入框就可以再Javasc原创 2012-09-11 01:06:15 · 9173 阅读 · 1 评论 -
listings 是专用于代码排版的 LaTeX宏包(及使用xltxtra进行中文支持)
listings 是专用于代码排版的 LaTeX宏包,可对关键词、注释和字符串等使用不同的字体和颜色或颜色,也可以为代码添加边框、背景等风格。1 基本用法下面给出一份用于排版 C 语言 HelloWorld 程序代码的完整的 LaTeX 文档:\documentclass{article}\usepackage{listi转载 2012-10-17 11:25:24 · 24541 阅读 · 0 评论 -
数据感知(采集)新技术:压缩感知精粹
声明:大多数内容参考自“科学松鼠会”,大家可参考原文:http://songshuhui.net/archives/11006引子:如果你的相机记录了大量的数据,却在压缩时丢弃了其中的90%,那么为什么不在一开始就只记录10%的数据从而节省电池电量和内存?一、动机压缩感知从字面上看起来,好像是数据压缩的意思,而实则出于完全不同的考虑。经典的数据压缩技术,无论是音频压缩(原创 2012-10-30 10:51:25 · 9282 阅读 · 0 评论 -
数据挖掘面临的科学和工程的新问题
每次谈到数据挖掘都让人很兴奋,但是真正的应用有几个是数据挖掘算法支撑起来的呢:大家哈哈一笑,”除了尿布和啤酒“还有什么拿的出的例子吗。传统的统计学方法可以解决大多数知识发现问题。数据挖掘实际上是一组在人类高级智能和计算机低级智能间的抽象算法:分类(聚类,智能是基础)、关联(和专家系统的规则有区别吗)。个人认为数据挖掘的几个算法其本质类似于数据库领域的”SQL“语句。用几个基本的算子尽量组织成复杂的原创 2012-02-28 21:06:31 · 2115 阅读 · 1 评论 -
图挖掘:社会网络分析和多关系数据挖掘
新兴研究领域介绍:图挖掘和多关系数据挖掘。一、什么是图挖掘?为什么进行图挖掘 1、图的用途越来越广,包括对互联网、社会化网络、生物、电路、图像的建模。 2、许多图搜索算法已经被开发出来了,并且广泛用在信息检索、计算机视觉等领域; 3、需要进一步开发高效的图挖掘算法,以便从更加复杂的结构化数据中挖掘出有效的知识。二、挖掘频繁子图原创 2012-02-25 11:40:51 · 11607 阅读 · 0 评论 -
移动中间件技术简介
移动中间件技术是伴随着网络技术、通信技术、嵌入式操作系统和中间件技术的发展和融合而出现的新兴技术,是当前移动数据业务、未来3G业务以及广大智能终端增值业务的关键共性技术。移动中间件为使包括计算机、笔记本、手机、掌上电脑、电话、家电、汽车等在内的广大终端具有增值应用能力带来了革命性原创 2011-09-20 00:32:08 · 5977 阅读 · 0 评论 -
Rstat树(R*树)1990年空间数据索引经典论文翻译
这篇文章发布于1990年。相比R树那篇论文,这一篇要晦涩得多。主要的内容是对R树的改进。 我原本打算全文翻译的,但是实在是太耗时间了,所以前面翻译的还算比较认真,后面的质量就越来越差了,差不多算是鸟语了。翻译这篇东西花了一周,虽说有我效率太低的原因,可是实在太久了,以后转载 2011-09-19 22:21:20 · 1936 阅读 · 1 评论 -
固态硬盘(SSD)扫盲
1、SSD简介SSD即固态硬盘(Solid State Disk或Solid State Drive),也称作电子硬盘或者固态电子盘,是由控制单元和固态存储单元(DRAM或FLASH芯片)组成的存储设备,目前支持SATA、FC、SAS接口,可以替代普通的机械硬盘。固态硬盘的接原创 2011-09-21 16:47:32 · 6210 阅读 · 0 评论 -
如何利用(微软学术)/(google学术)/google网页,聚焦最新科技文献,并获得PDF版
当对一个研究领域感兴趣时,试着用关键字描述该领域:1、关键字确定; 进入google学术:http://scholar.google.com.hk/ 用自己猜测的关键字搜索,而后观察结果文献,逐步确定自己的准确关键字。2、最有价值相关文献查找;原创 2011-09-24 20:24:20 · 12623 阅读 · 0 评论 -
推荐(IT)国际会议日程网站
对于科研人员来讲,国际会议是交流的主阵地,在IT领域,顶级会议的地位甚至高过顶级期刊:一个好的发现网站:其中左侧两项尤其实用:CCF:中国计算机学会排名:A、B、C三等,能入流都是不错的会议;ACF: (韩国一个研究机构)给出的排名:A、B、C三等,能入流都是不错的会原创 2011-09-29 23:25:36 · 1262 阅读 · 0 评论 -
科技论文写作(视频指导)
各位虫友们,各位科研工作者们大家好,对于大家来说成果最后都是要通过文章来表现出来,为了让更多的人了解自己的成果,所以科研论文写作,尤其是外文科研论文的写作显得尤为重要。下面由我向大家推荐本版关于论文写作的一些优秀的帖子,其中包括中外大牛或大数据库机构对论文写作的经验和建议。1,首先是国外的一些大牛们的宝贵的经验和建议,帖子如下:【教程】大牛教你写论文(哈佛大学); http://e转载 2011-10-23 21:51:13 · 11762 阅读 · 0 评论 -
EI(SCI) 收录国外英文期刊(计算机类)
9. AUSTRALIAN COMPUTER JOURNAL Quarterly(4/yr.)ISSN: 0004-8917 Associated Business Publications Pty. Ltd., 3 Smail St., Rm 104, Ultimo, NSW 2007, Australia27. CHINESE JOURNAL OF ADVANCED SOF转载 2011-11-15 21:50:59 · 18408 阅读 · 0 评论 -
Matlab坐标轴操作汇总
1、坐标轴的视点(viewpoint):从哪个方向看整个坐标系统,这决定了坐标轴的方向和位置,通过view函数实现视点的设置; view([z y ]):(将坐标系统想象为一座房子,而自己是个会飞的天使,最初你在房子的北,海拔角度为0的位置,这是时你的视角是view[0 0],之后可以根据需要设置z和y的值,分别是绕房子转动的方向,和沿空间轴向上妃的高度)z表示视角沿z轴(正方向)旋转原创 2011-10-02 23:38:15 · 64725 阅读 · 1 评论 -
希腊字母及其读音
1 Α α alpha /a:lf/ 阿尔法 2 Β β beta /bet/ 贝塔 3 Γ γ gamma /ga:m/ 伽马 4 Δ δ delta /delt/ 德尔塔 5 Ε ε epsilon /ep`silon/ 伊普西龙 6 Ζ ζ zeta /zat/ 截塔 7 Η η eta /eit/ 艾塔 8 Θ θ thet /θit/ 西塔转载 2011-11-28 11:31:53 · 973 阅读 · 0 评论 -
Hamming(海明):如何做research
1、追逐兴趣,开始行动 找到自己喜欢的专业,开始投入;”follow your heat“ 成功来自于持续的思考,勤奋可以产生复利;“If you thinking , God is smile." 成功不是运气,成功喜欢有准备的人。2、做大事,成大业; 每当进入一个领域之后,就主要关注最重要的问题;" Big thi原创 2011-11-13 18:05:49 · 2766 阅读 · 0 评论 -
(移动位置社会网络中)LBSN:好友关系对人类活动的影响分析
题目:Friendship and Mobility: User Movement in Location-Based Social Networks来源:SIGKDD-2011(数据挖掘顶级会议)作者单位:斯坦福大学(Eunjoon Cho, Seth A. Myers, Jure Leskovec)译者:雨梦:http://weibo.com/yumengkk,个人主页:www.u翻译 2012-01-05 12:23:44 · 5512 阅读 · 0 评论 -
科研中成功的品质
1、勤奋:积极的完成重要的事情,不要拖拉;2、主动:抓住机会,使自己始终探索新的方法、途径、方案;3、开放:善于交流,积极合作。原创 2012-02-11 08:43:06 · 910 阅读 · 0 评论 -
【介绍】KDD Cup2012 数据挖掘竞赛主题一:预测围脖的推荐结果(腾讯赞助)
Predict which users (or information sources) oneuser might follow in Tencent Weibo. 数据挖掘竞赛主题一:预测围脖的潜在关注者(腾讯赞助) 竞赛主页:http://www.kddcup2012.org/c/kddcup2012-track11、背景 近些年,在线社交网络发展的如火如荼,原创 2012-02-25 17:02:18 · 8663 阅读 · 6 评论 -
语义轨迹数据分析:一种概念和计算方法
语义轨迹数据分析:一种概念和计算方法Towards Semantic Trajectory Data Analysis:A Conceptual and Computational Approach作者:Zhixian Yan——瑞士EPFL来源:VLDB2009(大规模数据库系统年会)译者注:该文章比较老,但是代表了一种趋势,将人类难于理解的空间点数据(GPS轨迹)转化为易于人类翻译 2012-02-24 22:50:15 · 5048 阅读 · 0 评论 -
Google优秀论文列表——关于国内科研的一点比较思考
赞同的科研观点: Google所有的员工致力于为科研社区做贡献,方式有很多样:发表论文,贡献开源代码,参与标准制定,介绍新的API和工具,提供报告和课程,参与新技术的讨论等等。 至少国内也不应该以发表“拍脑门的”论文为唯一科研水平考核标准。Posted by Corinna Cortes and Alfred Spector, Google Resea翻译 2012-11-01 09:02:41 · 8395 阅读 · 2 评论