- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 毕业设计整理思路
乱写本来就想直接沿用老师的思路,只需要一个比较相似文档就好。半路读到推荐系统,感觉很有意思,而且抓取到用户评论以及用户的其他购买商品数据之后,完全可以做一个“你可能还喜欢”的简单推荐系统。系统需要的输入信息:某个商品的url(item OR review?)系统需要输出的信息:XX商品的url(购买该商品的用户还买了XX商品)系统需要抓取的信息:1根据A商品的url,建立A商品
2013-05-12 15:19:27
884
原创 毕业设计-利用nutch中Outlink类的方法获取数据库属性值
今天重新思考了下,对于系统后续工作非常重要的三个数据库属性值的获取方法:Product(product_id,product_name,product_url)User(user_id,user_name,user_role,user_url)Discussion(discuss_id,discuss_content,discuss_url,product_id,user_
2013-05-08 20:00:58
1058
转载 理解Lucene索引过程
理解索引过程Lucene索引过程分为三个主要的阶段:将数据转换为文本、分析文本、将分析过的文本保存到索引库中1 转换成文本在索引之前,必须将数据转换为Lucene可以处理的格式——纯文本字符流。2 分析完成了针对待索引数据的预处理,并创建了带有若干个域的Document对象,就可以调用IndexWriter的addDocument(Document)方法,将数据传递给L
2013-05-08 14:17:22
571
转载 Lucene索引过程核心类的简单理解
执行最简单的索引过程需要用到下列几个类:IndexWriterDirectoryAnalyzerDocumentField下面对这些类进行简要介绍。1 IndexWriter索引过程的核心组件。这个类用于创建一个新的索引,并且把文档加到已有的索引中去。可以这样理解IndexWriter:它可以为你提供对索引的写入操作,但不能用于读取或者搜索索引。2 Di
2013-05-08 13:25:24
689
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人