
数据挖掘
文章平均质量分 77
Oytyoht
这个作者很懒,什么都没留下…
展开
-
序列模式挖掘算法BIDE
import java.io.BufferedReader;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.InputStreamReader;import java.util.ArrayList;import ja原创 2015-10-17 16:32:55 · 2181 阅读 · 1 评论 -
apriori算法
这个算法用于挖取关联规则,主要用于推荐系统下面这个代码是我分析web日志的时候用的,日志从索引里读。主要功能是产生频繁项。package test;import java.io.File;import java.io.IOException;import java.text.SimpleDateFormat;import java.util.ArrayList;impor原创 2015-09-16 23:08:46 · 291 阅读 · 0 评论 -
模拟登录新浪微博
package getLog;import java.io.IOException;import java.util.ArrayList;import java.util.List;import org.apache.http.HttpEntity;import org.apache.http.HttpResponse;import org.apache.http.NameValu原创 2015-09-22 14:17:24 · 621 阅读 · 0 评论 -
jsoup做爬虫
import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.net.URL; import java.net.URLConnection; import java.util.HashSet; import原创 2015-10-27 22:07:08 · 367 阅读 · 0 评论 -
获取新浪微博内容和评论
public List getWeiboList(String content) throws ClientProtocolException, IOException{ Document doc=Jsoup.parse(content); Elements sets=doc.getElementsByClass("c"); List list=new ArrayList(); Syste原创 2015-09-24 11:10:32 · 1759 阅读 · 0 评论