- 博客(12)
- 资源 (1)
- 收藏
- 关注
原创 《推荐系统》笔记:Chapter1
引言:本章主要回答以下问题:1,什么是推荐系统2,推荐系统的主要任务是什么3,推荐系统和分类目录以及与搜索引擎的区别本章将按不同领域分别介绍目前业界常见的个性化推荐应用。最后,将介绍推荐系统的评测的方法1.1 什么是推荐系统随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overlord)的时代。对于信息消费者,从大量信息中找到自己感兴趣的信息是非常困难的事情;对于信息生产者,让自己生成的信息脱颖而出,受到广大用户的关注...
2021-11-19 10:25:40
772
原创 Weka-无监督属性过滤器-Interquartile[6-3]
我们继续第6篇的无监督属性过滤器的函数介绍。Interquartile,用以指示实例的值是否可以视为离群值或极端值。(具体演算,我们就不实验了)如果用户指定的极端值系数和四分位距的乘积值高于第75个四分位数之间的差,或低于第25个四分位数,该值就被标识为极端值。具体看代码,我们在代码中注释了各参数的含义:import java.io.BufferedReader
2016-07-01 16:36:03
2060
原创 Weka-无监督属性过滤器-AddExpressionMathExpression[6-2]
本部分延续上一篇的研究,接着2个方法:AddExpression,MathExpressionAddExpression过滤器是通过将一个数学函数应用于数值型属性而生成1个新的属性。其中,可以支持+、-、*、/、和^,函数log、abs、cos、exp、sqrt、floor、ceil、rint、tan、sin,属性通过索引加前缀a确定,例如a7表示第7个属性;MathE
2016-07-01 16:12:09
1178
原创 Weka-无监督属性过滤器-AddCopyAddid[6-1]
在weka中过滤器分为无监督过滤器和有监督过滤器两种,每种类型又细分为属性过滤器和实例过滤器,前者作用于数据中的属性,后者作用于数据集中的实例。有监督过滤器使用时,会出现以下情况:测试集数据在有监督过滤器使用时已经使用,必然造成如同先偷看答案再考试的效果。所以,对于模型的评价是有问题的。要合理地评估有监督离散化,最好使用weka的元学习器FilterClassifier。它仅使
2016-06-27 16:18:20
1625
原创 Weka-filter类-选择样本[5]
接上文的思路,我们研究如何使用weka的方法,选择样本目前有3个方法可以研究下:RemovePercentage,RemoveRange,RemoveWithValuesRemovePercentage:顾名思义,根据百分比选择样本RemoveRange:根据序号选择样本RemoveWithValues:根据某字段的设定值选择样本然后,为减少
2016-06-16 10:59:34
680
原创 Weka-Fliter类-选择属性变量[4]
在研究了weka如何导入导出数据后,根据制作数据模型的要求,我们需要对导入数据进入整理:整理数据包括:属性处理、样本处理、数据转换(生成新变量)本文先研究如何程序中选择属性,代码如下:import java.io.FileReader;import weka.core.Instances;import weka.filters.unsupervised.a
2016-06-16 10:01:14
1462
原创 weka-mysql数据库连接及以ARFF文件导出[3]
mysql数据连接,由于mysql数据库支持数据类型的较多,会有些麻烦,但是总体而言,还是方便的。相似地,在使用weka包连接mysql前,我们先回顾如何java直接连接mysql数据库;1,eclipse连接mysql数据库(请先加载mysql-connector-java-5.1.18-bin.jar包)import java.sql.Connection;
2016-06-13 11:04:21
898
原创 weka-Oracle数据库连接及以ARFF文件导出[2]
weka 在 eclipse 直接连接Oracle 取数据,需要修改weka包中的配置文件。在使用weka包连接数据库前,我们先研究 eclipse 如何连接oracle取数据1,eclipse 连接oracle取数据import java.sql.*;public class JDBCTest { public static void main(St
2016-06-12 15:32:17
964
原创 Weka文件读取及导出[1]
weka文件读取分3类,分别为:ARFF(weka自身文件读取),CSV(文本文件读取),数据库直接读取1,ARFF(weka自身文件读取),比较容易直接使用Instances类即可2,CSV文件读取需要使用dataSource类import java.io.BufferedReader;import java.io.FileReader;import w
2016-06-12 14:18:30
3921
原创 tuple、list、dict 数据结构的方法
Python 中三种重要的数据结构:tuple、list、dict 一,元组 (tuple)1,实例tup1 = ('physics', 'chemistry', 1997, 2000);tup2 = (1, 2, 3, 4, 5 );tup3 = ("a", "b", "c", "d");tup4 = ((1, 2), ('a', 'b', 'c'), [1, 2
2015-02-04 12:59:05
371
原创 R语言-向量构造 及 函数构造
1,生成向量的方法(1) seq()函数> x=seq(from=1, to=5, by=0.5)> x# [1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0(2)rep()函数> x=rep(pi, times=5)> x# [1] 3.141593 3.141593 3.141593 3.141593 3.141593(3)seq 与
2015-01-09 13:58:26
10521
转载 R.dataframe 常用操作
在使用R做数据挖掘时,最常用的数据结构莫过于dataframe了,下面列出几种常见的dataframe的操作方法。1,查看数据head(dataframe) # 查看数据前10行tail(dataframe) # 查看数据后10行2,合并数据(1)data.frame(x,y)x,y是dataframe或者一列数据,x和y的行数一样,该操作得到一个新的dataframe,该d
2014-12-25 10:24:57
5389
Video DownloadHelper Companion App 1.3.0.rar.zip
2020-01-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人