隆猫-优快云博客

原创《推荐系统》笔记：Chapter1

引言：本章主要回答以下问题：1，什么是推荐系统2，推荐系统的主要任务是什么3，推荐系统和分类目录以及与搜索引擎的区别本章将按不同领域分别介绍目前业界常见的个性化推荐应用。最后，将介绍推荐系统的评测的方法1.1 什么是推荐系统随着信息技术和互联网的发展，人们逐渐从信息匮乏的时代走入了信息过载（information overlord）的时代。对于信息消费者，从大量信息中找到自己感兴趣的信息是非常困难的事情；对于信息生产者，让自己生成的信息脱颖而出，受到广大用户的关注...

2021-11-19 10:25:40 855

原创 Weka-无监督属性过滤器-Interquartile[6-3]

我们继续第6篇的无监督属性过滤器的函数介绍。Interquartile，用以指示实例的值是否可以视为离群值或极端值。（具体演算，我们就不实验了）如果用户指定的极端值系数和四分位距的乘积值高于第75个四分位数之间的差，或低于第25个四分位数，该值就被标识为极端值。具体看代码，我们在代码中注释了各参数的含义：import java.io.BufferedReader

2016-07-01 16:36:03 2162

原创 Weka-无监督属性过滤器-AddExpressionMathExpression[6-2]

本部分延续上一篇的研究，接着2个方法：AddExpression，MathExpressionAddExpression过滤器是通过将一个数学函数应用于数值型属性而生成1个新的属性。其中，可以支持+、-、*、/、和^，函数log、abs、cos、exp、sqrt、floor、ceil、rint、tan、sin，属性通过索引加前缀a确定，例如a7表示第7个属性；MathE

2016-07-01 16:12:09 1249

原创 Weka-无监督属性过滤器-AddCopyAddid[6-1]

在weka中过滤器分为无监督过滤器和有监督过滤器两种，每种类型又细分为属性过滤器和实例过滤器，前者作用于数据中的属性，后者作用于数据集中的实例。有监督过滤器使用时，会出现以下情况：测试集数据在有监督过滤器使用时已经使用，必然造成如同先偷看答案再考试的效果。所以，对于模型的评价是有问题的。要合理地评估有监督离散化，最好使用weka的元学习器FilterClassifier。它仅使

2016-06-27 16:18:20 1673

原创 Weka-filter类-选择样本[5]

接上文的思路，我们研究如何使用weka的方法，选择样本目前有3个方法可以研究下：RemovePercentage，RemoveRange，RemoveWithValuesRemovePercentage：顾名思义，根据百分比选择样本RemoveRange：根据序号选择样本RemoveWithValues：根据某字段的设定值选择样本然后，为减少

2016-06-16 10:59:34 756

原创 Weka-Fliter类-选择属性变量[4]

在研究了weka如何导入导出数据后，根据制作数据模型的要求，我们需要对导入数据进入整理：整理数据包括：属性处理、样本处理、数据转换（生成新变量）本文先研究如何程序中选择属性，代码如下：import java.io.FileReader;import weka.core.Instances;import weka.filters.unsupervised.a

2016-06-16 10:01:14 1495

原创 weka-mysql数据库连接及以ARFF文件导出[3]

mysql数据连接，由于mysql数据库支持数据类型的较多，会有些麻烦，但是总体而言，还是方便的。相似地，在使用weka包连接mysql前，我们先回顾如何java直接连接mysql数据库；1，eclipse连接mysql数据库（请先加载mysql-connector-java-5.1.18-bin.jar包）import java.sql.Connection;

2016-06-13 11:04:21 933

原创 weka-Oracle数据库连接及以ARFF文件导出[2]

weka 在 eclipse 直接连接Oracle 取数据，需要修改weka包中的配置文件。在使用weka包连接数据库前，我们先研究 eclipse 如何连接oracle取数据1，eclipse 连接oracle取数据import java.sql.*;public class JDBCTest { public static void main(St

2016-06-12 15:32:17 999

原创 Weka文件读取及导出[1]

weka文件读取分3类，分别为：ARFF(weka自身文件读取），CSV(文本文件读取），数据库直接读取1，ARFF(weka自身文件读取），比较容易直接使用Instances类即可2，CSV文件读取需要使用dataSource类import java.io.BufferedReader;import java.io.FileReader;import w

2016-06-12 14:18:30 4016

原创 tuple、list、dict 数据结构的方法

Python 中三种重要的数据结构：tuple、list、dict 一，元组（tuple）1，实例tup1 = ('physics', 'chemistry', 1997, 2000);tup2 = (1, 2, 3, 4, 5 );tup3 = ("a", "b", "c", "d");tup4 = ((1, 2), ('a', 'b', 'c'), [1, 2

2015-02-04 12:59:05 409

原创 R语言-向量构造及函数构造

1，生成向量的方法（1） seq（）函数> x=seq(from=1, to=5, by=0.5)> x# [1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0（2）rep（）函数> x=rep(pi, times=5)> x# [1] 3.141593 3.141593 3.141593 3.141593 3.141593（3）seq 与

2015-01-09 13:58:26 10617

转载 R.dataframe 常用操作

在使用R做数据挖掘时，最常用的数据结构莫过于dataframe了，下面列出几种常见的dataframe的操作方法。1，查看数据head(dataframe) # 查看数据前10行tail(dataframe) # 查看数据后10行2，合并数据(1)data.frame(x,y)x,y是dataframe或者一列数据，x和y的行数一样，该操作得到一个新的dataframe，该d

2014-12-25 10:24:57 5481

Video DownloadHelper Companion App 1.3.0.rar.zip

Firefox Video DownloadHelper 需要安装后使用的插件Video DownloadHelper Companion App 1.3.0.rar （亲测可用） Some operations required by Video DownloadHelper cannot be performed form within the browser. In order to be able to still do the job, the add-on relies on an external application that is called transparently. We call it the Companion Application.

2020-01-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人