数据挖掘之聚类分析_Web Service接口

最新推荐文章于 2022-07-27 17:50:44 发布

weixin_30813225

最新推荐文章于 2022-07-27 17:50:44 发布

阅读量160

点赞数

CC 4.0 BY-SA版权

文章标签：人工智能

原文链接：http://www.cnblogs.com/cloudtj/articles/7417633.html

本文介绍了数据挖掘中聚类分析的WebService接口，包括层次聚类、K-Means聚类和密度聚类三种方法的API使用，提供了详细的接口参数说明和示例。

API概念

API（Application Programming Interface,应用程序编程接口）是一些预先定义的函数，目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力，而又无需访问源码，或理解内部工作机制的细节。

应用程序接口（API：application programming interface）是一组定义、程序及协议的集合，通过 API 接口实现计算机软件之间的相互通信。API 的一个主要功能是提供通用功能集。程序员通过使用 API 函数开发应用程序，从而可以避免编写无用程序，以减轻编程任务。

本文章主要介绍数据挖掘之聚类分析的Web Service接口，详细描述层次聚类、K-Means聚类和密度聚类三种常用的聚类分析方法的API使用方法。

目录概览

1.接口参数说明
2.聚类方法API接口

1.接口参数说明

API接口域名网址:

    http://api.galaxystatistics.com

端口号:

    8882        # 不同的接口，会使用不同的端口号

我相信程序员都是有节操的，不会恶意使用这个Key！

    公共测试 ApiKey(token=xxxxxx): 098f6bcd4621d373cade4e832627b4f6

数据类型:

    type=11     # 不同聚类方法的api接口，采用不同的type值【如：11、12、13】

输出变量名:

    var_name=hclustMethod       # 根据程序需求，自定义变量名称【如：hclustMethod、kmeansMethod、dbscanMethod】

模型方法参数：

data_str                    # 数据字符串
dist_method                 # 相似性计算
hclust_method               # 类与类之间的距离
k                             # 聚类数
oEps                        # 邻域半径[eps]
oMinPts                     # 判断核心点阈值[MinPts]

模型方法参数举例：

# 数据字符串
data_str = "67,63,73,75,44,91|74,69,66,94,81,55|76,93,93,79,71,27|65,38,85,85,61,45|80,39,48,75,41,52|72,80,70,88,86,43|60,50,91,95,42,64|77,49,69,50,89,55|65,89,50,70,99,85|78,41,55,89,71,28"                    

# 相似性计算
dist_method = "euclidean"
c("欧氏距离"="euclidean", "曼哈顿距离"="manhattan", "切比雪夫距离"="maximum",  "闵可夫斯基距离"="minkowski", "兰式距离"="canberra")

# 类与类之间的距离
hclust_method = "single"            
c("最短距离法"="single", "最长距离法"="complete", "中间距离法"="median", "相似法"="mcquitty", "类平均法"="average", "重心法"="centroid", "离差平方和法"="ward.D2")

# 聚类数
k = 3                           

# 邻域半径[eps]
oEps = 0.2                          

# 判断核心点阈值[MinPts]
oMinPts = 3

2.聚类方法API接口

（2.1）层次聚类

URL：http://api.galaxystatistics.com:8882/?token=098f6bcd4621d373cade4e832627b4f6&type=11&var_name=hclustMethod&data_str=67,63,73,75,44,91|74,69,66,94,81,55|76,93,93,79,71,27|65,38,85,85,61,45|80,39,48,75,41,52|72,80,70,88,86,43|60,50,91,95,42,64|77,49,69,50,89,55|65,89,50,70,99,85|78,41,55,89,71,28&dist_method=euclidean&hclust_method=single&k=3

（2.2） K-Means聚类

URL：http://api.galaxystatistics.com:8882/?token=098f6bcd4621d373cade4e832627b4f6&type=12&var_name=kmeansMethod&data_str=67,63,73,75,44,91|74,69,66,94,81,55|76,93,93,79,71,27|65,38,85,85,61,45|80,39,48,75,41,52|72,80,70,88,86,43|60,50,91,95,42,64|77,49,69,50,89,55|65,89,50,70,99,85|78,41,55,89,71,28&k=3

（2.3）密度聚类

URL：http://api.galaxystatistics.com:8882/?token=098f6bcd4621d373cade4e832627b4f6&type=13&var_name=dbscanMethod&data_str=67,63,73,75,44,91|74,69,66,94,81,55|76,93,93,79,71,27|65,38,85,85,61,45|80,39,48,75,41,52|72,80,70,88,86,43|60,50,91,95,42,64|77,49,69,50,89,55|65,89,50,70,99,85|78,41,55,89,71,28&oEps=0.2&oMinPts=3

转载于:https://www.cnblogs.com/cloudtj/articles/7417633.html