使用 AlgorithmStar and Spark 实现 词频统计 并进行对比和解读

使用 AlgorithmStar 与 Spark 实现 词频统计,并进行对比

数据分析案例

(AS 算法之星 机器学习库)(Spark 分布式计算 框架)实现 词频 统计 数据分析 的 案例

目录

在这里插入图片描述

AlgorithmStar 实现词频统计

AlgorithmStar 是相较于Spark来说,使用起来比较简单的框架,API非常简洁,推荐使用Java语言调用,下面开始进行一个实现。

优点:非庞大数据量都可以支持,API简单,有预制词频函数,自动识别符号,内存占用非常小
缺点:分布式性能与支持略低于spark

代码

在下面的代码中,每个步骤都进行了注释,同时在结尾处演示了两种打印方法。

package org.example;

import io.github.beardedManZhao.algorithmStar.algorithm.featureExtraction.WordFrequency;
import io.github.beardedManZhao.algorithmStar.core.AlgorithmStar;
import io.github.beardedManZhao.algorithmStar.operands.matrix.ColumnIntegerMatrix;

public class Main {
   
   

    public static void main(String[] args) {
   
   
        // 准备一个句子
        final String data =
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值