Batch vs. streaming data processing 批处理和流处理

原文链接 Batch vs. streaming data processing | Redpanda

Batch processing 以固定的间隔处理大量的数据。

        适用于对时间不敏感的任务,如定期备份,每日结束时生成报告。

Streaming processing 从数据流入就开始不间断的处理数据。

        适用于分析来自温度传感器的数据,或分析服务器日志中的可疑活动等。

优缺点

批处理的优点:

        再怎么老的机器都能运行。

        资源利用率高,可以安排在非高峰期(off-peak)运行,比如半夜。 

批处理的缺点:

        等待事件长,洞察力缓慢。数据一旦收集,开始运行可能要数分钟,小时,甚至天才能完成。所以适合对时间不敏感的任务。如备份,日终报告(end-of-day reporting)。

流处理的优点:

        更快的洞察力,可以实时/几乎实时产出结果。

流处理的缺点:

        对于老旧机器运行起来比较吃力。可能需

基于python实现的粒子群的VRP(车辆配送路径规划)问题建模求解+源码+项目文档+算法解析,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 算法设计的关键在于如何向表现较好的个体学习,标准粒子群算法引入惯性因子w、自我认知因子c1、社会认知因子c2分别作为自身、当代最优解历史最优解的权重,指导粒子速度位置的更新,这在求解函数极值问题时比较容易实现,而在VRP问题上,速度位置的更新则难以直接采用加权的方式进行,一个常见的方法是采用基于遗传算法交叉算子的混合型粒子群算法进行求解,这里采用顺序交叉算子,对惯性因子w、自我认知因子c1、社会认知因子c2则以w/(w+c1+c2),c1/(w+c1+c2),c2/(w+c1+c2)的概率接受粒子本身、当前最优解、全局最优解交叉的父代之一(即按概率选择其中一个作为父代,不加权)。 算法设计的关键在于如何向表现较好的个体学习,标准粒子群算法引入惯性因子w、自我认知因子c1、社会认知因子c2分别作为自身、当代最优解历史最优解的权重,指导粒子速度位置的更新,这在求解函数极值问题时比较容易实现,而在VRP问题上,速度位置的更新则难以直接采用加权的方式进行,一个常见的方法是采用基于遗传算法交叉算子的混合型粒子群算法进行求解,这里采用顺序交叉算子,对惯性因子w、自我认知因子c1、社会认知因子c2则以w/(w+c1+c2),c1/(w+c1+c2),c2/(w+c1+c2)的概率接受粒子本身、当前最优解、全局最优解交叉的父代之一(即按概率选择其中一个作为父代,不加权)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值