- 博客(5)
- 收藏
- 关注
原创 机器学习中的 K-均值聚类算法及其优缺点
因此,在使用K-均值聚类算法时,需要根据具体的问题选择合适的K值,并注意数据集的特点,以避免算法的缺点对聚类结果的影响。K-均值聚类是一种无监督的机器学习算法,用于将数据集分成K个不同的类别。
2023-11-03 14:00:10
140
原创 使用DataBeam解析json
提示:我这里是使用DataBeam工具进行json解析。DataBeam工具介绍可以参考我的另一篇关于DataBeam介绍的文章http://t.csdnimg.cn/XprcP。**业务需求**1、将采集到的豆瓣电影信息,由文本格式转为json格式。2、解析json数据,提取出“电影名”、“类型”、“主演”、“评分”字段。对于以上需求,本次用到的积木有:“读取文本”、“文本转JSON”、“解析JSON”、“列过滤”、“列重命名”。本次是使用DataBeam对json数据进行解析的相关操作介绍。
2023-11-01 16:25:47
161
原创 推荐一款好用的数据处理工具-DataBeam
以前用Excel处理几十万级别的数据量时,经常卡。后来试用DataBeam发现流畅效率高,推荐大家试试。官网免费版虽然功能少一些,但是基本满足日常工作所需。当然有更多需求的用户推荐使用企业版(付费),功能更强大。DataBeam这款数据处理工具有100多个数据处理模块(积木),可以按照用户需求,将需要的积木拖到工作流进行连接,像搭积木一样,实现用户数据处理需求。更棒的是常用Excel处理几十万数据就可能卡了,用这个工具处理百万、千万级数据都可以。
2023-10-31 17:33:00
676
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人