数据分析及特征工程
文章平均质量分 90
影子飞扬
大语言模型应用落地
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python-etl框架bonobo使用入门
python etl框架bonobo的简介和安装使用入门原创 2022-02-23 15:22:02 · 2314 阅读 · 0 评论 -
dask-ml引入机器学习算法错误AttributeError: module 'sklearn.metrics.pairwise' has no attribute '__module__'
学习dask-ml时,遇到下面问题: from dask_ml.cluster import KMeans AttributeError Traceback (most recent call last) ~\Anaconda3\lib\site-packages\dask\utils.py in wrapper(method) 5...原创 2020-04-17 12:02:49 · 3533 阅读 · 0 评论 -
解决dask的dashboard无法显示问题
在jupyter notebook运行dask distribute client,打开dashboard时,无法显示监控内容: from dask.distributed import Client client = Client(n_workers=4) client 打开Dashboard: http://127.0.0.1:8787/status 只显示 后台报错: 问题分析:...原创 2020-04-08 11:27:16 · 1695 阅读 · 1 评论 -
解决dask分布式搭建错误:ValueError: tuple is not allowed for map key
按照 https://blog.youkuaiyun.com/a19990412/article/details/79510219所述步骤完成dask分布式搭建后,在最后一步运行测试程序时,报错: ValueError: tuple is not allowed for map key 官方问题说明:https://github.com/dask/distributed/issues/3491 原因:msgp...原创 2020-04-08 08:53:38 · 1208 阅读 · 0 评论 -
FeatureTools官方文档——Get Start 之用实体集表示数据
原文官网链接:Representing Data with EntitySets 实体集 EntitySets是实体及其之间关系的集合。它们对于为特征工程准备原始的结构化数据集非常有用。尽管Featuretools中的许多函数将实体和关系作为不同的参数,但建议创建一个EntitySet,以便你可以根据需要更轻松地操作数据。 The Raw Data 原始数据 下面我们有两个与客户交易相关的数据表(...翻译 2020-03-20 09:10:43 · 924 阅读 · 0 评论
分享