大数据
Mirza_Zhao
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
PySpark读取MongoDB数据
MongoDB是一个基于分布式文件存储的数据库。旨在为WEB应用提供可扩展的高性能数据存储解决方案。这里最后的2.11是Scala版本,一般不用动,2.4.4是Spark版本,这里需要根据使用的Spark版本修改。在配置spark参数的时候。原创 2023-02-21 10:56:01 · 780 阅读 · 0 评论 -
UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 246-247: ordinal not in range
项目场景:在集群上写pyspark的时候遇到了这个问题问题描述:在进行df.show()操作的时候,由于数据中有中文,所以报错Traceback (most recent call last): File "20210622_1259_test.py", line 13, in <module> df.show(100)……UnicodeEncodeError: 'ascii' codec can't encode characters in position 246-原创 2021-06-22 17:42:30 · 512 阅读 · 0 评论
分享