自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

sour_LI的博客

原创在DataGrip中，sparkSQL分析数据导入mysql

简单讲就是创建临时表或者视图，把需要的字段映射进mysql。中间细节有点忘了，行不通的话，想问的评论或者私信问我，有时间就回。全是代码，cv替换成你们自己的就行。涉及到业务，中间删改了的，可能有点问题，自己看着改把。

2024-01-12 17:06:23 513 1

原创 xslx表格文件采集到hdfs流程&hdfs数据 load到hive表

值得注意的是脚本内容指定了一个json文件，如果后面需要同步其他任务，记得修改相关配置；后端启动hive --service metastore：nohup hive --service metastore > /dev/null 2>&1 &python datax/bin/datax.py json文件路径/job.json。iconv -f gbk -t UTF-8 目标csv文件 > 生成新csv文件。可以查看文件现在的编码格式（编码格式不匹配会导致文件内中文乱码）。），按照需求配置json文件。

2024-01-12 16:51:45 1196 1

原创配置spark on hive，后续可以使用DataGrip连接spark编写sparkSQL

使用DataGrip连接spark编写sparkSQL

2024-01-12 16:39:30 1609 1

原创 DataGrip连接Phoenix 操作spark

首先，打开datagrip，打开File->new->driver。这样你就可以用datagrip连接上phoenix了。然后，创建phoenix连接。进入Advanced。

2024-01-12 16:12:58 802 2

空空如也

canal-同步速度没有达到预期效率

2024-07-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄3年

4
原创

66
点赞

55
收藏

46
粉丝

关注

私信

热门文章

分类专栏

李的随笔 4篇

最新评论

DataGrip连接Phoenix 操作spark
Yangoner: 为什么我这边选择jar包时提示选择不到类
DataGrip连接Phoenix 操作spark
优快云-Ada助手: 恭喜你开始写博客了！标题看起来很有趣，我期待能够看到你分享更多关于DataGrip连接Phoenix和操作spark的内容。或许在下一篇博客中，你可以分享一些具体的操作步骤或者遇到的问题及解决方法，这样能够帮助更多的读者。加油！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
配置spark on hive，后续可以使用DataGrip连接spark编写sparkSQL
优快云-Ada助手: 非常棒的博文！很高兴看到你分享关于配置spark on hive和使用DataGrip连接spark编写sparkSQL的经验。这些技能对于数据分析和处理来说非常重要，而且也是当前行业中热门的技能之一。希望你能继续写下去，分享更多关于数据处理和分析的经验和技巧。另外，除了配置spark on hive和使用DataGrip连接spark编写sparkSQL，你可能还会对spark的数据缓存和数据分区技术感兴趣。这些技能可以帮助你更好地优化数据处理和分析的效率，也许可以在后续的博文中分享一下你的学习心得呢？期待你的更多精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
xslx表格文件采集到hdfs流程&hdfs数据 load到hive表
优快云-Ada助手: 恭喜用户写了第三篇博客！标题看起来很有趣，我对xslx表格文件采集到hdfs流程和hdfs数据load到hive表的过程非常感兴趣。你的博客内容一定会对读者有所启发和帮助。在下一篇博客中，你可以考虑分享一些关于如何优化这个流程的经验和技巧。比如，你可以探讨如何提高xslx表格文件的采集速度，或者如何优化数据从hdfs到hive表的加载过程。这样的话，读者可以更好地应用你的方法来提高他们自己的工作效率。希望你能继续保持创作的热情，期待阅读你的下一篇博客！加油！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
在DataGrip中，sparkSQL分析数据导入mysql
优快云-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/mysql?utm_source=AI_act_mysql

提示

确定要删除当前文章？

取消删除