- 博客(29)
- 收藏
- 关注
转载 远程连接工具finalshell的安装使用
链接:https://pan.baidu.com/s/1FcyWEMCkkAxMUybFapOhAA?--来自百度网盘超级会员V3的分享。
2024-03-04 16:04:27
234
原创 电脑无法开启虚拟化
如果出现以下错误,需要进入bios界面,不同电脑进入界面的方式不一样。1、关机后,按住开机键和f10,进入如下界面(语言在主菜单里面)2、选择先进和下面的系统选项,勾选VTx和VTd。3、按f10保存重启。
2024-03-04 14:39:21
978
原创 猎冰超前点播--大结局
链接:https://pan.baidu.com/s/1cHPiioQsQluWQQtP5CC_aA?pwd=yyds提取码:yyds--来自百度网盘超级会员V3的分享。
2024-03-01 23:02:08
1218
原创 内网穿透--netapp的使用
内网穿透是一种可以让外部网络与内部网络建立连接的技术,它可以帮助我们在外部网络上访问内部网络资源,也可以让内部网络中的服务在外部网络上运行。
2024-01-02 09:53:41
836
原创 数仓可视化5--superset的部署安装
Apache Superset 是一个现代的数据探索和可视化平台。它功能强大且十分易用,可对接各种数据源,包括很多现代的引擎,拥有丰富的图表展示形式,并且支持自定义仪表盘。
2024-01-02 09:28:11
1002
原创 数仓可视化2--数仓分层
action行为种类:INSTALL("01", "install","安装"),LAUNCH("02", "launch","启动"),LOGIN("03", "login","登录"),REGISTER("04", "register","注册"),INTERACTIVE("05", "interactive","交互行为"),EXIT("06", "exit","退出"),PAGE_ENTER_H5("07", "page_enter_h5","网页页面进入"),
2023-12-28 10:43:07
483
原创 电商数仓可视化1--数据导入
1、业务数据业务数据往往产生于事务型过程处理,所以一般存储在关系型数据库中,如mysql、oracle业务数据源:用户基本信息、商品分类信息、商品信息、店铺信息、订单数据、订单支付信息、活动信息、物流信息等2、埋点数据埋点日志相对业务数据是用于数据分析、挖掘需求,一般以日志形式存储于日志文件中,随后通过采集落地分布式存储介质中如hdfs、hbase用户行为日志:用户浏览、用户点评、用户关注、用户搜索、用户投诉、用户咨询3、外部数据。
2023-12-27 10:32:01
1102
原创 python--爬虫图片练习--(斗鱼颜值主播)
本篇主要对爬虫图片进行练习,需要用到requests库,用于从给定的斗鱼直播平台中获取图片数据,并将这些图片保存到本地目录的directory中。
2023-12-25 21:49:00
414
原创 python--爬虫文本练习--(豆瓣影评TOP250)
ps:在命令行或者pycharm中的终端进行安装pip install beautifulsoup4 #用于解析HTML和XML文档,帮助您从网页中提取所需的数据。pip install xlwt # 用于创建和操作Excel文件。
2023-12-25 21:33:20
521
原创 数据迁移工具之datax的安装
DataX是阿里巴巴开源的一个异构数据源离线同步工具,可以实现包括关系型数据库(如MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。它致力于解决数据孤岛问题,帮助企业更好地管理和利用数据资产。
2023-12-21 15:27:36
1058
原创 监控组件Prometheus的安装
创建目录,存放Prometheus 拉取过来的数据,我们这里选择local storage。# 至此Prometheus就可以正常工作了。# 创建目录,放置Prometheus。# 启动Prometheus。
2023-12-04 11:22:25
447
1
原创 任务调度器-azkaban
Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。Azkaban是一个开源的数据管道和任务调度系统,用于协调和管理大规模数据处理任务,通常用于处理大规模数据处理任务、数据管道和工作流程。
2023-11-05 10:00:21
309
原创 linux中hadoop伪分布搭建
hadoop的核心配置文件在/opt/hadoop/etc/hadoop下,主要修改core-site.xml 、hdfs-site.xml、mapred-site.xml(由mapred-site.xml.template拷贝而来)、yarn-site.xml、slaves五个文件。在正方形内随机撒点,分布于1/4圆内的数量假设为a ,分布于圆外的数量为b,N则是所产生的总数:N=a+b。b、伪分布式 -----只是模拟hadoop集群,会有不同守护进程,这些进程只保留在一台节点。
2023-09-06 22:18:48
2614
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人