- 博客(8)
- 收藏
- 关注
原创 python爬虫---get请求引用bs4库的基本模板
Beautiful Soup 简称 BS4(其中 4 表示版本号)是一个 Python 第三方库,它可以从 HTML 或 XML 文档中快速地提取指定的数据。Beautiful Soup 语法简单,使用方便,并且容易理解,因此您可以快速地学习并掌握它。本节我们讲解 BS4 的基本语法。
2022-11-29 09:05:45
625
原创 python-时间格式转换
Python 提供了一个 time 和 calendar 模块可以用于格式化日期和时间。 时间间隔是以秒为单位的浮点小数。 每个时间戳都以自从1970年1月1日午夜(历元)经过了多长时间来表示。 Python 的 time 模块下有很多函数可以转换常见日期格式。 如函数time.time ()用于获取当前时间戳, 如下实例: 时间戳单位最适于做日期运算。...
2022-08-11 09:30:02
1226
转载 大数据项目实战之数据采集
在大数据的时代背景下,未被使用的信息比例高达99.4%,原因很大程度都是由于高价值的信息无法获取采集,因此,如何从大数据中采集出有用的信息已经是大数据发展的关键因素之一,数据采集可视为大数据产业的基石。
2022-06-01 22:02:14
1371
原创 scala开发环境准备工作
scala语言可与在Windows,linux,mac,os等系统上编译运行。由于Scala是运行在JVM平台上的,所以安装Scala之前必须配置好jdk环境(jdk版本要求不低于1.5,小编这里推荐jdk1.8)
2022-04-25 19:05:17
499
原创 Hadoop在Windows实现简单的MapReduce实例过程前的IDEA的安装与配置
MapReduce 是Hadoop系统的核心组件之一,它是一种可用于大数据并行处理的计算模型、框架和平台,主要解决海量数据的分析计算,是目前分布是计算模型中应用较为广泛的一种,本篇文章记录了在进行Hadoop在Windows实现简单的MapReduce实例过程之前的准备工作。
2021-11-27 16:35:08
512
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人