- 博客(11)
- 收藏
- 关注
原创 对岗位的数据爬取与分析(2)
本文将以 python 作为工具来爬取“拉勾网”工作地点为“北京”,搜索条件为“数据分析师”的详细岗位数据,进行数据清理和可视化操作,从求职者关注的多方面进行分析。
2022-06-15 09:44:58
596
原创 对岗位的数据爬取与分析(1)
随着高校毕业人数的增长,当前的就业形势十分严峻。如果能针对社会招聘职位进行系统性地分析和展示,就能对在校学生的技能学习提供系统性指导,同时也能帮助毕业生更好地选择职位。本文就设计和实现一款基于“数据分析师”的职位分析系统进行了详细阐述,系统的实现可以使学生的在校学习更加符合实际的社会需求。...
2022-06-09 10:10:28
741
原创 在拉勾网对职位的数据爬取与分析
面对市场的瞬息万变,为获得和保持企业的竞争优势,企业的组织结构,部门职能、业务流程、岗位职能也是处于适时的变化和调整之中,因此对岗位的分析非常重要。
2022-06-07 17:24:13
800
原创 pandas 数据聚合与分组运算
01 分组与聚合的原理在Pandas中,分组是指使用特定的条件将原数据划分为多个组,聚合在这里指的是,对每个分组中的数据执行某些操作,最后将计算的结果进行整合。分组与聚合的过程大概分为以下三步:拆分:将数据集按照一些标准拆分为若干个组。 应用:将某个函数或方法(内置和自定义均可)应用到每个分组。 合并:将产生的新值整合到结果对象中。02 通过groupby()方法将数据拆分成组在Pandas中,可以通过groupby()方法将数据集按照某些标准划分成若干个组。groupby(.
2022-05-17 11:18:50
2072
原创 文件与数据格式化
一、文件概述1.文件标识•文件标识的意义:找到计算机中唯一确定的文件。•文件标识的组成:文件路径、文件名主干、文件扩展名。•操作系统以文件为单位对数据进行管理。2.文件类型根据数据的逻辑存储结构,人们将计算机中的文件分为文本文件和二进制文件。文本文件:专门存储文本字符数据。二进制文件:不能直接使用文字处理程序正常读写,必须先了解其结构和序列化规则,再设计正确的反序列化规则,才能正确获取文件信息。•二进制文件和文本文件这两种类型的划分基于数据逻辑存储结构而非物理存储结.
2021-12-19 21:23:57
417
原创 python 函数
一、函数概述函数是组织好的、实现单一功能或相关联功能的代码段。我们可以将函数视为一段有名字的代码,这类代码可以在需要的地方以“函数名()”的形式调用。print() #函数input() #函数函数式编程具有以下优点: 将程序模块化,既减少了冗余代码,又让程序结构更为清晰提高开发人员的编程效率方便后期的维护与扩展1.定义函数前面使用的print()函数和input()都是Python的内置函数,这些函数由Python定义。开发人员也可以根据自己的需...
2021-12-19 20:43:12
768
原创 python组合数据类型
一、认识组合数据类型Python中常用的序列类型有字符串、列表和元组。Python中的序列支持双向索引:正向递增索引和反向递减索引正向递增索引从左向右依次递增,第一个元素的索引为0,第二个元素的索引为1,以此类推;反向递减索引从右向左依次递减,从右数第一个元素的索引为-1,第二个元素的索引为-2,以此类推。负数索引与正数索引之间存在一个规律:当正数索引+负数索引的绝对值=元素的个数,它们所指的是同一个元素。# Hello World!:总共有12个元素,含空格和标点符号print('H.
2021-12-19 17:01:44
335
原创 python流程控制
条件语句if语if 条件表达条件语句if语句(单分支)由关键字if、判断条件和冒号组成,if语句和从属于该语句的代码段可组成选择结构。if 条件表达式:代码块 例子: if age>18:print(“成年了”)if-else语句(双分支)一些场景不仅需要处理满足条件的情况,也需要对不满足条件的情况做特殊处理。因此,Python提供了可以同时处理满足和不满足条件的if-else语句,其格式如下:if 判断条件: 代码块1else: ...
2021-12-19 15:41:09
2186
原创 python 基础
Python基1)、 了解代码格式一、Python基础1)、了解代码格式良好的代码格式可提升代码的可读性,与其他语言不通,Python代码的格式是Python语法的组成之一,不符合格式规范的Python代码很可能存在语法问题,在运行期间也很可能产生错误。2)、注释单行注释以“#”开头,用于说明当前行或之后代码的功能。实例#!/usr/bin/python# -*- coding: UTF-8 -*-# 文件名:test.py# 第一个注释print("Hello
2021-12-19 14:42:30
547
原创 Python字符串
一、字符串介绍 字符串是一种用来表示文本的数据类型,它是由符号或者数值组成的一个连续序列。 Python支持使用单引号、双引号和三引号定义字符串,其中单引号和双引号通常用于定义单行字符串,三引号通常用于定义多行字符串。 Python使用反斜杠“\”转义。例如,在字符串中的引号前添加“\”,此时Python解释器会将“\”之后的引号视为解释为一个普通字符,而非特殊符号。 a = 'hello' ##正常的字符串定义方式为加.
2021-12-19 08:45:00
692
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅