
Python
崩坏的芝麻
自然语言处理 软件开发爱好者
展开
-
配置环境变量:4. Python本地安装以及intelliJ IDEA使用Python插件(Windows系统)
前言:目前Python开发基本上都已经使用3.x系列,因而这里安装使用的是3.x系列。 JetBrains家族也有专门的python开发工具,但考虑到intelliJ IDEA功能已经非常好用了,不用专门的去下载其他的编译器。 安装python 选择一: 1. 去python官网下载python 这里是Python官网 点击红框内的download,具体版本可自行选择,这里我以3.7.3为例: ...原创 2019-04-29 12:15:55 · 1966 阅读 · 0 评论 -
Python基本语法重点总结
对于如何安装Python,可以参考此博客 Python本地安装以及intelliJ IDEA使用Python插件 本文主要整理以及筛选易忽略而又重要的一些基础知识,以便日后回顾。 参考教程:菜鸟教程 基本常识 交互式编程 通过 Python 解释器的交互模式来编写代码 脚本式编程 通过脚本参数调用解释器开始执行脚本,直到脚本执行完毕。当脚本执行完成后,解释器不再有效 行和缩进 Python 与...原创 2019-04-30 11:52:21 · 812 阅读 · 1 评论 -
Python包之Pandas介绍
前言:Pandas 是一个开源的软件库。DataFrames和Series是其两个主要数据结构,被广泛用于数据分析。Series 是单维索引数组,而DataFrames 是具有列级和行级索引的表格数据结构。Pandas 是预处理数据集的绝佳工具,可提供高度优化的性能。 1. Pandas基础用法 代码里面有详细的注释和用法示例: 在这里会用到一些NumPy的知识,如果不是很了解NumPy的有关...原创 2019-05-18 22:08:24 · 915 阅读 · 0 评论 -
Python包之SciPy介绍
前言:SciPy 提供了复制的算法及其在 NumPy 中作为函数的用法。这将分配高级命令和多种多样的类来操作和可视化数据。SciPy 将多个小型包整合在一起,每个包都针对单独的科学计算领域。其中的几个子包是linalg(线性代数)、constants(物理和数学常数)和sparse(稀疏矩阵和相关例程) 1. SciPy基础 NumPy包中大多数针对数组的函数也包含在SciPy中。SciPy提...原创 2019-05-18 23:31:04 · 4049 阅读 · 0 评论 -
Python1.1 python pandas读文件时不把第一行作列属性
使用pandas读取数据时: read_csv 如果不指定列名。 第一行会默认为列名,不会读取第一行 想要读取第一行当中的内容可以采用如下格式: data = read_csv(filename,header=None, usecols=[1], engine='python', skipfooter=footer) header 可以指定None 来读取第一行 ...原创 2019-05-19 12:03:14 · 11164 阅读 · 0 评论 -
Python包之NumPy介绍
前言: NumPy 专门用于Python中的科学计算. 它能够高效地操纵含有随机记录的大型多维数组, 并且速度与处理小型多维数组几乎一样快. 它也可以当作通用数据的多维容器. NumPy 具有创建任意类型数组的能力, 这使它适合与通用数据库应用程序连接, 也使其成为以后机器学习使用最有用的库之一. 以下是使用NumPy包的代码. 代码中含有注释, 更易理解 1. NumPy数组的基本操作 # ...原创 2019-05-18 18:11:29 · 1240 阅读 · 0 评论 -
Python使用jieba分词处理语料
Python使用jieba分词处理语料 结巴分词 语料处理 NLP原创 2019-06-13 18:25:20 · 2712 阅读 · 0 评论 -
Python爬虫简单爬取京东商品属性数据
昨天有同学让我帮忙写个简单的爬取京东商品属性的数据,要求很简单,500条商品数据就行。 用的 bs4,和requests,没用框架 import requests from bs4 import BeautifulSoup import csv sku = [] for i in range(1, 10): print(i) res = requests.get('https:/...原创 2019-09-04 11:23:31 · 2108 阅读 · 5 评论