
python
python
serenysdfg
菜鸟在成长
展开
-
selenium笔记
爬取1:coding=utf-8**from selenium import webdriverbrowser = webdriver.Firefox()browser.get("http://www.baidu.com")#获得浏览器对象后,通过 get()方法,可以向浏览器发送网址browser.find_element_by_id("kw").send_keys("selenium")#元素定位,input的id是kw。关于页面元素的定位后面将会详细的介绍,这里通过 id=kw 定位到百度原创 2020-09-06 11:12:21 · 882 阅读 · 0 评论 -
python相关基础
10*argsand**kwargs用*args和**kwargs只是为了方便并没有强制使用它们.当你不确定你的函数里将要传递多少参数时你可以用*args.例如,它可以传递任意数量的参数:>>> def print_everything(*args): for count, thing in enumerate(args):... print '{0}. {1}'.format(count, thing)...>>>...原创 2020-08-06 18:07:24 · 138 阅读 · 0 评论 -
python的多线程
该Process对象与Thread对象的用法相同,拥有is_alive()、join([timeout])、run()、start()、terminate(),close()等方法frommultiprocessingimportPoolasProcessPoolpool = ProcessPool(8)res = pool.map(process, df_user_te...原创 2020-05-05 17:58:08 · 140 阅读 · 0 评论 -
eval作用-python
处理输入的字符串-将字符串转成相应的对象(如list、tuple、dict和string之间的转换)#相当于直接去掉引号的对象a = "[[1,2], [3,4], [5,6], [7,8], [9,0]]"a = "{1:'xx',2:'yy'}"a = "(1,2,3,4)"b = eval(a)》》[[1, 2], [3, 4], [5, 6], [7, 8], [9, 0]...原创 2020-04-25 19:20:11 · 143 阅读 · 0 评论 -
python的=、copy和deecopy详细区别
1、不可变对象三个的地址都相同2、可变对象:=:地址相同,改变原来的值都会改变新值 deepcopy:地址不相同,改变原来的值都不会改变新值 copy:地址不相同,无复杂子对象:改变原来的值不会改变新值 有复杂子对象,修改“子对象”原来的值新值才会改变总结:1对于简单的对象,例如不可变对象(数值,字符串,元组),用 shallow c...原创 2020-04-22 17:48:36 · 827 阅读 · 0 评论 -
《集体智慧编程》-优化算法
chapter3优化算法随机搜索#随机搜索domain是序列,costf是定义的成本函数def randomoptimize(domain,costf): best=999999999 bestr=None for i in range(0,1000): # 创建一个随机解 r=[float(random.randint(domain[i][0],domain[i...原创 2020-04-08 02:10:06 · 153 阅读 · 0 评论 -
python的collections
Countercollections.Counter('abcs') #计数 可以是字符串,元素,列表等collections.Counter() .clear() /copy() /elements()/get()/ items()/keys()/pop('a')/subtract/update/valuespopitem(随机删一对键值对)most_common(取前面的...原创 2020-03-13 20:13:59 · 93 阅读 · 0 评论 -
爬虫python代码
爬虫基础代码tutorial_basic_DL地址https://morvanzhou.github.io/tutorials/data-manipulation/scraping/1简单基础from urllib.request import urlopen# 中文解码html = urlopen("https://morvanzhou.github.io/static/scrapi...原创 2020-03-06 21:50:52 · 477 阅读 · 0 评论 -
pytorch学习
学习地址中文文档: https://pytorch-cn.readthedocs.io/zh/latest/https://zhuanlan.zhihu.com/p/99318332 (60题PyTorch简易入门指南)https://www.kesci.com/home/project/5e0036722823a10036ae9d1d (深度学习之PyTorch实战-基础学习及搭建环境)...原创 2020-03-06 21:48:14 · 243 阅读 · 0 评论 -
读取分割数据
读取数据并构建序列字典# - 功能:使用自然数对 movies.dat 中的 movieid 进行重编码 返回值:movieid 到编码 id 的字典def movie_map(file='movies.dat'): movies = read_csv(file, sep='::', header=None,engine='python') value = movies[...原创 2020-02-29 23:43:38 · 199 阅读 · 0 评论 -
leetcode常用数据处理
字符串处理x = ''.join(sorted(list(i)))#转换相同的i.lower() for i in astring.count('a') #返回str在string里面出现的次数''.join(s)s=list(s) #数组和list转换变成list、 s[end], s[start] = s[start],s[end]#互换#排序sorted(logs,...原创 2020-02-29 23:09:19 · 216 阅读 · 0 评论 -
python数据读取
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position。。file='movies.dat'with open(file, encoding='ISO-8859-1') as fp: for line in fp: print(line)原创 2020-02-28 22:32:49 · 104 阅读 · 0 评论 -
编程语言输入输出问题
python牛客网输入输出处理https://blog.youkuaiyun.com/qq_21550189/article/details/101112301#input()函数接收两行输入,第一个为整数、第二个为数组 a = int(input()) b = list(map(int,input().split())) #获取一行后变成数组,#进行map()操作后,要用list()才能打印...原创 2020-02-28 11:51:24 · 434 阅读 · 0 评论 -
堆heapq-python
heapq两个函数——nlargest()和nsmallest()>> import heapq>>> nums=[1,8,2,23,7,-4,18,23,42,37,2]>>> print(heapq.nlargest(3,nums))[42, 37, 23]>>> print(heapq.nsmallest(3...原创 2020-02-28 00:45:06 · 173 阅读 · 0 评论 -
python的日期方法
import time#字符类型的时间tss1 = '2013-10-10 23:40:00'#字符转为时间数组timeArray = time.strptime(tss1, "%Y-%m-%d %H:%M:%S")#时间数组:time.struct_time(tm_year=2013, tm_mon=10, tm_mday=10, tm_hour=23, tm_min=40, tm_s...原创 2020-02-23 13:08:33 · 101 阅读 · 0 评论 -
python的class 20191227
关于class 20191227class Box1(): def __init__(self,length1,width1,height1): self.length = length1 self.width = width1 self.height = height1 def volume(self): retu...原创 2019-12-27 16:15:56 · 112 阅读 · 0 评论 -
jupyter lab安装和使用
好处可以同时在一个浏览书签界面打开多个文件,同时进行代码运行。有文件目录1安装conda install -c conda-forge jupyterlabcmd终端输入jupyter lab就可以打开浏览器的界面,若自动跳转到notebook则在端口号后直接写lab即可,如:8891/lab安装扩展目录导航等知乎相关说明链接:https://zhuanla...原创 2019-10-30 20:50:50 · 2513 阅读 · 0 评论 -
python-问题
No module named 'pytorch_transformers'sudo pip installpytorch_transformers 一个安装在pip installpytorch_transformerssudo pip install 与 pip install区别pip install调用的是anaconda安装的pip,可能位于(/root/anac...原创 2019-10-28 11:53:26 · 380 阅读 · 0 评论 -
《python数据分析》
612python数据分析书(2天)第一章系统import osos.getcwd() ##获取当前工作目录os.chdir('F:/Projects/python/616python_data_analysis/3358OS_06_Code/code6')#更改当前工作目录用pkgutil和pydoc可以遍历numpy和scipy的各个子库和简单说明import pkgutil as puimp...转载 2018-06-14 18:28:51 · 2248 阅读 · 0 评论 -
Scikit-Learn模型学习手册
转载自程序猿的数据科学与机器学习实战手册https://github.com/wxyyxc1992/AIDL-Series1Scikit-LearnScikit-learn是开源的Python机器学习库,提供了数据预处理、交叉验证、算法与可视化算法等一系列接口。from sklearn import neighbors,datasets,preprocessingfrom sklearn.mode...转载 2018-06-17 22:15:35 · 403 阅读 · 0 评论 -
《python数据分析与挖掘》-步骤
第3章数据探索(重要)数据质量分析是数据预处理的前提,是数据挖掘分析结论有效性和准确性的基础,其主要任务是检查原始数据中是否存在脏数据,脏数据包括: 缺失值 异常值 不一致的值 重复数据及含有特殊符号(如#、¥、*)的数据本小节将主要对数据中的缺失值、异常值和一致性进行分析。缺失值统计分析统计缺失值的变量个数统计每个变量的未缺失数统计变量的缺失数及缺失率异常值统计分析-箱型...原创 2018-06-19 12:37:41 · 8075 阅读 · 0 评论 -
《python数据挖掘》实战篇
第6章:分类-窃电用户自动识别目标模型构建LM-NET和CART数据划分LM神经网络cart决策树模型评价ROC第7章:聚类-航空公司客户价值分析1RFM模型-传统目标1分析方法与过程-数据预处理2构建kmeans模型(无代码:参考模型章节第8章:关联规则-中医证型挖掘目标:过程(2)属性离散化模型-关联规则有问题-第9章:分类-基于水色图像的水质评价Svm模型第10章 :家用电器用户行为分析与时...原创 2018-06-20 14:29:12 · 5267 阅读 · 0 评论 -
pandas的dataframe
目录构造与获取查看dfDF查看与选择返回数据(转载自https://blog.youkuaiyun.com/xiaodongxiexie/article/details/53108959)数据删除增加填充concat、merge、plot构造与获取查看dfdates = pd.date_range('20160101', periods=6)df = pd.DataFrame(np...原创 2019-05-08 10:48:11 · 216 阅读 · 0 评论 -
python2问题解决:'ascii' codec can't encode characters in position
ascii编码和unicode编码的问题前面加上import sysreload(sys)sys.setdefaultencoding('utf8')python将unicode和str互相转化a.encode('UTF-8') 还是utf编码,但是匹配后还是有问题前面# -*- coding: utf-8 -*-就可以不用转化正则匹配unicode...原创 2019-09-07 15:57:07 · 6376 阅读 · 1 评论 -
python正则表达式
1. 正则表达式基础1.1. 简单介绍正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。如果已经在其他语言里使用转载 2017-06-25 11:13:31 · 437 阅读 · 0 评论