- 博客(39)
- 收藏
- 关注
原创 selenium实现UI自动化
selenium是支持web浏览器自动化的一系列工具和库的综合项目。具有支持linux、windows等多个平台,支持Firefox、chrome等多种主流浏览器;支持Java、Python等多种语言。
2024-01-02 19:14:05
721
原创 python中Re正则表达式使用
1.提取特殊符号中的文字,如:提取【】中内容2.提取字符串中random_xxx()函数3.#提取$.开头的字符串
2023-09-11 18:51:07
263
原创 DrissionPage学习(一)
下载地址:http://chromedriver.storage.googleapis.com/index.html。2.确定版本后在下载chrome对应的chromedriver.exe。解决办法如下:终端输入命令查找被占用端口的进程号。kill该进程:sudo kill 15500。4.验证chromedriver是否安装成功。方法二:查看chrome版本信息。1.查找chrome浏览的版本。1.执行时报端口号被占用。
2023-05-21 20:18:23
3247
原创 四、在pycharm中添加.gitignore文件的语法使用详解
背景: 在一些项目中我并不希望本地仓库的所有文件都上传到远程仓库,而是有选择的上传,因此git引入了.gitignore文件,使用该文件来选择性的上传文件。
2022-11-13 21:57:21
1073
原创 三、在pycharm上创建虚拟环境,并下载requirement.txt依赖包
在本地并行多个项目的时候,每个项目依赖的包区别很大,如果只有一个环境所有的依赖都下载到一个环境中,别人只需要一个项目,最后你给别人提供的requirement.txt文件中也有很多无用的依赖包,为了便于管理以及方便他人使用,建议为自己的项目创建独立的环境,最后项目导出的requirement.txt文件也是小清新的哟。进入项目-> 点击pycharm-> preferences ->python interpreter-> virtualenv environment ->add interpreter。
2022-11-13 20:32:14
6077
原创 一、python中如果某个目录不存在,如何创建一个目录
os.mkdir(path) #创建的路径中的最后一层目录,如果之前的目录不存,直接创建的话会报错。os.makedirs(path) #创建多层目录,如果中间的目录不存在的话,可以直接创建。
2022-11-13 19:41:59
4058
原创 常见的linux命令
rpm是redhat公司随redhatlinux推出的一个软件包管理器,通过它能够更加轻松地实现软件的安装。退出为:先esc ,然后:wq(保存并退出)h:安装时输出哈希标记(‘#’)
2022-10-29 15:19:13
754
原创 Mac上安装mysql及密码重置
此时MySQL服务重新启动,我们重新打开一个终端(快捷键 command + N)homebrew安装命令:brew install mysql。①输入 mysql -uroot -p 回车。②输入刚才重置的新密码。③进去了,密码重置成功。
2022-10-07 21:07:50
1514
原创 pytest使用详解
pytest是一个python的单元测试框架,也称为用例框架。作用:1)发现测试用例。从多个py文件中按照一定的规则找到测试young2)执行测试用例3)判断测试结果,运用python断言4)生成测试报告,可以使用allure、pytest-html、pytest-testreport。
2022-10-07 15:42:31
22208
原创 python中的线程和进程
Python\Python37\Lib),发现当前其仅内置了一个futures子模块,而futures子模块中,则有3个重要的.py文件,其中_base.py是最主要的模块,提供了大部分并发功能,但属于私有模块,不能被其他程序直接import,另外两个则是process和thread模块,即多进程和多线程,二者均调用_base实现主要并发接口函数。并发:concurrency,在某个特定的时刻,只允许一条指令执行,只不过线程/任务之间会相互切换,使得宏观上几乎是支持多进程的并发执行。
2022-10-06 11:40:39
226
原创 什么是单元测试?
单元测试是指对软件中的最小可测单元在与其他程序其他部分相隔离的情况进行检查和验证的工作,这里的最小可测单元指的是类或者函数。单元测试一般是由开发工程师完成的。
2022-09-04 22:21:31
3927
1
原创 python使用常见问题二
datetime模块是python自带对时间的操纵,它有4个大类分别是date、datetime、time、timedelta(python中也有time,datetime中也包含time类,datetime模块是对time模块进行了更高一级的封装)a.如何将一个“2022/07/28”加2天,并转换为“2022-07-30”这种字符串。.........
2022-07-30 17:56:19
209
原创 网络知识常见问题
1. 什么是tcp/ip协议?Tcp/ip协议是一个协议簇,是一系列协议的总称,其中最核心的就是ip协议和tcp协议,tcp/ip协议包括:ip、tcp、icmp(internet控制报文协议)、udp(用户数据报协议)、arp等,他们共同构成了一个复杂但是有层次的协议栈。Tcp/ip一共有四层,从上到下分别为:应用层、传输层、网络层、链接层。IP协议:Internet Protocol的缩写,主要用于解决寻址和路由问题Tcp协议:“Transmission Control P ro to co l”
2021-02-03 22:36:43
347
1
原创 mysql常见问题
一、 mysql引擎分为mysiam和Inodb,他们区别1.mysiam只支持表级锁,不支持行级锁;Inoodb支持表级锁和行级锁,默认用的是行级锁;2.Inoodb支持事物,但是他也给Inoodb带来了更大的开销3.mysiam上锁和提交是一步执行的,Inoodb的上锁为提交可以分开执行,分为两步走4.InooDB在查询是没有用到索引时,走的是表级别的锁,用到索引走行级别的锁5.INoodb必须要密集索引二、Innodb和mysiam适合的场景1.MyIsam适合的场景:频繁执行全表co
2021-02-03 22:29:40
324
原创 linux常见问题
1. 请问Linux在两台机器之间传递的方法1)scp传输:速度慢,但是ssh通道保证了传输的安全性本地文件传输到远程:scp -r localfile root@1.10.10.11:remote_file远程文件传输到本地:scp -r root@ip:文件名 本地路径2)rsync差异化传输(支持断点续传,数据同步)rsync是linux下的文件同步和数据传输工具3)管道传输(降低IO开销)4)nc传输5)建立文件服务器2. Linux系统Linux系统一般有四个主要的部分:内核、
2021-02-03 22:17:57
176
原创 Jmeter连接mysql数据库
1.函数生成器需要用到函数助手功能,可以调用函数生成一些有规则的数据。常用的几个函数有_uuid、_random、_time。_uuid会生成一个随机唯一的id,比如在避免java请求重发造成未处理数据太多的情况,接口请求可加一个唯一的请求id唯一的响应id进行一一对应;随机数_random,可以在你指定的一个范围里取随机值;取当前时间_time,一些时间类的入参可以使用,如{__time(,)} 是生成精确到毫秒的时间戳、{__time(/1000,)}是生成精确到秒的时间戳、${__time(yyyy
2020-11-22 13:08:37
2131
1
原创 通过jmeter实现login接口获取token及使用
背景: 从login(登陆)接口获取token后,将token设置为全局变量放过到http信息管理头中,后续接口直接使用整体设计结构:1. jmeter中token的获取:使用“正则表达式提取器”从login接口返回的信息头中获取token信息1)login接口返回信息头如下:2)正则表达式提取器配置如下:注:正则表达式提取器的参数引用名称:变量名正则表达式:():括起来的部分就是要提取的。.:匹配任何字符串。+:一次或多次。?:不要太贪婪,在找到第一个匹配项后停止。
2020-11-22 13:07:41
3176
原创 python中queue和线程学习
1. 背景:最近学习工作中时长需要跑上千或者上万条数,如果单线程跑万上万条数据耗费时间会比较长,所以想通过多线程并行跑完成import requestsimport osfrom queue import Queue,LifoQueue,PriorityQueueimport threadingimport timeclass VideoModel:def get_emotion(self,filename): ''' 调用接口,情绪模型接口
2020-11-22 12:01:17
186
原创 python基础知识点
一、Python命名规范1.项目名称首字母大写+大写式驼峰,ProjectName2.模块名和包名全部小写+下划线驼峰module_name package_name3.类名称,异常首字母大写+大写式驼峰,class ClassName: ,ExceptionName4.全局变量、常量全部使用大写字母+下划线驼峰GLOBAL_VAR_NAME,CONSTANT_NAME5.方法名,函数名,其余变量,参数,实例全部小写+下划线驼峰method_name,function_n
2020-11-12 21:23:33
105
原创 接口测试中使用json串对比
背景:在接口测试中,一般返回都是json字符串,同一个接口随着开发代码的改动或者相关业务需求的变更,需要反复测试多次,但使用的case都是一样的,反复的人工比对效率低下还容易出错,于是想着如果能实现两个json字符串的自动比对的话,岂不是可以解放很多的人工比对工作,哈哈哈哈哈------于是乎,想做一个懒人的自己终于开始了实现json比对函数编写的开始,废话不多数,上代码:def compare_one(src_data,dst_data,flag): flag=flag #print("------
2020-11-12 21:14:09
449
1
原创 Linux常用命令集合
Linux常用命令集合通过请求端口查看日志查看该端口对应的进程号:netstat -antlp|grep 8989查看当前pid进程启动的工作目录pwdx pid参考文件:https://www.cnblogs.com/yangxd1994/p/12068679.htmlhttps://blog.youkuaiyun.com/u010739551/article/details/80736032...
2020-11-02 18:50:12
102
原创 python中requests请求详解
一、GET请求requests.get(url,params=None,**kwargs)url:拟获取页面的url链接params:url中的额外参数,字典或者字节流格式,可选**kwargs:12个可控制访问的参数import requests#不带参数的get请求requests.get('http://www.baidu.com')#带参数的get请求方式一requests.get('http://www.baidu.com/s?cl=3&baidutop10&
2020-10-28 20:32:22
1875
原创 pandas处理数据方法整合
1.如何将一个表中的role字段取值“客户”和“坐席”处理为0和1data['role']=data['role'].apply(lambda x:1 if x =='客户' else 0)2.对表中数据进行行处理的方法,如提取每句话中的关键词使用apply方法对每一行数据进行处理data['keywords']=data.apply(lambda x :get_keyword(x['role'],x['content']),axis=1)3.去除一段话中的所有标点符号data["label
2020-10-24 22:33:22
379
原创 pycharm+python使用中的相关问题一
1.pycharm中自动b添加作者、日期和时间在pycharm中操作如下:File-》Settings-》Editor-》File and Code Templates->Python Script# -*- coding:utf-8 -*-# author_='ting.chun'# date:${DATE} ${TIME}2.PyCharm中遇到TabError: inconsistent use of tabs and spaces in indentation时怎么办?方法一
2020-10-24 14:29:12
1209
原创 python+pytest接口自动化框架搭建
一、Pycharm中创建项目结构1.新建一个工程testProject2.在工程的根目录下新建一个conftest.py(测试用例的一些fixture配置)和pytest.ini(改变pytest的运行方式)3.在工程下创建以下package包和文件夹common:这个包放一些公共的方法,如:读取excel文件方法,读取mysql、oracle的脚本config:放一些配置文件,如邮箱的一些参数:收件人,发件人,密码等logs:这里存放日志信息report:这里存放测试报告test_ca
2020-10-24 14:14:23
6171
6
原创 基于Levenshtein计算asr准确率
ASR常用测试指标字正确率、字准确率、字错率、句错率等方法一:基于Levenshtein原理统计方法二:基于“最小代价匹配”原则运用动态规划算法设正确文本字数为 N,识别结果文本字数为 M,按照识别结果文本与正确文本根据“最小代价匹配(Levenshtein)”原则运用动态规划算法,得到正确识别字数 Mc、删除错误字数 D、插入错误字数 I, 和替换错误字数 S,则有:N=Mc+S+DM=Mc+S+I定义以下性能指标:1.句错率(SER)句错误率:Sentence Error Rate
2020-10-18 00:11:07
2415
1
原创 Jmeter的环境初始化
准备:下载jmeter安装包(官网下载:http://jmeter.apache.org/)jdk环境:https://www.cnblogs.com/feihan/p/11876154.html操作步骤:1、查看java版本是否为1.8,使用java –version2、在/user/local目录下创建jmeter文件夹unzip apache-jmeter-5.0.zip配置环境变量:Vim /etc/profile(编辑文件)按i编辑模式,在底部增加export JMETER_
2020-10-13 21:20:48
529
原创 tensorflow小白(二)
tensorlow 使用遇到的问题当执行代码报错“TypeError: Tensor objects are only iterable when eager execution is enabled. To iterate over this tensor use tf.map_fn.”解决如下:重启IPython console在import tensorflow as tf后加上:import tensorflow as tftf.enable_eager_execution()
2020-10-13 21:05:46
879
原创 基于ML的中文短文本聚类
基于ML的中文短文本聚类整个过程分为以下几个步骤:语料加载分词去停用词抽取词向量特征实战tf-idf的中文文本K-means聚类实战word2Vec的中文文本k-means聚类一、引入,python 依赖包,并加载语料import randomimport jiebaimport pandas as pdimport numpy as npfrom sklearn.feature_extraction.text import TfidfTransformerfrom skle
2020-07-07 21:18:51
1153
原创 python易错点笔记
python易错点笔记如何用pandas读取txt文件data=pd.read_table(r'./data/N8AD5Sr3I7dWU274.txt',sep='-',header=None,index_col=0)#header=None:表示文件中无表头#index_col=0:将第一列作为索引pandas中dataframe的列重命名 df.columns=['列1','列2'] df.rename(columns={'name':'人数',age:'年龄'})plt.
2020-07-03 11:52:23
576
原创 小白tensorflow学习(一)
易错点1.pd.get_dummies()one-hot encoding思想:将离散型特征的每一种取值都看成一种状态,若你的这一特征中有N个不相同的取值,那么我们就可以将该特征抽象成N种不同的状态,one-hot编码保证了每一个取值只会使得一种状态处于“激活态”,也就是说这N种状态中只有一个状态位值为1,其他状态位都是0。举例如下: pd.get_dummies([1,2,3])out:1 2 30 1 0 01 0 1 02 0 0 1...
2020-07-03 10:26:29
150
原创 NLP关键词提取(一)
NLP关键词提取(一)jieba分词将csv文件的数据按照一定规则放入dataframe中提取role、key_word、end_time、begin_time列值import jiebaimport pandas as pdimport redata=pd.read_csv(r'/Users/atsushi/Desktop/python/data_analysis/data/data.csv',encoding='gbk',header=None)#header=None,表示读取数据无表头#
2020-07-02 23:53:13
707
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人