
python
leo_weile
这个作者很懒,什么都没留下…
展开
-
词表匹配工具FlashText
1、安装pip install flashtext2、使用示例提取文本中字典涉及的关键词并将多个词归一化为某个关键词from flashtext import KeywordProcessorkeyword_processor = KeywordProcessor()# keyword_processor.add_keyword(<unclean name>, <standardised name>)keyword_processor.add_keyword原创 2021-08-06 11:43:15 · 899 阅读 · 0 评论 -
pandas多列筛选
df = pd.DataFrame(np.array(([1, 2, 3], [4, 5, 6], [2, 3, 6])),columns=['one', 'two', 'three'])df执行筛选条件:one列 > 1 and three列 > 2df_filter = df[(df['one'] >1) & (df['three'] > 2)]df_filter注意:每个筛选条件需要使用括号限制,and并列条件使用 &,or并列条..原创 2021-07-23 12:47:19 · 4109 阅读 · 1 评论 -
python json操作
python操作json数据可以使用json包json包包含四个函数,load,dump,loads,dumps,四个函数作用如下:load:将json数据从文件中读入内存,json数据以字典数据类型存储dump:将字典数据类型转换为json数据格式,并将json数据写入文件中load和dump主要是涉及到json数据的文件操作dumps:将字典类型转换为json数据...原创 2019-12-26 10:35:30 · 215 阅读 · 0 评论 -
jupyter notebook设置一个执行单元多个输出
问题描述日常我们在使用jupyter时,默认最后一个变量输出,前面的变量没有任何输出,情况下图所示,我们可以通过简单设置来解决这个问题。解决方法通过加入这两行命令,即可设置多个输出。from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity...原创 2019-12-08 13:28:56 · 3067 阅读 · 2 评论 -
jupyer notebook使用argparse报错问题解决方法
问题描述如下代码使用在使用命令行启动时不会出现问题,但是在jupyter notebook执行会出现报错,如图所示import argparseparser = argparse.ArgumentParser(description='PyTorch implementation of Deep GCN')# baseparser.add_argument('--phase', ...原创 2019-12-02 10:58:17 · 1964 阅读 · 4 评论 -
python解决实时写入文件问题
问题描述Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。在程序未执行到bug时,不会报错。所以在文件写入过程中,如果没有实时写入,可能导致出错前执行的待写入文件的在缓存中未及时写入文件而导致文件丢失。比如下面这段程序:fout = open("test.log","w+")for i in range(10): fout.write(str(i...原创 2019-12-02 10:49:48 · 5548 阅读 · 2 评论 -
python 解一元一次方程组
def solve(equation,var='X'): equation = equation.replace("=","-(")+")" result = eval(equation,{var:1j}) return -result.real/result.imagprint(solve("2*X=6"))原创 2019-08-26 09:44:12 · 3359 阅读 · 0 评论 -
python 异常处理常用方式
import sysimport timeimport jsonimport osimport tracebackif __name__ == "__main__": try: for line in sys.stdin: line = line.strip('\n').split('\t') pass ...原创 2019-08-01 15:54:24 · 294 阅读 · 0 评论 -
pandas求一列中多行的最值、平均值等操作
需求:当我们处理一行数据时,要求这一行中不同列的最值、最大值、最小值、均值等数据。如例: name Chinese Math English PE tom 88 87 89 90 tony 98 97 99 90 leo 67 78 89 91 bob 90 89...原创 2018-11-19 15:45:11 · 42068 阅读 · 0 评论 -
pandas将datafram中某列按照条件赋值方法,求每行最大值、均值、和方法
1、批量修改datafram中某一列在数据处理过程中,经常会出现对某列批量做某些操作,比如dataframe df要对列名为“values”做大于等于30设置为1,小于30设置为0操作,可以这样使用dataframe的apply函数来实现,具体实现代码如下:def fun(x): if x >= 30: return 1 else: ...原创 2018-06-26 17:09:54 · 37843 阅读 · 6 评论 -
PipeMapRed.waitOutputThreads(): subprocess failed with code X 报错的解决方法
使用python写MapReduce程序在执行过程中出现了如下报错,几乎全部是由python脚本的问题造成的。遇到这种情况,解决方法可能会有很多,我提供一种自己一直使用的方法。具体方法:通过拉取MapReduce程序的执行日志,拖取日志的命令是:yarn logs -applicationId application_1519803790630_21764 > excuse.log...原创 2018-04-02 18:15:30 · 2292 阅读 · 0 评论