- 博客(13)
- 收藏
- 关注
原创 斗破苍穹新词发现
对于一个特定的领域而言,我们可能需要其相关的一些词语,这些词语可以用来进行分词、关键词提取、主题分析等。那么,如何去获得这些词语呢?本文接下来将通过斗破苍穹小说来介绍新词发现。......
2022-08-10 22:47:00
230
4
原创 【标注工具doccano导出数据为空的解决办法】
地址:https://github.com/taishan1994/doccano_exportdoccano_export使用doccano标注工具同时导出实体和关系数据为空的解决办法。doccano版本:1.6.2。标注平台地址:https://github.com/doccano/doccano安装其实安装挺简单的:pip install doccano# Initialize database.doccano init# Create a super user.doccano cr
2022-05-20 10:58:26
1545
7
原创 天池oppo-text-match比赛-苏剑林baseline代码解读
本文根据苏剑林的基于bert的baseline进行短文本匹配的讲解,其github地址是:https://github.com/bojone/oppo-text-match/blob/main/baseline.py赛题地址:https://tianchi.aliyun.com/competition/entrance/531851数据探索下载好相关数据之后,我们先看一下数据是什么样的:path = '/content/drive/MyDrive/oppo-text-match/baseline_
2021-03-23 10:27:24
994
9
原创 【关系抽取-mre-in-one-pass】模型的建立
模型创建相关代码def create_model(bert_config, is_training, input_ids, input_mask, segment_ids, labels, num_labels, use_one_hot_embeddings, extras): """Creates a classification model.""" model = modeling.BertModel( config=bert_config,
2021-03-19 14:36:22
216
原创 【关系抽取-mre-in-one-pass】加载数据(一)
模型训练命令python run_classifier.py \ --task_name=semeval \ --do_train=true \ --do_eval=false \ --do_predict=false \ --data_dir=$DATA_DIR/semeval2018/multi \ --vocab_file=$BERT_BASE_DIR/vocab.txt \ --bert
2021-03-19 09:49:36
292
原创 【关系抽取-mre-in-one-pass】加载数据(二)
接上一节加载数据(一)上一节我们说到了convert_single_example(ex_index, example, label_list, max_seq_length, tokenizer)这个函数,里面又分别调用了:loc, mas, e1_mas, e2_mas = prepare_extra_data(mapping_a, example.locations, FLAGS.max_distance)而在prepare_extr
2021-03-19 09:47:59
136
原创 colab下百度ERNIE的安装
安装paddlepaddle安装命令!python -m pip install paddlepaddle-gpu==2.0.1.post100 -f https://paddlepaddle.org.cn/whl/mkl/stable.html安装paddle-ernie安装命令!pip install paddle-ernie测试安装是否成功下载模型相关的文件!wget https://ernie-github.cdn.bcebos.com/model-ernie1.0.1.tar.
2021-03-18 17:09:12
695
2
原创 python实现并查集
什么是并查集?这里借用百度百科的一句话:并查集是一种树型的数据结构,用于处理一些不相交集合(disjoint sets)的合并及查询问题。常常在使用中以森林来表示。假设现在有一个武林大会,包含了少林、峨嵋、武当等门派,通过并查集就可以将每个人归类到自己的门派中。代码实现class UnionFind: def __init__(self): self.co = 0 # 用于记录群的个数 self.parent = [] # 索引是每个节点本身,值是每个节点的
2021-01-25 15:58:40
626
原创 python多维嵌套列表转换为一维列表
直接看代码:arr = [[1,1],2,[1,1,[4,5]]]res = []def flat(arr): for a in arr: if isinstance(a, int): res.append(a) else: flat(a)flat(arr)print(res)结果:[1, 1, 2, 1, 1, 4, 5]
2021-01-18 23:51:24
746
原创 python小例子
第一篇csdn博文,先占个坑=。=python小例子1. 格式化输出自定义对象class Person: def __init__(self, name=None, id=None): self.name = name self.id = id def __str__(self): return str(self.__dict__) def __repr__(self): return self.__str__() def __eq__(self, other): if s
2021-01-18 14:34:37
84
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人