20210616
https://blog.youkuaiyun.com/u012436149/article/details/79321112
spacy
构建语法解析树
Brat标注工具(本地)安装及使用
-
环境
windows10->虚拟机->Ubuntu 16.04 64位 -
前置条件
1:更新apt
sudo apt upgrade sudo apt update
- 1
- 2
2:安装git
sudo apt install git
- 1
3.安装apache2
sudo apt install apache2
- 1
检测:浏览器中输入http://127.0.0.1/或者http://localhost/
进入下图界面,则说明安装成功4.安装google chrome#个人习惯
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb sudo dpkg -i google-chrome-stable_current_amd64.deb
- 1
- 2
-
安装
1.下载brat
进入主页下载 http://brat.nlplab.org/index.html
2.解压
tar xzf 路径/文件名 eg: tar xzf Downloads/brat-v1.3_Crunchy_Frog.tar.gz
- 1
- 2
3.进入文件夹
重命名为brat
cd brat
- 1
4.安装
./install.sh
- 1
5.打开#每次使用都需要python2 standalone.py
- 1
6.打开浏览器进入即可开始标注
-
使用
1.登录后,选中文本后会弹出窗口,选择实体类型
2.拖动标注好的实体可以连接关系
3.双击标签可对标签进行修改或删除
4.点击data可导出标注好的数据
ps:未登录不能进行标注
-
配置
annotation.conf
1.entities用来定义标注的实体名称,其格式为每行一个实体类型, 比如:人名、地名、英雄名、技能名等,可以采用tab来增加二级标注, hero hero1 2.relations用来定义实体间的关系,格式为每行定义一种关系,第一列为关系类型, 随后是用逗号分隔的ArgNrelations用来定义实体间的关系,格式为每行定义一种关系,第一列为关系类型, 随后是用逗号分隔的ArgN:实体名,用来表示关系的各个相关者。 relation1 Arg1:hero1, Arg2:hero1 3.events用来定义事件,每行定义一类事件,第一列为事件名,随后是用逗号分隔的Participant:实体名, 用来表示事件的各个参与者。 4.attributes用来定义属性,每行一个属性,第一列为属性名,随后是用逗号分隔的Arg:<模块类型>, Value:属性值, 注意属性值可以有多个
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
visual.conf#视觉配置文件1.采用中文标签时需要 2.将annotation.conf中名称替换 3.labels [labels] hero1 | 魏
- 1
- 2
- 3
- 4
- 5
-
其他
1.中文支持
添加
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)
- 1
到./server/src/projectconfig.py第163行
2.给.txt文件添加.ann的标引文件find 文件夹名称 -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch eg:find data/exa -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch
- 1
- 2
给文件夹内所有.txt文件添加对应的.ann标引文件
3.添加用户(本地不需要)
直接在config.py文件中添加 USER_PASSWORD = { 'admn': 'admin', 'test': 'test', #'user':'password', # (add USERNAME:PASSWORD pairs below this line.) }
- 1
- 2
- 3
- 4
- 5
- 6
- 7
</div><div data-report-view="{"mod":"1585297308_001","dest":"https://blog.youkuaiyun.com/p_jinsan/article/details/96152078","extend1":"pc","ab":"new"}"><div></div></div>
<link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-60ecaf1f42.css" rel="stylesheet">
</div>
</article>