Brat序列标注工具小结

20210616

https://blog.youkuaiyun.com/u012436149/article/details/79321112
spacy
构建语法解析树

Brat标注工具(本地)安装及使用

  1. 环境
    windows10->虚拟机->Ubuntu 16.04 64位

  2. 前置条件

    1:更新apt

    sudo apt upgrade
    sudo apt update
    
          
          
    • 1
    • 2

    2:安装git

    sudo apt install git
    
          
          
    • 1

    3.安装apache2

    sudo apt install apache2
    
          
          
    • 1

    检测:浏览器中输入http://127.0.0.1/或者http://localhost/
    进入下图界面,则说明安装成功

    在这里插入图片描述

    4.安装google chrome#个人习惯

    wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
    sudo dpkg -i google-chrome-stable_current_amd64.deb
    
          
          
    • 1
    • 2
  3. 安装

    1.下载brat

    进入主页下载 http://brat.nlplab.org/index.html

    2.解压

    tar xzf 路径/文件名
    eg: tar xzf Downloads/brat-v1.3_Crunchy_Frog.tar.gz
    
          
          
    • 1
    • 2

    3.进入文件夹

    重命名为brat

    cd brat
    
          
          
    • 1

    4.安装

    ./install.sh
    
          
          
    • 1

    在这里插入图片描述
    5.打开#每次使用都需要

    python2 standalone.py
    
          
          
    • 1

    6.打开浏览器进入即可开始标注

    http://127.0.0.1:8001/index.xhtml

  4. 使用

    1.登录后,选中文本后会弹出窗口,选择实体类型
    2.拖动标注好的实体可以连接关系
    3.双击标签可对标签进行修改或删除
    4.点击data可导出标注好的数据
    ps:未登录不能进行标注
    在这里插入图片描述
    在这里插入图片描述

  5. 配置

    annotation.conf

    1.entities用来定义标注的实体名称,其格式为每行一个实体类型,
    	比如:人名、地名、英雄名、技能名等,可以采用tab来增加二级标注,
    	hero
    		hero1
    2.relations用来定义实体间的关系,格式为每行定义一种关系,第一列为关系类型,
    	随后是用逗号分隔的ArgNrelations用来定义实体间的关系,格式为每行定义一种关系,第一列为关系类型,
    	随后是用逗号分隔的ArgN:实体名,用来表示关系的各个相关者。
    	relation1 Arg1:hero1, Arg2:hero1
    3.events用来定义事件,每行定义一类事件,第一列为事件名,随后是用逗号分隔的Participant:实体名,
    	用来表示事件的各个参与者。
    4.attributes用来定义属性,每行一个属性,第一列为属性名,随后是用逗号分隔的Arg:<模块类型>, Value:属性值,
    	注意属性值可以有多个
    
          
          
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    图
    visual.conf#视觉配置文件

    1.采用中文标签时需要
    2.将annotation.conf中名称替换
    3.labels
    	[labels]
    	hero1 | 魏
    
          
          
    • 1
    • 2
    • 3
    • 4
    • 5

    在这里插入图片描述

  6. 其他

    1.中文支持

    添加

    n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)
    
          
          
    • 1

    到./server/src/projectconfig.py第163行
    在这里插入图片描述
    2.给.txt文件添加.ann的标引文件

    find 文件夹名称 -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch
    eg:find data/exa -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch
    
          
          
    • 1
    • 2

    给文件夹内所有.txt文件添加对应的.ann标引文件

    3.添加用户(本地不需要)

    直接在config.py文件中添加
    USER_PASSWORD = { 
    'admn': 'admin', 
    'test': 'test', 
    #'user':'password',
    # (add USERNAME:PASSWORD pairs below this line.) 
    }
    
          
          
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
  7. 参考
    中文文本标注工具调研以及BRAT安装使用

    标注工具Brat安装(本地)

                                </div><div data-report-view="{&quot;mod&quot;:&quot;1585297308_001&quot;,&quot;dest&quot;:&quot;https://blog.youkuaiyun.com/p_jinsan/article/details/96152078&quot;,&quot;extend1&quot;:&quot;pc&quot;,&quot;ab&quot;:&quot;new&quot;}"><div></div></div>
            <link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-60ecaf1f42.css" rel="stylesheet">
                            </div>
</article>

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值