自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 山东大学暑期实训一20220620

暑期实训 第一天-学习Blender

2022-06-20 17:17:54 305

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(十一 总结)

本篇为软件工程与实践课程SENTA项目分析的最后一篇,对SENTA进行调用并进行总结。调用代码段:import paddlehub as hubsenta = hub.Module(name="senta_bilstm")test_text = [ "这个宾馆比较陈旧了,特价的房间也很一般。总体来说一般", "交通方便;环境很好;服务态度很好 房间较小", "稍微重了点,可能是硬盘大的原故,还要再轻半斤就好了。" , "服务很不错,下次还会来。" , "前

2021-12-31 14:16:21 712

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(十)

本篇对SENTA中的BaseDataSetReader进行源码分析。BaseDataSetReader:将样本中数据组装成一个py_reader, 向外提供一个统一的接口。核心内容是读取明文文件,转换成id,按py_reader需要的tensor格式灌进去,然后通过调用run方法让整个循环跑起来。 py_reader拿出的来的是lod-tensor形式的id,这些id可以用来做后面的embedding等计算。class BaseDataSetReader(object): def __

2021-12-27 23:49:28 197

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(九)

本期对SENTA项目中metrics的sklearn_metrics进行源码分析,主要为分类统计指标的实现。 def evaluate(output, evaluate_types, average="macro"): """ :param output: :param evaluate_types: :param average: :return: """ if not evaluat

2021-12-27 23:01:26 691

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(八)

本期续接2021SC@SDUSC-山东大学软件工程与实践-Senta(七),继续对Metrics中的glue_eval进行分析。def matthews_corrcoef(preds, labels): """matthews_corrcoef""" preds = np.array(preds) labels = np.array(labels) tp = np.sum((labels == 1) & (preds == 1)) tn = np.sum(

2021-12-27 20:15:31 1668

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(七)

本期分析Senta中的评估标准Metricfrom __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_functionimport timeimport numpy as npfrom scipy.stats import pearsonr, spearmanrfrom six.moves import xrangeimport paddle.flui

2021-12-09 21:21:51 1063

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(六)

本篇续接2021SC@SDUSC-山东大学软件工程与实践-Senta(5),继续对Senta中的Elmo模型进行分析。def encoder_wrapper(x_emb, vocab_size, emb_size, init_hidden=None, init_cell=None, para_name='',

2021-12-09 15:22:29 629

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(5)

本篇对Senta中token embedding中所使用的ELMO模型进行分析。paddlepaddle:百度深度学习的框架 paddle.fluid.layers.dropout:丢弃或者保持x的每个元素独立。Dropout是一种正则化手段,通过在训练过程中阻止神经元节点间的相关性来减少过拟合。根据给定的丢弃概率,dropout操作符按丢弃概率随机将一些神经元输出设置为0,其他的仍保持不变。# -*- coding: utf-8 -*"""ELMo model."""from __f

2021-12-08 19:55:43 332

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(4)

SENTA通用规则中的类(代码分析)MaxTruncation:超长截断class MaxTruncation(object): KEEP_HEAD = 0 KEEP_TAIL = 1 KEEP_BOTH_HEAD_TAIL = 2 KEEP_HEAD : 从头开始到最大长度截断KEEP_TAIL : 从头开始到max_len-1的位置截断,末尾补上最后一个id(词或字)KEEP_BOTH_HEAD_TAIL :保留头和尾两个位置,然后按keep_head方式

2021-12-07 12:13:57 266

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(3)

Senta中的语义表示模型ERNIE本篇代码分析续接2021SC@SDUSC-山东大学软件工程与实践-Senta(2) ,完成对ERNIE模型的训练前配置并组建运行Fine-tune task。#选择运行时配置config = hub.RunConfig( use_cuda=True, num_epoch=1, checkpoint_dir="ernie_txt_cls_turtorial_demo", batch_size=32, log_interval=1

2021-12-01 14:23:54 867

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(2)

Senta中的语义表示模型ERNIE知识增强的语义表示模型 ERNIE(Enhanced Representation through kNowledge IntEgration)通过对词、实体等语义单元的掩码,使得模型学习完整概念的语义表示。相较于 BERT 学习原始语言信号,ERNIE 直接对先验语义知识单元进行建模,增强了模型语义表示能力。在本次的百度Senta项目中,语义表示模型使用的就是ERNIE。在本篇以及下一篇代码分析中,我将以ERINIE作为预训练模型进行Fine-tune,使用的数据集

2021-11-30 14:02:01 1079

原创 2021SC@SDUSC-山东大学软件工程与实践-Senta(1)

简介情感分析旨在自动识别和提取文本中的倾向、立场、评价、观点等主观信息。它包含各式各样的任务,比如句子级情感分类、评价对象级情感分类、观点抽取、情绪分类等。本次百度在Senta中开源了基于SKEP的情感预训练代码和中英情感预训练模型。SKEP是百度研究团队提出的基于情感知识增强的情感预训练算法,此算法采用无监督方法自动挖掘情感知识,然后利用情感知识构建预训练目标,从而让机器学会理解情感语义。SKEP为各类情感分析任务提供统一且强大的情感语义表示。环境配置PaddlePaddle安装本项目依赖于 P

2021-09-30 22:28:56 266

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除