- 博客(11)
- 资源 (8)
- 收藏
- 关注
原创 目标检测OD
目标检测目标检测开源实现(Yolo等框架)Yolo:you only look once1.环境安装利用Anaconda安装pytorch和paddle深度学习环境+pycharm安装—免额外安装CUDA和cudnn(适合小白的保姆级教学)_didiaopao的博客-优快云博客conda create -n pytorch python=3.8conda activate pytorchconda config --add channels https://mirrors.tuna.tsin
2021-12-03 16:08:23
3156
原创 文字识别&场景文字识别
文字识别&场景文字识别一 大厂API1阿里达摩院:https://duguang.aliyun.com/experience?type=universal&subtype=general_text#intro读光通用识别系列读光通用文档类OCR识别产品,可将各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式进行文本识别和还原。为了能够更好的还原文字信息和文档结构,读光文档识别在通用全文识别能力(文字定位、行分析、文字识别)的基础上,增加了文档结构的版面分析和文档图像处理能力
2021-09-18 15:24:11
1492
原创 命名实体识别
命名实体识别从一句话中识别出人名,地名,组织名,日期时间,这就是命名实体识别的一个例子,而人名,地名等这些被识别的目标就是命名实体。当然命名实体还可以是很多其它有意义的目标,比如产品,公司,专有名词等等。标注了解过机器学习的朋友都知道,无论是传统的机器学习还是深度学习,大多数情况都是在做监督学习,也就是需要大量标注好的数据做为训练样本,那么这里,如果希望机器能识别出人名,地名,就必须事先给机器看看在一句话中,什么是人名,什么是地名,当然只看一句话是远远不够的,一般来说,至少也要上千句话才可以。这些句子
2021-09-18 15:22:22
392
原创 文本分类模型
文本分类数据制作煤矿安全规程转为文本每章文本类别标签为章节名称总数据量:281条,6个类别文本转为向量文本长度的填充为数据中最长的文本长度标签映射为数字,再转为向量one-hot模型LSTMembedding层BiLSTM层Dense层/全连接层softmaxloss:category_crossentropyTransformer预训练模型选择:roberta超参数设置部署读取存储的模型lstm需进行分词后预测,transformer不需要训练结果均达到99的
2021-09-18 15:21:20
217
原创 知识图谱思想
知识图谱现有诸如Wikidata、Yago、DBpedia,富含海量世界知识,并以结构化形式存储2019 年年底,图灵奖获得者 Bengio 曾指出,我们正处于从以感知智能为代表的深度学习“系统一”,向以认知智能为代表的深度学习 “系统二”过渡的时期在这个过程中,知识图谱技术起到了关键性的作用。近年来,图网络的蓬勃发展也印证了这一趋势引入人类的知识是人工智能的重要研究方向之一知识表征和推理受到了人类解决问题方法的启发,旨在为智能系统表征知识,从而获得解决复杂问题的能力最近,知识图谱作为一种结构
2021-09-18 15:15:26
862
原创 声纹识别手册
声纹识别手册https://github.com/yeyupiaoling/VoiceprintRecognition-Tensorflow环境准备Python 3.7Tensorflow 2.0安装libsorapip install pytest-runnerpip install librosa如果pip命令安装不成功,那就使用源码安装,下载源码:https://github.com/librosa/librosa/releases/安装PyAudiopip install pya
2021-09-18 15:08:24
427
原创 TFASR 开源语音识别项目解构
TFASR 开源语音识别项目解构模型下载AMpan.baidu.com/s/1NPk17DUr0-lBgwCkC5dFuQ7qmdaishell-1(20 epochs)LMpan.baidu.com/s/1X11OE_sk7yNTjtDpU7sfvAsxrwaishell-1 text(30 epochs)路径更换am_config = UserConfig(r’./configs/am_data.yml’, r’./configs/conformerM.yml’)lm_confi
2021-09-18 15:06:01
438
原创 Torch SimpleTransformers
Torch SimpleTransformers包可视化支持 Visualization support可以使用 Weights&Biases 一种模型可视化库,来对模型训练进行可视化只需要为模型的args属性中,给字典里的’wandb_project’ 设置一个属性名称model = ClassificationModel(‘roberta’, ‘roberta-base’, args={‘wandb_project’: ‘project-name’})提早停止训练 Early s
2021-09-18 14:59:11
552
原创 NLP(CAS10年NLP课程note)
语言模型幂律分布齐夫定律(英语:Zipf’s law,IPA/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律。它可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。词法分析与词性标注概述词是自然语言中能够独立运用的最小单位,是自然语言处理的基本单位自动词法分析就是利用计算机对
2021-03-19 15:24:27
995
原创 语音识别系统结构
语音识别系统结构语音信号处理根据人耳的听觉感知特点,抽取语音中最重要的特征,将语音信号转换为特征矢量序列声学特征线性预测编码 Linear Predictive Coding,LPC梅尔频率倒谱系数 Mel-frequency Cepstrum Coefficients,MFCC梅尔标度滤波器组 Mel-scale Filter Bank,FBank线性感知预测(Perceptual Linear Prediction, PLP)解码器decoder是根据字典、声学模型和语音模型,将输
2021-03-08 10:20:24
2012
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人