Zemun-优快云博客

原创目标检测OD

目标检测目标检测开源实现（Yolo等框架）Yolo：you only look once1.环境安装利用Anaconda安装pytorch和paddle深度学习环境+pycharm安装—免额外安装CUDA和cudnn（适合小白的保姆级教学）_didiaopao的博客-优快云博客conda create -n pytorch python=3.8conda activate pytorchconda config --add channels https://mirrors.tuna.tsin

2021-12-03 16:08:23 3192

原创文字识别&场景文字识别

文字识别&场景文字识别一大厂API1阿里达摩院：https://duguang.aliyun.com/experience?type=universal&subtype=general_text#intro读光通用识别系列读光通用文档类OCR识别产品，可将各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式进行文本识别和还原。为了能够更好的还原文字信息和文档结构，读光文档识别在通用全文识别能力（文字定位、行分析、文字识别）的基础上，增加了文档结构的版面分析和文档图像处理能力

2021-09-18 15:24:11 1650

原创命名实体识别

命名实体识别从一句话中识别出人名，地名，组织名，日期时间，这就是命名实体识别的一个例子，而人名，地名等这些被识别的目标就是命名实体。当然命名实体还可以是很多其它有意义的目标，比如产品，公司，专有名词等等。标注了解过机器学习的朋友都知道，无论是传统的机器学习还是深度学习，大多数情况都是在做监督学习，也就是需要大量标注好的数据做为训练样本，那么这里，如果希望机器能识别出人名，地名，就必须事先给机器看看在一句话中，什么是人名，什么是地名，当然只看一句话是远远不够的，一般来说，至少也要上千句话才可以。这些句子

2021-09-18 15:22:22 474

原创文本分类模型

文本分类数据制作煤矿安全规程转为文本每章文本类别标签为章节名称总数据量：281条，6个类别文本转为向量文本长度的填充为数据中最长的文本长度标签映射为数字，再转为向量one-hot模型LSTMembedding层BiLSTM层Dense层/全连接层softmaxloss：category_crossentropyTransformer预训练模型选择：roberta超参数设置部署读取存储的模型lstm需进行分词后预测，transformer不需要训练结果均达到99的

2021-09-18 15:21:20 273

原创知识图谱思想

知识图谱现有诸如Wikidata、Yago、DBpedia，富含海量世界知识，并以结构化形式存储2019 年年底，图灵奖获得者 Bengio 曾指出，我们正处于从以感知智能为代表的深度学习“系统一”，向以认知智能为代表的深度学习 “系统二”过渡的时期在这个过程中，知识图谱技术起到了关键性的作用。近年来，图网络的蓬勃发展也印证了这一趋势引入人类的知识是人工智能的重要研究方向之一知识表征和推理受到了人类解决问题方法的启发，旨在为智能系统表征知识，从而获得解决复杂问题的能力最近，知识图谱作为一种结构

2021-09-18 15:15:26 951

原创声纹识别手册

声纹识别手册https://github.com/yeyupiaoling/VoiceprintRecognition-Tensorflow环境准备Python 3.7Tensorflow 2.0安装libsorapip install pytest-runnerpip install librosa如果pip命令安装不成功，那就使用源码安装，下载源码：https://github.com/librosa/librosa/releases/安装PyAudiopip install pya

2021-09-18 15:08:24 508

原创 TFASR 开源语音识别项目解构

TFASR 开源语音识别项目解构模型下载AMpan.baidu.com/s/1NPk17DUr0-lBgwCkC5dFuQ7qmdaishell-1(20 epochs)LMpan.baidu.com/s/1X11OE_sk7yNTjtDpU7sfvAsxrwaishell-1 text(30 epochs)路径更换am_config = UserConfig(r’./configs/am_data.yml’, r’./configs/conformerM.yml’)lm_confi

2021-09-18 15:06:01 542

原创 Torch SimpleTransformers

Torch SimpleTransformers包可视化支持 Visualization support可以使用 Weights&Biases 一种模型可视化库，来对模型训练进行可视化只需要为模型的args属性中，给字典里的’wandb_project’ 设置一个属性名称model = ClassificationModel(‘roberta’, ‘roberta-base’, args={‘wandb_project’: ‘project-name’})提早停止训练 Early s

2021-09-18 14:59:11 593

原创语音识别系统结构

语音识别系统结构语音信号处理根据人耳的听觉感知特点，抽取语音中最重要的特征，将语音信号转换为特征矢量序列声学特征线性预测编码 Linear Predictive Coding，LPC梅尔频率倒谱系数 Mel-frequency Cepstrum Coefficients,MFCC梅尔标度滤波器组 Mel-scale Filter Bank，FBank线性感知预测（Perceptual Linear Prediction, PLP）解码器decoder是根据字典、声学模型和语音模型，将输

2021-03-08 10:20:24 2123