- 博客(29)
- 资源 (1)
- 收藏
- 关注
原创 大模型系列课程学习-基于Vllm/Ollama/Ktransformers完成Deepseek推理服务部署
目前大模型推理框架主要包含VLLM/SGLang/ollama/ktransformer等框架,基于上述框架完成Deepseek部署实战
2025-03-09 20:00:35
1122
原创 大模型系列课程学习-大预言模型微调方法介绍
指对,其起源于语音识别(speech recognition),输入一段音频数据,语音识别系统通常会生成多个句子作为候选,究竟哪个句子更合理?学术上表达为:描述一段或给定上文时根据之前的介绍,语言模型经过四个阶段的发展,详情请参考毫无疑问,大语言模型是一种由包含数百亿以上参数的深度神经网络构建的语言模型,通常使用自监督学习方法通过大量无标注文本进行训练。大模型发展的时间线可以参考下图。
2024-04-21 20:41:29
1412
原创 大模型系列课程学习-prompt指令快速入门
提示工程入门1. 提示工程简介及使用技巧1.1 提示工程简介1.2 提示工程使用技巧2. prompt 赋能 NLP场景能力2.1 文本分类2.2 要素抽取2.3 文本摘要2.4 文本纠错2.5 机器翻译2.6 问题回答2.7 文本生成3. prompt进阶使用技巧
2024-01-28 21:47:36
990
原创 大模型系列课程学习-AI 大模型时代的奠基石-transformer模型
文本分类:输入是一段文本,输出是该文本的类别命名实体识别:输入是一段文本,输出是该文本中的某些关键要素或者信息机器翻译:输入是一段语言文本,输出是 另一种语言文本文本摘要:输入是一段较长文本,输出是对该文本的一段精简表达文本多轮对话交互。
2023-12-29 21:48:23
926
原创 0.算法工程师工具--配置python开发环境
Python开发环境搭建本篇博客主要介绍算法工程师在不同操作系统中安装Python开发环境,以及如何使用Pycharm远程连接服务器调试代码1.anaconda环境搭建1.1 服务器(linux系统开发环境搭建)(1)下载安装包:首先需要在anaconda官网下载符合自己实际需求的安装包,这里主要包含系统版本(linux,windows,mac)以及相应位数。anaconda官网: 下载地址.(2)在服务器下执行sh命令进行安装,需要注意的是,一般在服务器上我们没有root权限,需要使用roo
2021-10-20 17:52:37
289
原创 0.算法工程师工具系列--Docker快速入门
算法工程师工具系列–Docker快速入门首先放一个非常实用的入门教程《Docker入门教程》: 链接.1.Docker的主要用途:提供一次性环境:比如,本地测试他人的软件、持续集成的时候提供单元测试和构建的环境提供弹性的云服务:因为 Docker 容器可以随开随关,很适合动态扩容和缩容组件微服务架构:通过多个容器,一台机器可以跑多个服务,因此在本机就可以模拟出微服务架构上述的功能用简单通俗的语言表述就是docker可以将自己环境打包给别人,提供给别人使用,而且在这个基础上可以扩充更多的功能,而
2021-10-06 13:18:09
341
原创 基于Huggingface transformers 库的预训练语言模型分类体系及实战课程(一)
一图了解预训练语言模型最近在学习的过程中发现一本书总结的预训练语言模型的分类体系挺不错的,分享给大家。预训练语言模型的发展及意义(待更新)
2021-09-12 11:08:36
3402
1
原创 windows下将Anaconda从C盘迁移至D盘(其他盘)
windows下将Anaconda从C盘迁移至D盘(其他盘)一般在安装anaconda软件时,默认安装的是C盘的usr路径下,我的最开始安装在我自己的用户路径下,随着库的安装以及代码的书写,anaconda的大小越来越大,我的最后占用了快30G,然而最近又安装了docker desktop,比较占内存,而且又不好迁移,因此想着如何把anaconda迁移到其他盘。1.拷贝文件+更新pip首先将安装在C盘路径下的anaconda的文件全部拷贝到D盘。修改环境变量,一般是5个删除C盘的anacon
2021-08-21 09:57:31
36466
35
原创 命名实体识别调研(持续更新中,目前属于自己学习的部分)
命名实体识别(NER)命名实体识别(Named Entity Recognition,NER),又叫“专名识别”,从语言分析的全过程来看,NER属于词法分析中的未登录词识别的范畴,命名实体识未登录词中数量最多、识别难度最多、对分词效果影响最大的问题。命名实体一般包括三大类(实体类、时间类和数字类)和7小类(人名、地名、机构名、时间、日期、货币和百分比)。NER一直是NLP领域中的研究热点,从早期基于词典和规则的方法,到传统机器学习的方法,到近年来基于深度学习的方法,NER研究进展的大概趋势大致如下图所
2021-07-26 23:12:28
934
3
原创 0.算法工程师工具系列--Flask框架快速入门
Flask框架快如入门1.Flask框架简介Flask是一个微型的Python开发的Web框架,可以用于快速实现一个网站或Web服务。基于Werkzeug WSGI工具箱和jinja2模板引擎,官方参考文档:https://flask.palletsprojects.com/en/2.0.x/ Flask与Django都是后端框架,只是前者属于微框架,后者属于重量级框架2.Flask快速入门2.1 安装Flask在anaconda安装的环境下执行安装命令即可pip install flask
2021-07-06 22:38:52
294
原创 0.算法工程师工具系列--使用git工具上传Github
算法工程师工具系列–使用git工具上传Github本系列将介绍算法工程师必备的几样工具,暂时定为以下几个工具:git工具+github(用于本地和远程仓库之间拉代码、传代码、代码托管)masql(用于数据库的读取)linux基本操作指令、python/flask(用于服务器的开发)docker (用于模型部署)1.git的基本介绍(1)创建版本库(仓库)版本库又名仓库,英文名repository,你可以简单理解成一个目录,这个目录里面的所有文件都可以被Git管理起来,每个文件的修改、删除
2021-05-17 17:19:08
256
原创 手把手教你实现命名实体识别
自然语言处理实战--命名实体识别1.互联网金融新实体发现(数据获取)2.环境搭建3.赛题分析4.代码解析4.1数据预处理4.2模型构建4.3模型训练-1.互联网金融新实体发现(数据获取)比赛链接: 互联网金融新实体发现.本博客主要参考他的文章和代码: 阿力阿哩哩.感兴趣的话可以关注他的知乎、公众号以及B站账号。2.环境搭建(1)硬件环境:操作系统:windows 10或者 linux(Ubuntu 16~18) (本人使用的windows 10)硬件配置:主要是显卡要求:1660Ti 6G
2021-05-12 12:23:26
1209
2
原创 常见神经网络Keras实现
常见神经网络实现环境配置:tensorflow=2.2,keras=2.3.1(1)全连接神经网络model = Sequential()model.add(Embedding(output_dim = 32, # 词向量的维度 input_dim = 2000, # Size of the vocabulary 字典大小 input_length = 50 # 每个数字列表的长度
2021-04-23 11:06:27
452
原创 神经网络模型简介及常见的损失函数
神经网络模型常见的损失函数1.神经网络模型简介神经网络模型一般包含输入层、隐含层和输出层,每一层都是由诸多神经元组成。输入层神经元的个数一般和输入模型的特征(单个样本的维数)有关,输出层神经元的个数与项目任务有关,隐含层的个数一般根据经验设置即可。对于神经网络模型而言,根据不同的输出任务而言,可以分成模式分类和模式回归两大问题。在训练神经网络时,往往采用基于梯度下降的方法不断去缩小预测值和真实值之间的差值,而这个差值就叫做损失(Loss),计算该损失的函数就叫做损失函数(Loss function)
2021-04-19 14:10:09
10241
原创 Tensorflow2.0框架的使用感悟
在使用tensorflow2.0版本的框架时,一般默认为即使执行模式。但有时候还是像tensorflow1.x版本一样,必须在导入库函数之后,调用函数:tf.enable_eager_execution()才能启用及时执行模式,否则会导致如下类似错误。一般遇到上述问题,只需要在import tensorflow as tf 的语句后面加上:tf.enable_eager_execution()...
2020-11-08 14:51:07
1319
原创 常见排序算法--python实现
常见排序算法–python实现【1】稳定性是指序列中相同的数字在排序后相对位置不发生改变【2】常见的且稳定的排序算法有冒泡、归并、插入,其余的为非稳定的排序算法冒泡排序def bubble_sort(alist): for j in range(len(alist)-1,0,-1): for i in range(j): if alist[i]>alist[i+1]: alist[i],alist[i+1] =
2020-10-10 22:57:57
193
原创 《统计学习方法》第一版课后习题答案--深度之眼课程
【作业1】 .【参考文章】https://blog.youkuaiyun.com/qq_37098526/article/details/89516974极大似然估计贝叶斯估计【作业2】思考感知机模型假设空间是什么?模型复杂度体现在哪里?2.已知训练数据集D,其正实例点是x1=(3,3)T,x2=(4,3)T,负实例点是x3=(1,1)T:(1) 用python 自编程实现感知机模型,对训练数据集进行分类,并对比误分类点选择次序不同对最终结果的影响。可采用函数式编程或面向对象的编程。(2)试
2020-09-28 22:15:33
3317
原创 1.[每日算法题] --最优打字策略
1.[每日算法题] --最优打字策略解题思路1:1.首先遍历字符串的长度,这个是最小的按键次数2.判断连续两个输入的状态,遍历字符串(需要额外的按键次数)(1)首先因为默认小写输入,设置大小写状态k=0;(2)如果本次输入为大写状态且k = 0,按键次数需要额外增加一次,如果下一个输入仍然为大写,需要修改k = 1,如果下一个输入为小写,则保持k=0的状态(3)如果本次输入为小写状态且k = 1,按键次数需额外增加一次,如果下一个输入仍为小写,修改k = 0,如果下一个输入为大写,这需要修改
2020-09-22 22:57:25
947
2
原创 命名实体识别的后处理--百家姓辅助字典
命名实体识别的后处理百家姓辅助字典代码实现使用深度学习模型去做命名实体识别任务时,可能会出现效果不好等现象,此时可以使用一些规则对预测模型进行后处理,从而提高模型的表现。比如在姓名实体识别过程中可以加入百家姓字典辅助。百家姓辅助字典代码实现stop_name字典可以自己整一个,每行是一个姓氏import codecs import sys def stop_words(path): with open(path,'r',encoding='utf-8',errors='ignore')
2020-08-19 15:13:34
540
原创 高频词随机抽取
高频词随机抽取随机抽取一定数量的高频词高频词一般是指文档中出现频率较高的且非无用的词.高频次提取其实就是自然语言处理中的TF(Term Frequence)策略,其主要有一下两个干扰项:(1)标签符号,一般情况下无实际价值(2)停用词:诸如“是”、‘哈’等无实意词需要剔除上述两个干扰项。随机抽取一定数量的高频词#将语料转成普通文本(这部分不是必须的)import codecsdef document_scratch(input_file,output_file): input_dat
2020-08-17 17:05:55
1560
原创 NER--《人民日报》语料库预处理
NER--《人民日报》语料库预处理转成标准BIEO格式转成标准BIEO格式# -*- coding: utf-8 -*-"""Created on Fri Jul 31 16:16:58 2020将《人民日报》中的标签转成标准的BIEO格式@author: jpcheng2"""import codecsdef text_map(texts: [str]) -> [str]: mapping = {'O': 'O', 'B_nr': 'B-PER
2020-08-12 16:21:30
3688
1
原创 Focal loss Tensorflow实现
Focal loss Tensorflow实现def focal_loss(prediction_tesnsor,target_tensor,weights = None,alpha = 0.25,gamma=2): """ FL = -alpha *(z-p)^gamma*log(p) - (1-alpha)*p^gamma *log(1-p) which alpha = 0.25,gamma = 2,p = sigmoid(x),z = target_tensor """ sigmoid_p
2020-08-10 18:03:29
730
原创 NLP数据增强--随机替换命名实体
NLP数据增强--随机替换命名实体随机替换实体主要参考这位大佬的博客 参考链接.随机替换实体输入一句话 :我不是<per>张加</per>,使用<per>标注实体是因为之前写过相关的博客。会按照姓名实体库里的实体随机替换,从而扩充语料。代码如下:#!/usr/bin/python# -*- coding: utf-8 -*-import codecsimport jieba as t_jiebaimport randomimport osr
2020-08-10 14:58:00
829
3
原创 数据集划分及简介 --训练集、测试集、验证集(开发集)
数据集划分 --训练集、测试集、验证集按比例划分数据集(按照句子级别)按比例划分数据集(按照句子级别)按照8:1:1比例划分数据集,下面展示一些代码:# -*- coding: utf-8 -*-"""Created on Fri Jul 31 16:26:46 2020随机将数据集按照句子级别划分训练集、测试集、验证集@author: jpcheng2"""import randomdef split(all_list, shuffle=False, ratio=0.8,ratio1
2020-08-07 11:33:38
5279
7
原创 命名实体识别数据预处理--格式转换
命名实体识别数据预处理常见的预料库数据预处理代码常见的预料库链接: 微软数据.链接: 人名日报.链接: 微博语聊数据.数据预处理代码下面展示一些 将我不是<per>江莱</per>转换成‘BIOE标准格式’。import codecs import sys def character_tagging(input_file, output_file): input_data = codecs.open(input_file, 'r', 'utf-
2020-08-07 11:25:16
2412
2
原创 谷歌BERT模型--调试MRPC任务--使用pycharm集成环境
谷歌BERT模型--pycharm实现---absl.flags._exceptions.IllegalFlagValueError: flag --do_train=true\: ('Non-boolean argument to boolean flag', 'true\\'唐宇迪BERT课程使用Pycharm实现MRPCabsl.flags._exceptions.IllegalFlagValueError: flag --do_train=true: (‘Non-boolean argument
2020-06-21 16:55:03
7851
52
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人