- 博客(21)
- 资源 (4)
- 收藏
- 关注

原创 深度学习-Seq2Seq LSTM 机器翻译.Part1
因为使用了LSTM,那就简单地介绍一下吧,它是一种用于解决循环神经网络中长期依赖问题的一种神经网络,传统的RNN在处理长序列数据时会面临梯度消失或者梯度爆炸的问题,导致难以捕捉到序列数据中的长期依赖关系。而解码器的任务就是使用编码器输出的向量来生成目标序列,既然是序列,那么解码器也是一个循环神经网络,它使用编码器的状态为输入的初始状态,逐步生成目标序列。因为,最近一直在学习Seq2Seq,很多都不得其解,我自己感觉有两个月了吧,查阅了一些资料,今天给大家带来一个基于字符的英汉翻译的辛酸史。
2023-08-02 23:07:05
185
原创 Transformers微调Llama3-1B
LLaMA 3 可以根据具体的任务进行微调,支持各种自然语言处理任务,比如:文本分类、问答系统、文本生成、情感分析、机器翻译等。相信,你已经会非常熟练的使用它了,但是今天呢,我们不是来聊它的,而是来聊聊另外一个开源语言模型Llama3。加载样本数据===>构建inputs和lables===>设置训练参数===>初始化训练器===>训练===>推理。总结:通过微调模型的方式,让我们初步认识到模型的工作原理和基础实现,对于理解、运用模型会带来很大的帮助。最后,我们看下文本生成的效果。首先,看下训练的日志。
2025-02-26 17:40:36
413
原创 【人工智能】中文文本纠错-同音字纠错
这个样本最重要的字段就是original_text、correct_text,其中original_text是错误样本,correct_text是对应的正确样本。基本的,在实践的过程中基本上是可行的,当然,需要全面地实现纠错任务,还需要准备更多的训练样本数据。例如,“他在做一件有意义的事情”中“做”误写为“作”。一整句话确实可以纠正出问题,那么我们看看这个错误的“健康”是否能正确纠正。纠正词语搭配不当,如动词和名词、形容词和名词之间的搭配错误。纠正标点符号的使用错误,如多余的标点、标点位置错误等。
2024-07-01 23:04:08
805
原创 记录指定GPU并行训练失效问题
是不是可以先将CUDA_VISIBLE_DEVICES位置为0、1、2、3,把所有的显卡都设置为可用状态(即使0、3已经被占用),再使用【方案3】强制更改和指定GPU。可是,依旧不行,这是为什么?尤其是加上Tensorflow 给出的提示信息有很强的误导(如果指定了1、2设备,日志打印的是0、1devices,误导我,以为没有设置成功。故事的开头是这样的,这台机器属于单机多卡服务器,有四张A800,我在训练文本纠错任务的时候,使用了MirroredStrategy进行分布式计算,一次性的全占了这4张显卡。
2024-05-21 19:19:28
381
1
原创 基于Transformer的恶意域名检测任务.Part1
常见的位置编码方法有两种方式:正弦位置编码和学习位置编码,这种的根本区别就是第一个属于固定的位置,第二个属于参与模型学习的。在搭建这个任务的过程中,有两个地方我觉得非常的精彩,自注意力和位置编码。可以清晰的看到网络的整个结构包括,输入、Embedding、Positional Encoding、叠加层(按照顺序包括:注意力层、归一化、前向残差),在这个任务中,我们最后再补充一个。起因是这样的,由于我的恶意域名样本都是一级域名,并没有二级或者三级域名。但是,我并没有注意到这些。是的,这个过程都是差不多的。
2023-11-05 15:06:10
310
原创 深度学习-UNet语义分割二分类与多分类的对比
在这张图片中,包含了许多信息,很多定义,有飞机、机箱道路、天空等等一系列的事物,那么这些定义的事物就是这些图片的语义,那么,今天我们就需要把图片中的这些定义划分出对应的区域出来。摘要:前面我们一起聊了下图片的多分类,简单应用包括汉字识别、目标识别、目标检测等等,今天我们来看下图像语义分割任务是做什么的,同样的,今天还是分享构建的思路以及遇到的一些问题。咋一看,确实是一个U型结构,按照中心线划分,左边是下采样,右边是上采样,这里我就不过多介绍这个网络结构,我们来看下它的实现。效果不能说完美,但是也算可以了。
2023-06-16 16:03:35
1134
原创 深度学习-ResNet-50实现目标检测(基于Pascal VOC数据集)2
对了,做上一步位置转换之前,还有一个注意点,由于网络输入的size是224,而且我们用的是batch的方式训练的,所以图片会resize到224,那么问题来了,label位置就会发生改变,所以需要处理下label的位置,这里是一个注意点。在这一类的目标检测中,我们需要检测出目标是什么名称以及他的位置和边框,使用分类的方式可以将目标检测出来,使用回归的方式,我们把位置和边框检测出来这个网络就完整了,但是,本着不浪费的前提,把上一篇的代码拿过来用一下吧,不同的是,这里的标签是需要我们处理一下的。
2023-06-13 00:14:15
650
原创 深度学习-ResNet-50实现目标检测(基于Pascal VOC数据集)
残差块中,利用跳跃连接的方式将输入的恒等映射直接加到后续的输出中,从而使得网络直接可以学习到对输入的差异性特征,避免这些信息因为多网络层的堆叠而丢失。残差块中,利用跳跃连接的方式将输入的恒等映射直接加到后续的输出中,从而使得网络直接可以学习到对输入的差异性特征,避免这些信息因为多网络层的堆叠而丢失。解压训练集和测试集之后,我们开始处理数据了,我看了下图片接近5000张,这个如果一次性加载的话,贫穷的我应该加载不了吧,OOM应该是肯定的。86%的正确率,这样的正确率还有上升的空间,不过这不重要。
2023-05-21 13:58:03
3755
原创 深度学习-VGG19网络识别手写汉字(基于HWDB1.1trn_gnt)
这段代码呢,使用了迭代器,能够减少内存的使用,不会一下次吃掉所有内存(不明白迭代器的小伙伴,自行百度学习)。图片按照上面六个顺序,进行处理,当然了,我这里还不够全面,比如还可以添加,检测图片是否摆正,是否需要翻转等等。,图片容易受到外在因素的干扰,比如有噪点,有色彩,有缺失等等一系列的问题。我罗列了一下我的处理过程。好的,做完这些之后,我们接下来就到正餐了,训练需要的样本都准备好了,接下来,我们要把我们的人工网络搭建起来。说明下,这两个字不是测试集和训练集当中的,是找两个人写的,识别的精准度还是很高的。
2023-05-10 13:48:04
3024
5
原创 手撕神经网络-正/反向传播
最近的ChatGpt非常火热,强大的智能能力让人不禁感叹,人类是不是要被AI取代了,有人惶恐、有人兴奋。每一次新技术的爆发,必然会带动一部分就业,我们要抱着积极的态度去了解他。
2023-04-02 22:06:01
194
原创 关于资源下线通知
非常抱歉的通知各位小伙伴: 由于业务和资源的调整,下线短视频站点和AI舆情分析接口。原来【http://xingship.com】将不再支持。以下展示她存在过的痕迹:
2021-12-15 23:56:18
232
原创 公路车道线辅助传统算法原理
近年,随着计算机、机器人控制和传感技术的突破,无人驾驶技术的发展进入了一个快速发展的阶段。早在1989年,卡内基·梅隆大学的Dean Pomerleau用神经网络构建了一辆可以上路的自动驾驶汽车。通过深度学习算法,通过观察人如何驾驶并“学习”人的驾驶技能。 深度学习使得一切变成了可能,计算机视觉是自动驾驶的一个非常重要的技术。今天我们通过传统的算法简单实现一下。以下按照顺序罗列一下步骤和涉及到的方法。1.灰度处理2.边缘检测3.高斯去噪4.中...
2021-07-22 11:28:12
846
1
原创 【免费AI舆情接口】基于NLP的舆情分析开发-NLP技术打造更快更准的舆情分析
作为开发人员,最喜欢的就是捣腾技术。最近几年,AI发展迅速,未来的趋势已定,做好技术储备,最为重要。话不多说,直接看效果。地址:http://xingship.com/入口:预训练模型地址:https://github.com/Embedding/Chinese-Word-Vectors/blob/master/README_zh.md它是由北京师范大学中文信息处理研究所与中国人民大学DBIIR实验室共同整理的,有很多模型,觉得还不错。预料饲料呢,就爬取了某旅游网站的酒店评论数据。
2021-05-10 11:57:04
954
原创 【撸网站第二天】瀑布流布局
学习网址:http://xingship.com我们会看到很好看的布局方式,我个人比较喜欢的某款app的布局方式,如下。非常喜欢他们家的app 页面布局。再回来看看,http://xingship.com这个网站也有类似的布局看到,这两个UI的风格比较像。只是http://xingship.com他们这个更为粗糙,小作坊的作品。但是,这个并不影响我们学习他的技术点。首先,我们在pc上 打开该网址,然后F12进入到开发者模式,让我们来看看我们看到,貌似用...
2020-12-15 20:36:15
41172
1
原创 【撸网站第一天】开篇
今天准备撸一个网站,主要撸一下他的技术点,包括:前端、结构、后端、压力测试 等等。现介绍一下这个网站:http://xingship.com测试下来,这个网站貌似只能在手机上使用,我在pc上显示的效果并不是很好,不知道站长是否可以兼容一下pc端。如下效果:很丑,但是当我跑到手机上来看的时候,还像那么回事。网站呢,主要是电影短视频的介绍。开始我以为这个是网站的布局是这一个标准的网格布局,但是其实他是个瀑布模式。第二篇,我们来详细介绍这个,好啦,今天由于时间关系,就现记录到这..
2020-12-14 14:31:17
209163
原创 Linux系统-scp简介&坑
上一篇文章地址:https://blog.youkuaiyun.com/xingxingzhilong/article/details/82593695本篇目录scp简介 灾难场景还原 处理方式写在最前面的话啥都不想说,只能表达下,scp这个命令有点坑,不知道是否就我一个人遇到这类问题。scp简介说道scp,这里顺带提下cp,cp是在同一个linux系统上,进行不同文件或者目录之间的...
2018-09-30 16:03:34
696
原创 第二篇:docker 简单入门(二)
本篇目录写在最前面的话 最常用的docker命令 获取远程仓库镜像写在最前面的话 如上图大家看到的这样,以后此类文章请到其他平台查阅 今天和大家分享下docker下面最常用的几个命令,太复杂的我也不知道是什么,但是不需要害怕,因为如果当你发现有些docker命令,你不知道的时候,说明你又进步了,是一件好事。当然今天我们会在拉取下远程的仓库,然后看看我们的容器能否跑起来...
2018-09-10 18:06:35
223
原创 第一篇:docker 简单入门(一)
本篇目录写在最前面的话 docker概念介绍 镜像的概念、容器的概念 docker的安装介绍写在最前面的话 大家好,首先跟大家说声对不起,我班门弄斧了,我本身是做系统开发,使用的语言是C#和JAVA这两类,再多了的编程语言真的是没有精力去学习。docker这门应用技能断断续续的学习着,不精通。是能说我熟悉它,我能使用它。我能简单理解它。所有接下来如果有哪里有写错的地方,大家可以留...
2018-09-10 18:02:11
285
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人