人工智能_Ann's Blog的博客-优快云博客

人工智能

关注

文章平均质量分 90

作者: Ann's Blog

是个小白。啥也不会。

展开

无显卡也能AI作画 | Colab + Stable Diffusion WebUI

本文是教你如何白嫖谷歌GPU，使用colab搭建自己的Stable Diffusion WebUI。

原创 2023-04-03 18:23:58 · 19144 阅读 · 1 评论
【翻译】图解Stable Diffusion

扩散”指的是下图中粉色这一块组件“图像信息生成器”中发生的处理过程。该组件获取能表示输入文本信息的token嵌入和一个随机初始化的图像信息张量（aka 潜变量），然后用它们生成一个信息张量，把这个信息张量交给图像解码器，去生成最终的图像。这个过程是一步一步进行的，逐步添加相关信息。想更直观的了解这个过程的话我们可以去检查随机潜变量那个张量，可以看到它逐步转变为图像噪声。这个检查过程需要借助图像解码器进行。

原创 2023-03-17 15:31:33 · 3848 阅读 · 0 评论
【翻译】GPT-3是如何工作的

在科技界我们可以看到很多关于GPT-3的新闻。大型语言模型（比如GPT-3）已经展示出让我们惊讶的性能。虽然对于大部分企业来说想让GPT-3落地还是比较困难的，这些功能不完全可靠的模型还是不能摆到用户面前的，但是这些大模型的出现展示出了加速自动化进程和智能计算机系统的前景。接下来让我们扒一扒GPT-3，看一看它神秘光环背后是如何训练和工作的。

原创 2023-03-08 00:24:06 · 2002 阅读 · 0 评论
图解BERT、ELMo（NLP中的迁移学习）| The Illustrated BERT, ELMo, and co.

2018年是NLP模型发展的转折点。我们不断探索单词和句子的表示方法，以求能最好地捕捉其中潜在的语义和关系。此外，NLP领域已经提出了一些功能强大的组件，你可以免费下载，并在自己的模型和pipeline中使用它们（这被称为NLP领域的ImageNet时刻，类似的发展在几年前也是这么加速计算机视觉领域的机器学习的）。............

原创 2022-07-17 22:51:02 · 7014 阅读 · 11 评论
图解自注意力机制

写在最前边这个文章是《图解GPT-2 | The Illustrated GPT-2 (Visualizing Transformer Language Models)》的一部分，因为篇幅太长我就单独拿出来了。当然如果你只想了解自注意力机制也可以看看本文章的前半部分，这篇文章属算是入门科普读物了，不需要太多知识铺垫。后半部分主要是讲masked self-attention在GPT-2中的应用，不了解GPT-2的可以忽略这部分内容。我补充的内容格式如下：正文看一下下图，下图表示的是注意力处理输入序列的单词

原创 2022-07-06 20:33:52 · 18377 阅读 · 3 评论
Recurrent vs. Recursive Neural Networks | 递归神经网络和循环神经网络的RNN之争

写这个文章的原因是我又遇到了Recurrent和Recursive。我读了一个论文，开始的时候我心里默认是RNNs（Recurrent），但是读到文章最后发现作者写的是RNN（Recursive）。所以翻译一下这段文字顺便写一下二者的区别。...

原创 2022-06-30 21:11:08 · 2153 阅读 · 0 评论
图解GPT-2 | The Illustrated GPT-2 (Visualizing Transformer Language Models)

这是我翻译这位大佬的第二篇文章了，我计划是翻译四篇，（Transformer、BERT、GPT-2、GPT-3），翻译授权见最后。之前的工作：图解transformer | The Illustrated Transformer今年，我们看到了机器学习令人眼花缭乱的一些应用。OpenAI的GPT-2展现出了惊人的写作能力，其生成内容的连贯且富有感情，超出了我们对目前语言模型的预期。GPT-2其实并不是一种新型架构，他的结构类似于只有解码器的Transformer。GPT-2是一个基于Transformer的

原创 2022-06-29 23:21:30 · 16056 阅读 · 11 评论
有了 screen 和 nohup 跑深度学习代码再也不用愁了 | 退出终端不会影响服务器程序代码运行

在服务器上跑深度学习代码，xshell断开代码就挂掉了。如何能在服务器运行程序的时候即使关闭终端也不会影响代码呢？我用的是screen和nohup在终端输入然后它会关闭你当前窗口，弹出一个新窗口，可能选项卡名字叫screen（我用的xshell，不同软件可能有差异）。你在新弹出的窗口运行你的程序就行了。你可以直接关闭xshell等终端断开连接，去干别的事。下图可以看到虽然选项卡名字变了，但它还是88 99 服务器。如果你不需要断开连接，还想用服务器做别的事情，...............

原创 2022-06-08 13:46:40 · 2733 阅读 · 6 评论
分类评价指标 F值详解 | Micro F1 & Macro F1 & Weight F1

之前写一个作业样本不均衡问题。然后查了很多文章都说要更换评价指标，不能再使用准确率了，要计算F值。我看了一下F值怎么计算，看了挺多文章的，但是感觉说的比较迷惑，或者说法比较拗口。最后还是自己再总结一个。查准率、查全率、F值我们平时对于一个模型预测的准不准，我们最先想到的是用准确率(Accuracy)进行评价。A=truetotalA = \frac{true}{total}A=totaltrue这个虽然常用，但不能满足所有任务的需求。所以我们可以引入查准率和查全率。查准率(Preci.

原创 2022-05-25 10:54:12 · 10555 阅读 · 8 评论
图解Transformer | The Illustrated Transformer

写在最前边看transformer相关文章的时候发现很多人用了相同的图。直到我搜到作者的原文……于是决定翻译一下无删改的原文。翻译讲究：信、达、雅。要在保障意思准确的情况下传递作者的意图，并且尽量让文本优美。但是大家对我一个理工科少女的语言要求不要太高，本文只能保证在尽量通顺的情况下还原原文。作者博客：@Jay Alammar原文链接：The Illustrated Transformer原文翻译在之前的文章中，我们讲了现代神经网络常用的一种方法——Attention机制。本文章我们来介绍

原创 2022-04-23 10:01:23 · 37403 阅读 · 58 评论
你真的会用K折交叉吗？对于K折交叉的思考 | K折交叉的坑

本文目的：对于K折交叉，想必大家都知道是什么原理。但是在具体实践中让你写的时候，你可能就会突然疑惑：“咦？道理我都懂，可是这个玩意儿到底怎么用。”本文就是为了探讨一下什么时候怎么用 K折交叉验证。文章目录K折交叉(k-fold cross validation)方案1 不预先分出测试集方案2 提前分出测试集分析所以什么时候用哪种？作者碎碎念，本文的写作初衷K折交叉(k-fold cross validation)提到K折交叉，我想大部分人都了解其原理了。但是在这里还是先讲一下什么是K折交叉，防

原创 2022-04-22 21:10:30 · 3740 阅读 · 12 评论
Transformer 结构详解：位置编码 | Transformer Architecture: The Positional Encoding

😎使用正弦函数为模型添加位置信息什么是位置编码？为什么我们需要位置编码。提出的方法The intuition其他细节相对位置FAQ为什么位置编码是和词嵌入相加而不是将二者拼接起来？位置信息层层传递之后不会消失吗？为什么同时使用正弦和余弦？总结原文信息References使用正弦函数为模型添加位置信息Transformer是只基于自注意力机制的序列到序列架构。因为并行计算能力以及高性能。使得它在NLP领域中大受欢迎。

翻译 2022-04-22 13:40:44 · 14181 阅读 · 12 评论
神经网络中如何确定隐藏层的层数和大小

在前馈神经网络中，隐藏层的数量和层数的确定尚无依据，一般是由经验决定。查阅了大量相关的文章之后我对其进行了综合梳理。这里需要明确的一点是，这些只是根据经验提出的一些参考的方法，具体的层数和大小还是要在实际实验中进行验证。二分类问题方法出自：Beginners Ask “How Many Hidden Layers/Neurons to Use in Artificial Neural Networks?”对于二分类比较好理解。先看下边这两类，我们只需要一条斜线就可以完成映射。所以不需要隐藏层，直接

原创 2022-03-29 19:37:20 · 25121 阅读 · 10 评论
详细解析从Attention到Transformer

详细解析attention、self-attention、multi-head attention、transformer。

原创 2022-03-17 20:21:54 · 2189 阅读 · 2 评论
详细解析图像处理直方图均衡化计算

看一个图了解一下什么是直方图均衡化：第一个图灰度都集中在左边，整体图像较暗第二个图灰度都集中在右边，整体图像较亮第三个图灰度都集中在中间，整体图像适中，但是雾蒙蒙的并不清晰最后一个图是均衡化之后，让灰度相对均匀地占据各个灰度级，图片亮暗合理的同时也更清晰用个经典例子看一下计算：假设有一幅图像，共有64×64个像素，8个灰度级，各灰度级概率分布见下表：rkr_krk：灰度级，比如0~255，本题中是0~8nkn_knk：整幅图像里有多少个像素属于该灰度级p(rk)p(r

原创 2021-12-29 18:08:45 · 29299 阅读 · 9 评论
为什么需要激活函数？

在整理笔记。为什么需要激活函数呢？用下边这个神经网络分析一下：对于上图：我们知道其中X4×1H5×1O7×1X^{4 \times 1} \quad H^{5 \times 1} \quad O^{7 \times 1}X4×1H5×1O7×1其中各层之间的计算：H=W1x+b1其矩阵是：[H]5×1=[w1]5×4[x]4×1+[b1]5×1O=W2H+b2其矩阵是：[O]3×1=[w2]3×5[H]5×1+[b2]3×1\begin{array}{ll}H=W_{1} x+b_{1}

原创 2021-11-12 16:45:18 · 1577 阅读 · 0 评论
python + opencv 中值滤波器、最大值滤波器和最小值滤波器

中值滤波器中值滤波器好说，opencv自带和函数就能直接用。在OpenCV中，实现中值滤波的函数是cv2.medianBlur(src, ksize)src：图片位置kszie：卷积核大小import cv2 as cvimg = cv.imread('d:/Desktop/1.jpg') # 我的桌面上有个1.jpgres = cv.medianBlur(img, 5)cv.imshow("original", img)cv.imshow("result", res)cv.wai

原创 2021-10-04 23:09:30 · 6625 阅读 · 0 评论
Python + openCV获取灰度图的三种方式

需要用到的代码：import cv2 as cvimport matplotlib.pyplot as plt# 读入图片img = cv.imread(src,0)# 显示图片cv.imshow("img", img)cv.waitKey(0)文章目录cv.imread()cv.cvtColor分离rbg分别获得灰度图cv.imread()使用imread(‘图片地址’,flag)可以直接将彩色图片显示为灰度图。flags = -1：imread按解码得到的方式读入图像f

原创 2021-09-29 21:19:21 · 7474 阅读 · 0 评论
如何阅读NLP文献

search papers and group them检索工具ACL Anthology 各种会议文章集合，连会议带年份。进去搜索自己需要的关键词即可。当然会有延迟。并不是会议出来就直接能看到。限定文献检索：arXivarXiv是由康奈尔大学运营维护的一个非盈利的数据库，由于免费，学术研究人员可以在其他顶会或者期刊没有录用之前，将自己最新的研究成果发布到该平台上，一方面是为了扩大宣传提升自己的影响力；另外一方面是为了保护自己的科研成果，因为无论会议和期刊从投出到最终可以检索，都需要长

原创 2021-09-11 20:53:06 · 1233 阅读 · 9 评论
Programming Exercise 2: Logistic Regression

题目要求及材料下载链接：Coursera下载地址没用的信息略过，有用的翻译一下。本练习中包含的文件： ex2.m - Octave/MATLAB脚本 ex2_reg.m - Octave/MATLAB脚本，用于练习 ex2data1.txt -练习前半部分的训练集 ex2data2.txt -练习后半部分的训练集 submit.m -交作业脚本 mapFeature.m -函数生成多项式特征 plotDecisionBoundary.m -绘制决策边界 plotDat

原创 2021-08-26 23:53:14 · 576 阅读 · 0 评论
Programming Exercise 1: Linear Regression

题目要求及材料下载链接：Coursera下载地址没用的信息略过，有用的翻译一下。本练习需要的文件我已经打钩了。 x1.m - Octave/MATLAB脚本，引导你完成练习 ex1 multi.m - 练习后面部分的Octave/MATLAB脚本 ex1data1.txt - 单变量线性回归数据集 ex1data2.txt - 多变量线性回归数据集 submit.m - 交作业的脚本 * warmUpExercise.m - Octave/MATLAB中的简单示例

原创 2021-08-17 20:41:40 · 723 阅读 · 0 评论
Octave简明教程

老师推荐人工智能最简单入手的是octave，用它写出来之后再转用python、c++会更方便。简介GNU Octave is a high-level language primarily intended for numerical computations. It istypically used for such problems as solving linear and nonlinear equations, numerical linearalgebra, statistical an

原创 2021-08-15 23:29:57 · 5861 阅读 · 0 评论

人工智能

作者: Ann's Blog

无显卡也能AI作画 | Colab + Stable Diffusion WebUI

【翻译】图解Stable Diffusion

【翻译】GPT-3是如何工作的

图解BERT、ELMo（NLP中的迁移学习）| The Illustrated BERT, ELMo, and co.

图解自注意力机制

Recurrent vs. Recursive Neural Networks | 递归神经网络和循环神经网络的RNN之争

图解GPT-2 | The Illustrated GPT-2 (Visualizing Transformer Language Models)

有了 screen 和 nohup 跑深度学习代码再也不用愁了 | 退出终端不会影响服务器程序代码运行

分类评价指标 F值 详解 | Micro F1 & Macro F1 & Weight F1

图解Transformer | The Illustrated Transformer

你真的会用K折交叉吗？对于K折交叉的思考 | K折交叉的坑

Transformer 结构详解：位置编码 | Transformer Architecture: The Positional Encoding

神经网络中如何确定隐藏层的层数和大小

详细解析 从Attention到Transformer

详细解析图像处理 直方图均衡化计算

为什么需要激活函数？

python + opencv 中值滤波器、最大值滤波器和最小值滤波器

Python + openCV获取灰度图的三种方式

如何阅读NLP文献

Programming Exercise 2: Logistic Regression

Programming Exercise 1: Linear Regression

Octave简明教程

分类评价指标 F值详解 | Micro F1 & Macro F1 & Weight F1

详细解析从Attention到Transformer

详细解析图像处理直方图均衡化计算