
AI master's Road
文章平均质量分 76
记录人工智能学习之路。
Matrix 工作室
为天地立心,为生民立命,为往圣继绝学,为万世开太平。
展开
-
震惊!我竟然在1080Ti上加载了一个35亿参数的模型(ZeRO, Zero Redundancy Optimizer)
在最近几年,虽然大规模预训练模型已经越来越普遍,但是关于如何训练这些模型的内容却很少有人关注,一般都是一些财大气粗的企业或实验室来训练大模型并发布,然后中小型企业以及高校来使用。即便如此也有一些门槛,受限于机器配置,可能效果更好的大模型并不能直接加载到显卡中,或者是单机多卡希望可以通过分布式的方法进行微调。原创 2022-08-22 22:40:25 · 3791 阅读 · 1 评论 -
Hi Azure. 从零开始打造一个语音机器人,跟你的电脑聊聊天。
这篇文章带大家来做一个简单的聊天机器人,碰巧遇到微软Azure招募开发者,可以免费试用人工智能服务,果断申请。先决条件:熟悉 Azure 服务和 Azure 门户(也可以用其它的AI开放平台)拥有 Python 编程经验熟悉API调用序言首先需要了解一下做对话机器人需要涉及到的技术,可以看一下这个流程图。理清思路之后,我们发现涉及到的技术有三种:语音识别、对话式问答、语音合成。简单解释一下这三个技术:语音识别:准确地将口述语音听录为文本,功能演示对话式问答:提取文本信息,并原创 2021-10-18 21:33:45 · 9455 阅读 · 12 评论 -
词共现矩阵
通过统计一个事先指定大小的窗口内的word共现次数,以word周边的共现词的次数做为当前word的vector。具体来说,我们通过从大量的语料文本中构建一个共现矩阵来定义word representation。例子有语料如下:I like deep learning.I like NLP.I enjoy flying.则其共现矩阵如下:此时选的窗口大小为3,选择在该窗口内词汇的共现频率作为vector。将共现矩阵行(列)作为词向量表示后,可以知道like,enjoy都是在I附近且统计数目转载 2021-07-29 08:17:35 · 1859 阅读 · 1 评论 -
【机器学习】离散型特征为什么要用One-Hot编码?
以前专门思考过这个问题,碰巧今天又遇到了,记录一下。数据集中的特征分为离散型特征和连续型特征,在机器学习算法中,特征之间距离的计算是十分重要的,因此,直接把离散变量的取值转换为数值,并不能很好地代表特征之间的距离。比如颜色特征,其总共有棕色、橙色、白色、黄色4种,假设将其映射为1、2、3、4,则棕色和橙色之间的距离是2-1=1,而棕色和白色之间的距离是3-1=2,这显然是不符合实际情况的,因为任意两个颜色之间的距离应该是相等的。因此,需要对特征进行One-Hot编码,简单来讲,One-Hot编码就.原创 2021-07-15 13:07:29 · 1039 阅读 · 0 评论 -
IoU(Intersection over Union)
IoU 原文链接:https://www.yuque.com/huoxiangshouxiangwanghuo/xg3nah/tyl1n2IoU(Intersection over Union)在目标检测任务中,IoU是一个非常重要的概念,它反映了prediction box和ground truth box的贴合程度。在用训练好的模型进行测试时,网络会预测出一系列的predicti...原创 2021-01-28 11:05:58 · 2133 阅读 · 4 评论 -
目标检测(Object Detection)
目标检测基本概念+Yolo介绍 原文地址:https://www.yuque.com/huoxiangshouxiangwanghuo/xg3nah/giwl7l目标检测(Object Detection)在计算机视觉众多的技术领域中,目标检测(Object Detection)也是一项非常基础的任务,图像分割、物体追踪、关键点检测等通常都要依赖于目标检测。在目标检测时,由于每张图...原创 2021-01-23 18:27:04 · 38652 阅读 · 3 评论 -
模型推理加速!融合Batch Normalization Layer和Convolution Layer
模型推理加速!融合Batch Normalization Layer和Convolution Layer我们讨论了如何通过将冻结的batch normalization层与前面的卷积层融合来简化网络结构,这是实践中常见的设置,值得研究。Introduction and motivationBatch normalization (often abbreviated as BN) is a popular method used in modern neural networks as it often原创 2021-01-19 08:53:49 · 968 阅读 · 1 评论 -
卷积神经网络基本概念
卷积神经网络基本概念 最近有一个词特别火啊,那就是“内卷”,我一开始看到还以为是说头发弄卷了呢,但是好像不太对,那么什么是内卷呢?通俗的讲就是内部竞争,内卷是从内卷化而来,内卷化最早是描述农业问题的,本来是一个社会学术语,大意是指社会文化模式发展过程中的停滞。现在很多高校学生用内卷来指代非理性的内部竞争。例如:国际形势不好导致很多本打算出国留学的学生无法成行,因此考研/保研竞争更加激...原创 2021-01-12 10:44:44 · 1332 阅读 · 0 评论 -
Machine Learning Honor Code 机器学习荣誉代码
We strongly encourage students to form study groups, and discuss the lecture videos (including in-video questions). We also encourage you to get together with friends to watch the videos together as a group. However, the answers that you submit for the rev翻译 2020-12-27 16:17:24 · 2605 阅读 · 0 评论 -
引路人工智能
首先,还是自我介绍一下,Alex007,目前在某实验室做机器学习算法可视化平台前端开发。我接触人工智能这个方向差不多也才一年的时间,对于很多大佬来说我连入门都不算,顶多属于刚抬脚的水平。不过我运气比较好,当初跟大四的一起参加校招,不自量力的选择了人工智能算法岗,估计是当时没多少人报,让我捡了个漏。我身边做人工智能这个方向的人也不少,我导师、项目组长、还有我们团队的研究生,经常跟(听)他们交流一些比较前沿的技术,耳濡目染的也会了一些,虽然不会自己做,但拿来装逼还好。好了,闲话就说这么多,接下来我们开原创 2020-10-29 11:03:26 · 675 阅读 · 0 评论 -
买房子,就该用线性回归
美国房价问题Alex经过一年的努力,终于拿到了美国波士顿麻省理工学院的研究生录取通知书,在远离家乡的地方上学,Alex想在波士顿买一套房子,他手头有一些积蓄,在网上找了几套自己满意的房子,但是又不敢相信网上的价格,人生地不熟的,Alex怕被宰,就从自己做数据分析的朋友Bachelor手里要到了过去几年一些有关波士顿房价的资料。import numpy as npimport pandas ...原创 2020-02-10 10:08:22 · 1196 阅读 · 10 评论 -
打击诈骗,逻辑回归闪亮登场
逻辑回归Alex为了买房的事忙活了大半天,终于到了晚饭时间,辛苦了一天,Alex决定犒劳一下自己。突然间想起来,自己的好基友Bachelor帮了大忙,这些数据集都是他给的,得好好谢谢人家,于是把Bachelor叫了出来,去了一家中餐厅,大吃特吃了一顿。吃完之后,Alex去刷卡,结果服务员说信用卡declined。Alex心想:开什么玩笑,老子卡里得钱都能把你们餐厅买下来。于是Ale...原创 2020-02-17 21:35:54 · 1537 阅读 · 4 评论 -
小姐姐教我的 sklearn 逻辑回归
sklearn 逻辑回归Alex一晚上都没睡好觉,被IEEE-CIS Fraud Detection折磨的死去活来,不管怎么调参,用什么样的策略,评分就是上不去,这可不行,什么时候认过输,生死看淡,不服就干!结果:第二天,Alex打算去工作室问问Bachelor,这家伙肯定还藏了不少东西没说,结果Bachelor不知道是因为心虚还是咋的,竟然没来,工作室只有一个肤白貌美大长腿的实习生MM在,...原创 2020-02-24 20:35:45 · 892 阅读 · 9 评论