- 博客(418)
- 资源 (2)
- 收藏
- 关注

原创 快速入门——深度学习理论解析与实战应用
1. 前言记得是 2016 年 3 月 15 日,红色石头坐在下班的地铁上,跟往常一样,打开手机,看看新闻。突然,一条醒目的新闻吸引力我的注意:《AlphaGo 最终局战胜李世石 人机大战总比分 1:4》!虽然,我之前也知道一点 AlphaGo,但是这条新闻着实让我比较惊讶。因为,它标志着人工智能第一次在围棋领域战胜了世界大师级别的选手!机器要逆天了?!AlphaGo 是谁?Alpha...
2018-07-11 21:01:54
14051
13

原创 完结篇 | 吴恩达deeplearning.ai专项课程精炼笔记全部汇总
个人网站:红色石头的机器学习之路 优快云博客:红色石头的专栏 知乎:红色石头 微博:RedstoneWill的微博 GitHub:RedstoneWill的GitHub 微信公众号:AI有道(ID:redstonewill)从去年8月份开始,AI界大IP吴恩达在coursera上开设了由5们课组成的深度学习专项课程,掀起了一股人工智能深度学习热潮。这...
2018-05-05 18:13:43
70260
12
原创 终于等到了!国产神器上线,大模型开发者的“外挂”来了。。。
在技术网站发布本人真实的测评报告/使用tips/实际场景应用实例等经验帖,并提交到官方(下方海报二维码),通过验收的高质量测评可获得最高千元激励金。在 2D 平板受载问题求解中,飞桨。框架 3.0 自动并行训练 Llama2-13B 模型时,性能达 2055.8 tokens/秒,相比手动并行提升 5%,对比竞品 PAI 框架更是领先 28.3%以 DeepSeek R1 模型为例:。开发者无需精通底层通信逻辑,只需标记张量切分方式,框架自动推导最优并行策略,真正实现“写单卡代码,跑多卡训练”
2025-04-03 16:33:00
143
原创 【李宏毅-生成式AI导论2024】公认最好的LLM大模型教程!
李宏毅教授的《生成式AI导论2024》是2024年春季在台湾大学开设的一门系统性课程,重点围绕生成式人工智能(Generative AI)的基础理论、技术演进及实践应用展开。
2025-03-24 13:57:42
293
原创 全网疯抢的顶配 AI 神器!比肩 DeepSeek 让 AI 生图简单到离谱!
大家好,我是红色石头。前几天我的家庭群里突然炸锅:12岁的小弟居然@我:"哥哥,B 站上都在推狸谱 App,这玩意儿是干啥的?" 紧接着,表妹甩出截图:"这不就是那个能一键生成二次元图的神器吗!"从 B 站 UP 主到普通动漫迷,狸谱 App 彻底火出圈了。但问题来了:普通人如何体验这款二次元 AI 神器?直到上周,圈内大佬丢给我发了信息:狸谱 App 最新更新了"细腻 2.0",号称"最好用的手...
2025-03-04 10:54:40
323
原创 刚刚!DeepSeek-R1 满血版,来了!
大家好,我是红色石头。今年春节开始,从开发者到普通用户,DeepSeek 彻底出圈了。但问题来了:普通人怎么用上顶配版 DeepSeek-R1 还能不卡顿?直到上周,圈内大佬丢给我个链接:火山引擎居然接入了 DeepSeek-R1 671B 满血版,而且"免登录、UI 超简单、延迟低至 20ms"。我这个 AI 工具老司机当场实测,结果……这玩意儿简直是 DeepSeek 用户的福音!直达车先上:...
2025-02-27 10:54:22
795
原创 手把手薅到 DeepSeek-R1 671B 满血版,白嫖真香!
大家好,我是红色石头。前几天家庭群里突然炸锅:60 岁的老妈居然@我:“儿子,朋友圈都在转 DeepSeek,这玩意儿是干啥的?” 紧接着,表弟甩出截图:“微信刚接入的 AI 就是它!”从科技博主到广场舞阿姨,DeepSeek 彻底火出圈了。但问题来了:普通人怎么用上顶配版?直到昨天,圈内大佬丢给我个链接:问小白居然接入了DeepSeek-R1 671B 满血版,号称“不卡、零延迟、不限次、全免费...
2025-02-23 10:54:34
377
原创 保姆级教程:30 秒部署 DeepSeek R1!供全民使用!
大家好,我是红色石头。最近 DeepSeek-R1 有多火就不用我再多费口舌形容了,但是官方网页版仍然不稳定!连续问两次必定会提示“服务器繁忙,请稍后再试”,真的很让人头疼。。。不过,因为 DeepSeek 是开源的,所以很多人想到了可以本地部署 R1,网上的资源也很多,我之前也专门写过文章发过教程。但是,很多小白曾经天真地以为,本地部署一个 DeepSeek R1 模型,无非就是买几块显卡、装...
2025-02-18 20:02:13
760
原创 通俗理解 K 近邻分类算法
引言想象一下,你是一个新学生,刚到学校,想找到一群志同道合的朋友。你可以观察班里的同学,根据他们的衣着、行为和喜好来判断谁更可能成为你的好朋友。这其实是我们在日常生活中分类的一个例子。在机器学习中,有一个类似的算法叫做K 近邻算法(K-Nearest Neighbors, KNN)。这个算法的核心思路是:物以类聚,人以群分。它通过计算数据点之间的距离,找出与目标数据点距离最近的 K 个邻居,并根据...
2024-12-06 10:54:27
1082
原创 真是“离谱”!一键 AI 把宠物"灵魂提取"成二次元角色!狸谱彻底爆了!
最近,我在二次元交流群里被刷屏了!大家都在疯狂分享用微信小程序狸谱新出的《灵魂提取器》把自家猫猫狗狗变成二次元角色的作品。作为一个程序员,我第一反应是:这 AI 玩得有点意思啊!抱着尝鲜的心态,我决定拿家里那只"优雅"的猫咪试试。没想到,我立马被这个神器吸引住了!还记得前段时间刷爆全网的《换你来当爹》吗?没错,这次的《灵魂提取器》正是出自同一个团队 —— 狸谱。作为AI大模型公司"阶跃星辰"的生态...
2024-12-05 10:54:41
964
原创 训练大模型,这次竟卡在没图这里了。。。
作为一个 10 年经验的 AI 从业者,我一直相信这条铁律:在训练 AI 模型时,数据就是核心,不管是深度学习目标检测、图像分类、大模型训练,都毫无疑问需要大量图像样本作为支撑。可是,想要从网上抓到足够多的高质量图像数据,并不是一件轻松的事。直接使用爬虫爬取网络图片是常规办法。但是,直接暴力的爬虫方法可能会面临各种问题:1、IP 封禁:如果一个 IP 频繁访问同一个网站,尤其是短时间内抓取大量图片...
2024-11-22 10:55:39
638
原创 深入理解机器学习中的正则化
引言在构建机器学习模型时,常常需要在模型的复杂度与泛化能力之间找到平衡。模型过于简单会导致欠拟合,而模型过于复杂又容易过拟合。正则化技术就是为了解决这一问题,它通过在模型的损失函数中加入额外的惩罚项,从而控制模型的复杂度,使得模型不仅能在训练数据上表现良好,还能有效地泛化到未见过的测试数据上。这篇文章将重点讨论机器学习中的L1 正则化(Lasso)和L2 正则化(Ridge)。1. 什么是正则化?...
2024-11-16 16:29:47
743
原创 深入理解机器学习中的欠拟合与过拟合
引言在机器学习中,构建一个能够很好泛化的模型至关重要。我们希望模型不仅能在训练数据上表现优秀,还能在未见过的测试数据上取得相似的结果。然而,这个过程中我们常常会遇到两个常见的问题:欠拟合(Underfitting)和过拟合(Overfitting)。欠拟合就像是学生只看了课本的封面就去参加考试,没掌握足够的知识,导致考试成绩糟糕。过拟合就像是学生死记硬背了课本上的所有例题,却没有真正理解问题的本质...
2024-11-10 16:29:26
1132
1
原创 全面盘点逻辑回归模型的 5 大评估指标
引言逻辑回归(Logistic Regression)是一种常用的分类算法。它的核心思想是通过一个线性模型来预测事件发生的概率,并使用逻辑函数(Sigmoid 函数)将结果映射到 [0, 1] 之间。在这篇文章中,我们将深入讨论逻辑回归模型的评估指标,包括准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1 Score)以及ROC-AUC曲线。1. 常见...
2024-11-01 14:39:40
1280
原创 深入理解逻辑回归算法理论与实战
引言在机器学习中,逻辑回归(Logistic Regression)是一种常用的分类算法,尤其适用于二分类问题。尽管名字中有“回归”二字,逻辑回归的主要目的是进行分类,而不是回归。逻辑回归通过使用线性模型来预测某个事件发生的概率,例如预测一封邮件是否是垃圾邮件、客户是否会购买产品等。本文将深入探讨逻辑回归的理论基础、数学公式、参数含义,以及如何使用梯度下降算法来实现这一模型。1. 逻辑回归的理论基...
2024-10-31 10:54:47
795
原创 深入浅出梯度下降算法
引言在机器学习中,梯度下降算法(Gradient Descent)是一个重要的概念。它是一种优化算法,用于最小化目标函数,通常是损失函数。简而言之,梯度下降帮助我们找到一个模型最优的参数,使得模型的预测更加准确。本文将深入探讨梯度下降算法的原理、公式以及如何在Python中实现这一算法。1. 梯度下降算法的理论基础1.1 什么是梯度?在数学中,梯度是一个向量,表示函数在某一点的变化率和方向。在多维...
2024-10-29 11:09:53
929
原创 回归模型评估指标
引言在机器学习中,回归模型用于预测连续数值,例如房价、温度或销售额。构建一个回归模型后,评估其性能至关重要。如何判断模型预测的准确性和可靠性?这就需要用到回归模型的评估指标。1. 常见的回归模型评估指标1.1 均方误差 (MSE)均方误差 (Mean Squared Error) 是最常用的回归模型评估指标之一,它计算模型预测值与真实值之间差异的平方的平均值。公式如下:其中:是真实值。是预测值。是...
2024-10-24 10:54:47
1537
原创 深入理解多项式回归理论与实战
引言在机器学习中,回归分析是一种用于预测的统计方法,而简单线性回归适用于自变量和因变量之间存在线性关系的情况。但在许多实际问题中,变量之间的关系往往不是简单的线性关系,而是更复杂的非线性关系。此时,多项式回归(Polynomial Regression)可以作为一种有效的解决方案,它能够通过多项式的形式来建模和预测数据。1. 什么是多项式回归?多项式回归是一种扩展的线性回归模型,它可以通过引入自变...
2024-10-22 10:54:56
1166
原创 深入理解简单线性回归理论与实战
引言在机器学习和统计学中,简单线性回归是一种基础而强大的工具,用于建立自变量与因变量之间的关系。假设你是一个房产中介,想通过房屋面积来预测房价。简单线性回归可以帮助你找到房屋面积与房价之间的线性关系,进而为客户提供更合理的报价。本文将带你深入了解简单线性回归的理论基础、公式推导以及如何在Python中实现这一模型。1. 简单线性回归的理论基础简单线性回归的基本假设是,因变量 Y(例如房价)与自变量...
2024-10-19 10:54:15
667
原创 机器学习中的数据预处理:从原始数据到模型输入
引言机器学习中,数据预处理是一个至关重要的步骤。原始数据通常包含许多噪声、缺失值和不适合直接使用的格式。没有良好的数据预处理,模型的表现可能会大打折扣。本文将带你逐步了解数据预处理的几个关键步骤,包括如何导入数据集、处理缺失值、类别特征编码、划分训练集和测试集以及标准化。一、导入数据集在Python中,通常使用pandas库来导入和处理数据。pandas提供了强大的数据结构和函数,使数据操作变得简...
2024-10-18 10:54:28
859
原创 从零开始搭建机器学习开发环境:PyCharm与Anaconda教程
引言今天,我将带你一步步完成 PyCharm 和 Anaconda 的安装与配置。Anaconda 是一个开源的Python发行版,带有丰富的数据科学工具集(包括NumPy、Pandas、Matplotlib、SciPy等),并且可以轻松管理虚拟环境。PyCharm 是一个功能强大的Python集成开发环境(IDE),支持代码调试、版本控制、代码补全等功能,极大地提高了开发效率。一、为什么选择An...
2024-10-17 10:54:37
1500
1
原创 本硕 C9 计算机毕业:没有 996,一年到手 18 万,在电网待了 1 年后,肠子都悔青了......
“在电网待了 1 年,却后悔了!”近日,一位刚工作一年多的博主发了一条让人有些纠结的帖子,内容如下:这位楼主曾是 C9 高校计算机专业的本硕毕业生,毕业的时候,他并没有选择互联网大厂,而是出人意料地“躺平”了,来到了苏南的一家供电局工作。现在他每天工作稳定,朝九晚五,不需要担心 996 的焦虑,年薪也有 18 万左右。在很多人眼里,这无疑是一份“神仙工作”。可电网的工作虽然稳定,但日复一日,他感觉...
2024-09-04 10:55:06
1078
原创 这是游戏科学创始人的履历,从网瘾少年到《黑神话:悟空》全球狂揽 15 亿。。。...
有谁能想到,一个曾经沉迷于《魔兽世界》、险些考研失败的网瘾少年,竟然能够在十年后带领他的团队创造出一款斩获 15 亿收入的国产单机游戏《黑神话:悟空》?看完了【扬声】栏目对《黑神话:悟空》创作人冯骥的采访,我对这位游戏科学的创始人充满了好奇。一、初识冯骥:从学霸到“网瘾少年”冯骥的故事从华中科技大学开始。这个毕业于生物医学工程专业的学霸,原本应该在实验室里搞科研、做研究,但他的职业生涯却偏离了轨...
2024-08-24 16:29:16
1332
原创 一口气读完马斯克 8 小时访谈,bigmodel 居然能搞定 100 万长文本。。。
最近,公司业务上对长文本的需求显著增加,因为在 prompt 中需要塞入大量的 RAG 内容,供决策使用。这些召回的内容都有可能在决策过程中被用到,因此对大模型处理长文本的能力提出了更高的要求。在技术选型时,特别需要重点考察模型在处理长文本方面的表现。在总结收集各家大模型的“长文本”能力时,测试了市面上几款主流大模型,我发现它们普遍存在两个主要不足:首先,有些模型能够处理的文本长度仍然有限。尽管某...
2024-08-19 17:08:02
1253
原创 亮数据:大模型训练效率提升100%
近两年来,AI 工具和大模型在全球迅速崛起,逐渐渗透到各行各业。无论是智能助手、数据分析,还是图像识别和自然语言处理,AI 工具的易用性使得越来越多的人可以轻松上手。与此同时,得益于开源社区和云计算的发展,训练大模型不再是大公司的专利。个人用户如今也可以利用现成的工具和平台构建自己的 AI 模型,无论是出于研究、创业还是个人兴趣。一、大模型训练基石:数据在训练大模型的过程中,数据扮演着至关重要的角...
2024-08-16 10:54:44
1354
原创 小小橙篇,直接把我整个硬控住了!
作为一名 AI 知识型博主,之前学习一些专业知识,需要搜索大量博客、付费购买专业课程等。找资料就会花费很长时间,还要阅读全文、整理汇总,真的会耗费不少精力。不得不说,一款优秀的、适合自己的 AI 工具真的太重要了!不仅能大大提高我们日常学习、工作效率,还能给我们节省更多的“躺平”、“摸鱼”时间~到目前为止,我尝试过国内外十几种 AI 产品,包括目前营销铺天盖地的 Kimi。尽管如此,用起来总感觉不...
2024-07-31 10:54:25
604
原创 太炸裂了!还得是讯飞。。。
就在刚刚,星火大模型又双叒叕要升级了!最新消息:讯飞星火大模型的 4.0 版本已于 27 号正式发布。这个新版本在底座能力上将全面与 GPT-4 Trubo 相匹敌,特别是在语音和图文识别方面,其性能有望实现显著飞跃。总之主打的就是:一个免费、功能强大、无需魔法开箱即用,对小白极度友好!6月26日,讯飞星火 APP 也推出了其最新版本4.0,我立刻进行了更新。官方使用入口:https://xing...
2024-06-28 09:02:00
973
原创 天工 AI 3.0,彻底爆了!
作为一名 AI 博主,深知一个优秀的AI工具能大大提高我们日常学习、工作效率,比如我之前学习一些AI方向的算法知识,需要搜索大量博客、付费购买专业课程等。光在找到有用的资料就耗费不少时间了,更何况需要阅读全文去整理汇总,这对于个人的精力也是一种挑战。但如今,大模型的爆发已经持续很长时间了,相信不少朋友都已经用过各色各样的AI软件。但是整体体验下来或多或少还是有些人工智障。但是天工AI,在AI搜索...
2024-05-25 16:29:36
1759
原创 MiniMax 悄咪咪上线的这款 AI 产品,好用到爆炸!
大模型太卷了!上周国外某款多模态大模型的出现,立刻掀起了 AI 领域对话式多模态交互的热潮。不管是文字、语音,还是图片,都能与你进行实时交互。随后,谷歌也推出了类似的 Astra。然而,国外的交互式大模型,都存在一定的使用门槛。想用就用还真不是一件容易的事!好消息来了!一款具备相似功能的强大又低调的AI应用也悄然进行了更新。它就是——海螺 AI。这款产品是由大模型公司MiniMax推出的,主...
2024-05-24 11:07:23
1070
原创 中国唯一!阿里云入选 UEC 技术委员会,携手微软、思科等打造 AI 网络基础设施...
各位小伙伴,今天咱们要聊一个大新闻!阿里云,国内 TOP 科技企业,成功入选了超以太网联盟(Ultra Ethernet Consortium, UEC)新一届技术委员会(TAC),成为唯一一家入选的中国企业。是的,你没看错,这不仅是科技圈的头条,也是中国企业的骄傲呀!作为一名阿里云使用者,我觉得必须给大家来一波硬核解析,咱们一起来感受这份荣耀背后的硬实力。一、超以太网联盟(UEC)简介说起超以太...
2024-05-15 10:56:01
1071
1
原创 太炸裂了!还得是讯飞...
大家好,我是红色石头!这几天突然感慨:大模型发展太快了!几个月前还是 ChatGPT 一枝独秀,如今国内的大模型如雨后春笋版涌现,而且发展势头愈来愈强。不少人可能有这样的疑虑:国产大模型这么多,应该选择哪一个?几个月前,科大讯飞发布了星火认知大模型。作为第一批体验星火的用户,实话说效果性能还是很不错的,特别是对中文的支持。如果你还没有体验的话,可以从我这里获得体验入口!官方注册入口:作为第一批讯飞...
2024-01-22 14:29:20
1125
原创 腾讯员工:能查到年终奖了,111354 元!
年关将至,互联网热议的话题,又要来到了一年一度的年终奖环节。这不,近日有鹅厂员工已经开始晒年终奖了。一看金额:111354元。属实让人羡慕~腾讯的同事们,可以尽早查询一下了,你们的年终奖数额应该已经敲定了!不得不说,腾讯的年终奖发放速度和数额令人羡慕,预计其他大型企业的员工也会开始秀出自己的年终奖。但是并非每个员工都能轻松查询到这些信息。要获得这些数据,需要公司进行报税,然后才能查看。各公司各部门...
2024-01-01 14:41:36
887
原创 效率提升 100%,一款效果炸裂的白板神器!
大家好,我是红色石头!今天给大家分享一个开源的手绘图神器:excalidraw。不管是学生还是工作人员,我们在日常的工作学习中经常要记笔记,如果有一款优秀的电子白板用来绘图或者记笔记,那将会大大提高我们的工作学习效率!之前我也一直在寻找这样的白板绘图记笔记的工具,前几天逛 GitHub 的时候,就发现了一款神器:Excalidraw。试用起来就两个字:好用!一、简介Excalidraw是一款开源的...
2023-10-30 10:54:16
339
原创 GPT-4 终于开放了!
2023年,OpenAI的ChatGPT已经成为了一个不可忽视的存在。作为一种基于GPT模型的聊天机器人,ChatGPT在过去的一年多时间里里取得了令人瞩目的进步。从最初的简单问答,到现在能够进行深度对话,甚至可以执行代码,ChatGPT的能力在不断扩展,其发展速度之快,超出了许多人的预期。这不仅是技术进步的体现,也预示着人工智能正在逐步改变我们的生活。7 月 7 日,OpenAI 针对 Chat...
2023-07-08 10:54:35
549
原创 泰酷辣!有人把 81 个国内大模型汇总在一张图里!
在科技的世界里,一场革命正在悄然进行。这场革命的主角,就是我们今天要讲的“大模型”。这些大模型,就像一群巨人,正在各个领域中挥舞着他们的力量,引领着一场前所未有的技术变革。在国内,这场大模型的研发热潮正在如火如荼地进行。这些大模型的名字各具特色,有的高大上,有的接地气,有的历史悠久,有的寓意深远。他们的出现,让我们感觉仿佛是在观看一场“百模大战”。最近,有网友在Github上列出了81家的大模型,...
2023-06-28 11:09:42
2336
原创 刚刚,吴恩达 ChatGPT 新课三连发!
你有没有想过,你可以自己构建一个AI系统,或者开发一个使用大语言模型(LLM)的应用,甚至理解并创建扩散模型?我在吴恩达的三门新课程中找到了答案,这些课程让我看到了AI的无限可能性。好消息!就在昨天,吴恩达在推特上宣布三门新的生成式AI课程上线。这三门课分别是:《使用OpenAI的ChatGPT API构建系统》《LangChain用于LLM应用开发》《扩散模型如何工作》一、ChatGPT API...
2023-06-02 10:51:56
879
原创 突然放大,Midjourney 来中国了!
突然放大,Midjourney 来中国了!一、 Midjourney内测版本的推出Midjourney,一款新颖的 AI 视觉艺术平台,近日在中国开放了内测版。这个内测版本在 QQ 频道上进行,每周一和周五的 18:00 开放入口,人数一旦满足,入口就会关闭,直到下次开放。用户只需扫描二维码,即可进入进行体验。二、 功能丰富,用户体验升级内测版功能丰富,虽然部分功能只对会员开放,但大部分功能对所有...
2023-05-17 10:51:11
1042
原创 桌面版 ChatGPT 来了!
由于工作、学习需要,现在基本上每天都要使用几个小时的 ChatGPT。一直以来的方法就是登录 OpenAI ChatGPT 的 web 版:http://chat.openai.com/每天登录网页比较麻烦,如果能有一个桌面应用就方便了!今天就给大家推荐一个 ChatGPT 的桌面版应用:ChatGPT Desktop Application!ChatGPT Desktop Application...
2023-05-07 12:10:48
11484
5
原创 一款可以让 ChatGPT 联网的神器!
我们知道,不论是 GPT-3.5 还是 GPT-4.0,他们的知识库都是截至到 2021 年 9 月的。还无法实现即时联网并获取最新的咨询信息。我之前在星球分享过的谷歌浏览器插件 ChatGPT for Google,可以在进行谷歌网页搜索的同时,获取 ChatGPT 的回答。但是 ChatGPT 依然无法联网。今天分享一个可以让 ChatGPT 联网的神器,真正做到了 Google+ChatGP...
2023-04-22 10:51:13
5913
1
原创 比微信还方便,一键导出你与 ChatGPT 的聊天记录,而且是 Markdown 格式!
需求:我们知道 ChatGPT 是文本形式输出内容。在有时候与 ChatGPT 进行交谈的过程中,遇到 ChatGPT 提供的有价值的信息,我们通常想要把整个对话内容保存起来或者复制到别的地方展示。一般的方法就是将整个对话框截图,或者一段一段话复制,非常麻烦!面对这种问题,如果能够将整个 Chat 对话框所有内容保存为一种格式,以文件的形式保存下来就好了!而 Markdown 就是一种很好的文件格...
2023-04-12 10:51:54
11351
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人