知识大胖
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
能真正赚钱的Python副业
我如何利用 Python 构建超越小时工规模的收入来源大多数人学习Python是为了找工作,这无可厚非。我学习Python是为了重新掌控自己的时间。过去几年,我一直用 Python 来实现业务自动化,开发小型付费工具,并构建能在我睡觉时赚钱的系统——或者至少我的代码会在我睡觉时帮我完成那些枯燥乏味的部分。这篇文章不是教你“快速致富”,而是教你如何利用杠杆效应。专业提示:如果你的 Python 脚本每天都能帮别人节省时间,总有一天会有人为此付费。原创 2026-01-02 10:14:16 · 23 阅读 · 0 评论 -
使用 Python 进行员工绩效与薪酬分析(Pandas 案例研究)
在现实世界的分析中,洞察力并非来自一张干净的表格。它们来自数据集的连接、智能地处理缺失值以及提出与业务相关的问题。本案例研究简要展示了如何使用 Python 和 Pandas 以结构化、专业的方式分析员工绩效和薪酬。原创 2026-01-01 16:46:53 · 14 阅读 · 0 评论 -
Django 6.0:有哪些新特性以及它们对实际项目的重要性
Django 6.0 感觉像是一个成熟的版本,它基于实际应用案例而打造。它减少了不必要的复杂性,同时扩展了框架的开箱即用功能。升级到 Django 6.0 不仅仅是为了保持版本更新,更是为了构建更易于维护、更安全、更能适应未来发展的应用程序。原创 2026-01-01 16:31:17 · 42 阅读 · 0 评论 -
使用 Python 建模驱动 RLC 电路
RLC 电路由电阻器 ®、电感器 (L) 和电容器 © 组成。这就是“RLC”部分的由来。这是一个相当复杂的问题,但它也出现在大多数入门级物理教科书中。我的意思是,我想这很好——解决方案需要使用一些相当复杂的微分方程,可能并不适合大一物理专业的学生。但是等等!这个问题非常适合用 Python 中的数值计算来解决。所以,我们要做的是这样做。原创 2025-01-26 19:52:54 · 231 阅读 · 0 评论 -
使用 Google Mesop 进行数据可视化 Google Mesop 是一个易于使用的 Python UI 框架。我们将了解如何使用它来通过 Plotly 创建数据可视化应用程序。
通过将 Mesop 简单但功能强大的 UI 组件与 Plotly 全面的图表功能相结合,您可以构建一个动态的交互式应用程序来展示 Python 中的数据可视化。Mesop 是一个为快速 AI 和 Web 应用程序开发而开发的 Python 原生框架,它允许您构建复杂的界面,而无需传统的前端技能;当然,Plotly 是一个著名且使用良好的图形库。我们将利用这些组件构建一个数据可视化应用程序。原创 2024-11-04 09:31:54 · 158 阅读 · 0 评论 -
使用 Streamlit 将 Excel 数据转换为交互式仪表板
想象一下,无需学习 HTML、CSS 或 JavaScript,即可将 Excel 电子表格转变为动态、交互式仪表板。在本文中,我将向您展示如何仅使用 Python 和一些关键库(Pandas、Plotly 和 Streamlit)来实现这一点。本教程将帮助您更有效地可视化数据并以交互式 Web 格式与他人分享见解。《如何微调 NLLB-200 模型以翻译新语言(教程含源码)》 权重6,微调类、NLLB-200 模型《将 Llama 3 与 Ollama 和 Python 结合使用 使用 Ollama A原创 2024-11-01 16:23:02 · 165 阅读 · 0 评论 -
pgvector系列教程之 在 Django 应用程序中实现 RAG:简单指南(教程含源码)
这篇文章的目的是在常见的 Django 应用程序中实现大型语言模型 (LLM) 的一些当前主要用途,特别是称为检索增强生成 (RAG) 的技术,该技术允许用户与他们的文档进行聊天。在深入介绍实现之前,我需要解释 RAG 的一些基本构建块,即嵌入。原创 2024-10-24 15:34:17 · 453 阅读 · 0 评论 -
为什么 Python 3.13 的发布可能会改变 AI 和 ML 的游戏规则 探索它将如何改变机器学习和人工智能动态
Python 3.13引入了对自由线程执行的实验性支持,允许 Python在没有 GIL 的情况下运行。这是该语言执行模型的一次重大变化。删除 GIL 意味着 Python 现在可以支持真正的多线程,使多个线程能够同时在不同的核心上运行。这为更快地执行多线程应用程序打开了大门,而无需切换到外部库或多处理框架。JIT编译器是一种通过在执行过程中(而不是提前)将部分代码编译为机器语言来提高程序性能的系统。这可以使代码运行得更快,因为可以根据程序的实时使用情况进行某些优化。与传统解释的区别。原创 2024-10-15 11:15:55 · 105 阅读 · 0 评论 -
使用 Python 构建知识图谱(教程含源码)
这篇文章概述了使用 Python 构建知识图谱的全面方法,重点介绍文本分析技术,例如命名实体识别 (NER)、句法分析和关系提取。它详细介绍了清理和预处理文本、识别关键实体及其关系以及将数据可视化为结构化图的过程。该方法利用 Spacy 等库进行 NER 和大型语言模型 (LLM) 进行关系提取。该文档还提供了用于实现这些技术的代码片段和示例,强调了事件检测和共现分析在生成富有洞察力的知识图谱方面的重要性。最后,它提供了运行脚本以创建和可视化知识图谱的分步指南。原创 2024-09-06 14:02:00 · 1698 阅读 · 0 评论 -
使用 Pydeck 可视化 3D 空间数据 如何使用 Python 创建建筑模型图
在本文中,我将向您介绍 Python 包PyDeck,这是一个在 Python 中创建 3D 地图的绝佳工具。作为示例,我将使用覆盖布达佩斯市的 3D 建筑模型数据库。原创 2024-08-26 14:10:52 · 312 阅读 · 0 评论 -
TensorFlow 与 PyTorch:哪个更适合深度学习项目?
深度学习。机器学习的一个子集,利用多层神经网络,也称为深度神经网络。深度学习使社会能够模拟人类大脑所拥有的决策能力,它存在于我们今天生活中使用的一些人工智能应用中。如果您刚开始学习深度学习,您会发现自己对框架的数量感到不知所措。但是,您会看到两个框架位居榜首:PyTorch 和 TensorFlow。这两个框架各有优缺点,都是强大的深度学习工具。PyTorch 为特斯拉的自动驾驶功能和 OpenAI 的 ChatGPT 提供支持,而 TensorFlow 则用于谷歌搜索和优步。TensorFlow 和 Py原创 2024-08-10 00:30:00 · 389 阅读 · 0 评论 -
FastHTML:用 Python 彻底改变 Web 开发
FastHTML 是一个现代的 Python Web 应用程序框架,其真正目的是让 Python 开发人员能够轻松进行 Web 开发。它大大减少了构建交互式可扩展 Web 应用程序对 JavaScript 和 CSS 的依赖。FastHTML 使用 Python 对象来表示 HTML 元素,确保了 Pythonic 和自然的开发体验,同时遵循简单性和可读性的原则。原创 2024-08-08 21:44:29 · 389 阅读 · 0 评论 -
Python 3D系列之 使用 Leafmap 和 MapLibre 轻松实现 Python 3D 功能 MapLibre 与 Leafmap 的新集成
Leafmap 最近发布了与 MapLIbre 集成的 3D 功能。虽然 Leafmap 已经使用 PyDeck 和 Kepler GL 等库提供了 3D 可视化,但 MapLibre 增加了一整套用于创建交互式 3D 地图的全新选项。这意味着您现在可以为您的数据创建更丰富、更具吸引力的可视化效果。原创 2024-07-30 10:32:38 · 364 阅读 · 0 评论 -
如何将 Streamlit 应用程序转换为 .exe 可执行文件? 带有演示的分步教程,用于分享您的 Streamlit 应用程序
最近,我遇到了一个棘手的问题,即开发带有 UI 的数据科学 POC。这其中有什么棘手的呢?只需选择 Gradio 或 Streamlit 并为您的项目构建一个最小 UI。不是吗?连我也是这么想的。但棘手的是,这个 POC 必须与一些非技术银行人员分享,因为他们需要亲身体验该应用程序。要运行任何基于 Python 的应用程序,无论是 Streamlit 还是 Gradio,您都需要进行大量安装,而对于我而言,该应用程序的消费者来说,这些安装是无法完成的。原创 2024-07-15 21:13:35 · 714 阅读 · 0 评论 -
探索 Pingouin:Python 的综合统计软件包
Pingouin 是一款适用于 Python 的开源统计软件包,旨在简化和增强统计数据分析。它基于 Pandas、NumPy、SciPy 和 StatsModels 构建,是一款功能强大且灵活的工具,可用于执行各种统计测试和数据处理。Pingouin 特别适合需要易于实施的稳健统计方法的研究人员、数据科学家和分析师。原创 2024-07-13 17:07:53 · 487 阅读 · 0 评论 -
Mesop系列教程之Google推出新的UI框架Mesop,能够超越streamlit、gradio么,它使 Python 开发人员能够以可扩展的方式快速创建令人愉悦的 Web 应用程序
Mesop 是一个新的 UI 框架,它使 Python 开发人员能够以可扩展的方式快速创建令人愉悦的 Web 应用程序。许多 Python UI 框架都很容易掌握,但超出默认设置的自定义通常需要深入研究 JavaScript、CSS 和 HTML——这对许多开发人员来说是一个陡峭的学习曲线。原创 2024-06-20 13:20:23 · 818 阅读 · 0 评论 -
数据分析系列之 03 谁更幸福?使用 Python Streamlit 实现更好的数据可视化 使用 Python Plotly 和 Streamlit 比较加拿大和美国
Streamlit现在是一个使用 Python 进行数据可视化原型设计的流行框架。Streamlit框架节省了时间和精力,并降低了传统上制作地图和图表的复杂性。让我们一起创建四个利用Streamlit进行交互式数据可视化的具体示例:特定年份的数据集的全球分级统计图。多年来的数据集的动画全球分级统计图特定区域的动画分级统计图用折线图来提供数据的另一种表示方式最终目标都是为了回答这个问题:加拿大人是否普遍比他们的美国邻居更幸福(或更不幸福)?让我们来一探究竟!原创 2024-05-31 16:10:13 · 298 阅读 · 0 评论 -
Python Streamlit 和 GPT4:如何绘制联合国难民署难民数据 提示 GPT-4 构建交互式 Streamlit/Plotly 仪表板
Python Streamlit是一个用于创建交互式 Web 界面的出色框架——GPT-4 可以在瞬间生成可用的Streamlit代码。将其与 Python Plotly结合起来进行数据可视化,您就可以以最少的麻烦获得漂亮的地图和图表。像我一样,大多数人都需要证据,所以让我告诉你们如何做。我们可以从 CSV 数据集在 Web 界面中创建多个数据可视化,并添加多层交互(即滑块和下拉菜单)。所有这些都只需一个数据集和一些简单的 GPT-4 提示即可。因此,让我们找到一个数据集并将其付诸行动。原创 2024-05-31 08:35:17 · 373 阅读 · 0 评论 -
代码库到文本:将整个代码项目上下文提供给大型语言模型:将所有代码项目转换为一个文本文件的快速方法,适用于基于 LLM 的上下文或基于 RAG 的应用程序(教程含源码)
将所有代码项目转换为一个文本文件的快速方法,适用于基于 LLM 的上下文或基于 RAG 的应用程序。Codebase -to-Text是一个 Python 包,旨在简化将整个代码库转换为文本格式的过程。通过保留文件的层次结构和内容,此工具使用户能够提取其代码库的全面文本表示。无论是本地项目还是托管在 GitHub 上的存储库,此库都可以简化将代码转换为适合输入 LLM 和 RAG 模型的格式的过程。原创 2024-05-25 13:36:33 · 288 阅读 · 0 评论 -
大模型训练与推理真正需要多少 GPU?(公式含python计算代码)
大型语言模型彻底改变了 NLP 领域,使语言翻译、文本摘要、问答等应用成为可能。这些模型包含数百万甚至数十亿个参数,这些参数是在使用大量数据进行训练时学习的。然而,运行这些模型需要大量的计算资源。在本文中,我们将深入研究运行法学硕士所需的计算要求,探讨影响其复杂性的因素以及对硬件和软件开发人员的影响。您对训练和运行模型所需的计算资源感兴趣吗?请允许我更深入地研究细节👇🏼。原创 2024-05-23 11:08:36 · 1949 阅读 · 0 评论 -
使用 Python 代码示例探索大型语言模型 (LLM)
将LLM视为一个巨大的文本和代码库,使用专门的算法在海量数据集上进行训练。这使得它们能够以细致入微的方式理解和响应人类语言,模仿人类交流,甚至生成创造性的文本格式。穿越时空的旅程:对语言理解机器的探索早在人工智能的历史中就开始了。计算能力和深度学习技术的显着进步使法学硕士在 2017 年左右成为人们关注的焦点。GPT-3 和 LaMDA 等模型因其功能而受到了极大的关注。LLM 的闪光点在哪里?内容创作:从撰写营销文案到创作诗歌,法学硕士可以协助生成创意文本内容。原创 2024-05-15 16:23:05 · 352 阅读 · 0 评论 -
将 Llama 3 与 Ollama 和 Python 结合使用 使用 Ollama API 访问这一领先模型
Meta 最近发布的新法学硕士 Llama 3 在人工智能领域引起了轰动。例如,请查看我对下面型号的 70B 版本的评论和测试。在我的测试中,Llama 3 令人印象深刻,但它们是使用聊天界面进行的。如果您想对此模型进行编程以执行有用的任务或使用 Python 创建您自己的模型聊天界面,该怎么办?本文将向您准确展示如何使用 Ollama 来做到这一点。如果您不知道 Ollama 是什么,这是一个允许您在本地下载 Llama 3 等开源模型的网站。原创 2024-05-04 17:57:32 · 2972 阅读 · 1 评论 -
如何使用 Python 创建情感分析模型 创建检测市场情绪的算法
K 最近邻 (KNN) 是一种简单直观的机器学习算法,用于分类和回归任务。但首先,分类和回归是什么意思?分类是一种监督学习,其目标是将数据点分类为预定义的类或标签。在分类中,模型学习根据输入的特征将类或类别分配给输入。分类中的输出是离散的,表示类别或类标签。例如,将电子邮件分类为垃圾邮件或非垃圾邮件。另一方面,回归是一种监督学习,其目标是预测连续数值。在回归中,模型学习建立输入特征和输出(实数值)之间的关系。回归的输出是一个连续的值范围,它表示一个数量或数值。原创 2024-04-14 12:45:20 · 334 阅读 · 0 评论 -
为什么 Python 是人工智能的首要语言:从业者的视角
在快速发展的人工智能 (AI) 领域,选择编程语言至关重要,它不仅充当教学媒介,而且充当创新和效率的催化剂。在众多可用的编程语言中,Python 已成为领跑者,受到新手和经验丰富的从业者的青睐。本文深入探讨了 Python 在人工智能领域突出的原因,讨论了它的简单性、丰富的生态系统和强大的社区支持。原创 2024-04-14 12:41:55 · 113 阅读 · 0 评论 -
使用 Android 模拟器在移动设备上测试您的 Flet 应用程序
使用 Flet 构建移动应用程序时,您可能有时希望在真实设备上测试/预览它。在本文中,我将向您展示如何使用模拟器(虚拟设备)来实现此目的。原创 2024-03-12 15:22:42 · 617 阅读 · 0 评论 -
Python NetworkX教程之使用 NetworkX 和 matplotlib 学习图论,Seaborn数据可视化库(教程含源码)
图论是理解和分析复杂关系和结构的基本框架。从社交网络到交通系统,图表帮助我们建模和研究各种现实世界的现象。在这篇文章中,我们将讨论图和图论的基本概念。请记住,图可以指多种事物,这里将始终使用“图”作为项目之间关系的表示。NetworkX是一个允许表示图的 Python 库。如果您想遵循此迷你指南,则应该安装它。还有其他库,但这个库很容易学习,因此非常适合初学者。本文的目标是使用这个 python 库解释图论的基础知识,这样你就可以学习 2 合 1!原创 2024-03-10 10:39:36 · 728 阅读 · 0 评论 -
使用 spaCy、NetworkX 和 Matplotlib 构建知识图
知识图在以有组织且易于理解的方式表示复杂关系方面发挥着关键作用。通过绘制实体及其相互关系,它们提供了对从社交网络到科学研究等各个领域的重要见解。提取这些关系的关键技术之一是语义角色标签 (SRL),这是一种自然语言处理任务,可识别句子中的“谁对谁做了什么”。我将提供的 Python 代码片段提供了一个基本但功能强大的示例,说明如何使用 spaCy、NetworkX 和 Matplotlib 执行简单的 SRL 并构建知识图。让我们深入研究代码及其潜在用例。原创 2024-03-10 09:20:04 · 172 阅读 · 0 评论 -
Python NetworkX 教程之使用 NetworkX 进行社交网络分析:简要介绍 了解 Facebook 和 LinkedIn 等公司如何从网络中获取洞察
Netflix 等流媒体平台如何推荐适合您晚上观看的完美电影?我们如何优化足球等运动中的球员位置?我们如何识别金融网络中的欺诈活动?我们如何预测 Tinder 等约会应用程序中的匹配情况?所有这些挑战都有相同的解决方案:社交网络分析。社交网络分析 (SNA) 是一个强大的数据科学领域,可以探索实体网络内复杂的关系,发现隐藏的模式并捕获见解。网络实体可以是一切:它们可以是 Instagram 等社交网络上的人、互联网上的网站,甚至是锦标赛网络中的运动队。原创 2024-03-10 09:11:48 · 456 阅读 · 0 评论 -
利用 Apple Silicon GPU 进行深度学习的 3 种方法 Apple Silicon 带来了令人印象深刻的性能提升和极高的能效。我们也可以使用这些芯片进行深度学习吗? 伊日·莫拉夫奇克 走
Apple Silicon 带来了令人印象深刻的性能提升以及出色的能效。但这些芯片也可以用于深度学习吗?绝对地!在本文中,我们将探讨利用 Apple Silicon 的 GPU 执行各种深度学习任务的 3 种方式。原创 2024-03-07 08:39:20 · 244 阅读 · 0 评论 -
数据系列之 06 数据可视化的要素:哪种图表最适合讲述您的数据故事? 了解哪些图表对您的信息最有用
我们在本文中涵盖了很多内容——从图表类型的基础知识到数据可视化中颜色理论的一些细微差别。核心要点是数据可视化是艺术与科学的交叉点。图表类型、颜色和叙述结构的正确选择可以将您的数据变成一个既信息丰富又鼓舞人心的故事,并且从其他故事中脱颖而出。原创 2024-02-03 20:58:54 · 136 阅读 · 0 评论 -
数据系列之 05 使用 Python Plotly 增强数据叙述 使用下拉菜单和滑块元素更深入地讲述故事
交互式数据可视化是一种强大的工具,可以显着增强复杂数据集的分析和解释。通过 Python,Plotly 库提供了各种功能,可用于创建交互式出版物质量的图表。本文演示了如何使用其中两个很棒的功能范围滑块下拉式菜单让我们开始吧!原创 2024-02-03 20:40:14 · 295 阅读 · 0 评论 -
数据系列之 04 使用 GPT4 讲述联合国素养数据故事 最大限度地减少 GPT4 提示创建仪表板的麻烦
我今天使用的数据集来自联合国教科文组织全球识字率数据库(在此处下载)。该数据集包含国家名称、代码、年份和识字率。第一步是加载此数据并对其进行过滤以供我们分析。提示 GPT-4:使用提供的数据集,创建 Python 代码来访问数据集,将其存储在 pandas 数据框中并显示前几行。此代码片段将数据集加载到 pandas 数据框中并显示前几行。在进行分析之前了解数据集的结构和内容至关重要。原创 2024-02-03 20:35:12 · 124 阅读 · 0 评论 -
数据系列之 03 是什么让数据视觉效果如此出色?八个例子(一年中分手高峰期、NASA 的永久海洋)
这个肯定在互联网上广为流传,所以你可能以前见过它。它的很棒之处在于它使用气泡的大小来显示流量,并使用颜色来显示网站的类别。毫不奇怪,Google 在此排行榜上名列前茅,其次是 YouTube 和 Facebook。这里明显缺少的是 Netflix 和 OpenAI 的数量。仅在 12 月份,OpenAI 就获得了 2B 用户,Netflix 则获得了 1.55B 用户(根据 semrush.com 的数据)。该图表的下一次迭代将反映互联网使用中这些不断变化的模式。原创 2024-02-03 20:28:12 · 148 阅读 · 0 评论 -
数据系列之 02 数据讲故事的应用:四个超级简单的 Python 示例 使用 Python 数据可视化进行数据分析和讲故事
讲数据故事是数据科学家的一项基本技能——将数字与叙述相结合,使数据不那么抽象,更有趣。Python 为学习和练习用数据讲故事提供了一个优秀的平台。任何具有非常基本的 Python 编程技能和良好数据集的人都可以创建漂亮的数据可视化,可用于通知和解释。国家级趋势分析——阿富汗识字率比较分析——美国 vs 印度全球趋势分析——按十年划分的全球平均识字率当前全球识字率— 当前全球识字率的热图快照让我们一起创建 Python 代码来可视化这些分析,然后查看结果以了解它们讲述了什么故事。原创 2024-02-03 17:04:21 · 175 阅读 · 0 评论 -
数据系列之 01 数据视觉展示的艺术:减少认知负荷的两种简单方法 两种减少认知的方法来指导我们的数据视觉设计
人类并不真的想思考——除非他们必须这样做。如果你处于必须思考的位置,它会显着减慢你对正在查看的信息的处理速度。当您向观众展示新的复杂数据可视化时,请记住这一点非常重要。杂乱的展示肯定会迫使大部分观众不得不放慢速度思考。如果他们必须这样做,那么他们将不再听你的。正如丹尼尔·卡尼曼(Daniel Kahneman)(在他的《思考快与慢》一书中指出的那样),当一个人必须放慢速度并处理他们所看到的事物时,就会迫使他们从系统 1 思维(无意识的自动反应)转向系统 2 思维(慢速思考)。原创 2024-02-03 16:58:13 · 176 阅读 · 0 评论 -
数据到仪表板:利用 GPT-4 提示绘制联合国粮食安全统计数据 使用 GPT-4 和 Plotly dash 进行交互式粮食安全绘图
最近,GPT-4 对 Python 代码生成的提示有了显着改进。特别是像 Plotly dash 和 Streamlit 这样的交互式库。这包括提示生成交互式数据可视化,例如等值线图和散点地理(气泡)图。等值线图是专题地图的一种风格,其中区域的阴影或图案与所使用的数据点成比例(即代表相对全球安全性的值)散点地理(气泡)地图使用不同大小的圆圈来表示领土上的数值(例如,每个国家一个气泡)。这两个地图都可以使用 Python Plotly 库创建。原创 2024-02-01 08:48:02 · 242 阅读 · 0 评论 -
使用比较视觉效果:Python Plotly 的 3 个实践示例 数据的价值往往在于其可比性——Tufte
世界充斥着数据,将这些信息转化为可理解的数据可视化是一个艰难的过程。Edward Tufte 是数据可视化领域的先驱,他的整个职业生涯都致力于将复杂的信息提炼成清晰、富有洞察力的视觉效果。在塔夫特看来,数据很少存在于真空中。与其他数据相比,它可能最有意义。数据的价值往往在于其可比性。通过明确比较,观众可以更好地看到数据集之间的差异和相似之处。我们怎样才能明确?使用联合国全球数据集,让我们看一下 3 个很棒的 Python 示例:比较条形图、折线图和分区统计图热图。原创 2024-02-01 08:39:58 · 169 阅读 · 0 评论 -
GPT-4 制图的成熟:处理复杂的 GIS 数据查询 使用 Pythonplotly 和 dash 创建地图的模块化方法
Python 中的数据可视化工具是出了名的挑剔。有了触手可及的生成式人工智能,我们可以要求 GPT-4 为我们简化流程。最近,它似乎在处理大型 CSV 文件以进行数据可视化方面做得更好了为了检验这个理论,今天我重新审视我在 2023 年 4 月写的一个故事——由于 GPT-4 当时的挑剔性质,这个故事花了我很长时间(有很多麻烦)来写。这篇文章基于我在 LinkedIn 上查看的静态地图,该地图基于 NASA 的数据,显示了某个地区一段时间内的森林火灾。原创 2024-02-01 02:45:00 · 367 阅读 · 0 评论 -
用 Python 手动构建随机森林 深入探讨强大且流行的算法
从药物发现到物种分类、信用评分到网络安全等,随机森林是一种流行且强大的算法,用于对复杂世界进行建模。它的多功能性和预测能力似乎需要尖端的复杂性,但如果我们深入研究随机森林实际上是什么,我们会看到一组极其简单的重复步骤。我发现学习某样东西的最好方法就是去玩它。因此,为了直观地了解随机森林的工作原理,让我们用 Python 手动构建随机森林,从决策树开始,扩展到整个森林。我们将亲眼目睹该算法对于分类和回归的灵活性和可解释性。原创 2024-01-31 22:25:04 · 140 阅读 · 0 评论 -
数理实验之 评估机器学习中的聚类 关于无监督聚类的原因、方式和内容的指南(教程含源码)
聚类一直是引起我关注的主题之一。尤其是当我第一次进入机器学习的整个领域时,无监督聚类总是对我有吸引力。简而言之,集群就像机器学习中穿着闪亮盔甲的无名骑士。这种形式的无监督学习旨在将相似的数据点捆绑成组。想象一下你自己在一个社交聚会中,每个人都是陌生人。你会如何解读人群?或许,可以根据共同特征对个人进行分组,例如那些因笑话而大笑的人、深入交谈的足球爱好者或被文学讨论所吸引的人。简而言之,这就是聚类!您可能想知道,“为什么它相关?集群拥有众多的应用。原创 2024-01-22 09:21:10 · 147 阅读 · 0 评论
分享