自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

龙哥盟

掠夺·扩张·投机·博弈

  • 博客(23267)
  • 资源 (1062)
  • 问答 (2)
  • 收藏
  • 关注

原创 GeekDoc 中文系列教程 2025.10

2025-10-06 00:11:28 1071 1

原创 VKDoc 中文系列教程 2025.10 更新

2025-10-02 12:40:24 921

原创 FreeLearn 中文系列教程 2025.10 更新

2025-10-02 12:25:09 350

原创 布客沉思录(一):【历史垃圾时间】就是彻头彻尾的伪概念

所以新的方向之一必须是能从市场上直接赚到钱的,对于程序员来讲,我们没有什么时间,但我们有自动化能力,有AI能力,所以最好的方式就是量化交易。《单干》一书中提到,最好的商业方式必须离钱最近,必须变现环节最小,轻资产大于重资产,自动大于手动,这样才能降低不可控性,那么量化交易一定是最符合这个描述的了。就算当时赚不到钱,也算是技术储备,等待经济好了,就一定能发挥作用。看到了吧,这个伪概念就是个自证预言:如果你觉得现在是【历史垃圾时间】,你放弃了自己的主观能动性,啥都不做,当然啥都不出错,但是啥都做不出来。

2024-08-14 14:43:16 3651 24

原创 布客社区及饱和式翻译计划 Q&A

A1:如果你现在,在AIGC大爆发之后问我这个问题,我只想告诉你们,翻译是 AIGC 中一种重要的形式,输出稳定,没有幻觉,比什么扩写仿写之类的好多了。当然我也尝试过很多其他的AIGC形式,比如源码解析、课程笔记之类的,但都没有翻译方便省事。翻译一定是未来几年技术自媒体 AIGC 的主流形态。

2024-08-06 13:52:20 1137 13

原创 Quant文艺复兴计划正式启动!

此时此刻恰如彼时彼刻,所以我深知,如果我不自己动手写出一批教程,中文互联网就永远没有面向新手的开放教程可用。幸好现在我们有了ChatGPT,它减轻了我的主业工作量,让我有时间投入这个方面;同时,它也大大减轻了编写教程的工作量,能让这些想法迅速实现。再者,良好的量化实现是保证回测准度和自动化的前提之一。总结paperwithbacktest上的Quant前沿论文【自动】,解析代码【自动】寻找gh上的机器学习或深度学习的Quant代码,做源码解析【自动】挑选主流量化框架,翻译文档【自动】,做源码解析【自动】

2024-04-10 22:56:08 1129 60

原创 一些用 GPT 翻译的计算机科学/人工智能 PDF 讲义

3D成像.pdf3D成像.pdf3D成像技术.pdf3D成像技术.pdf3D点云分析.pdf3D点云分析.pdfAAAI 2019 笔记.pdfAAAI 2019 笔记.pdfCMU 10.708 概率图模型讲义.pdfCMU 10.708 概率图模型讲义.pdfCMU 15-312 编程语言基础讲义.pdfCMU 15-312 编程语言基础讲义.pdfCMU 15-411 编译器设计讲义.pdfCMU 15-411 编译器设计讲义.pdfCMU 15-819 同伦类型论讲义.

2024-02-20 22:59:55 2328

原创 环材化生劝退文章汇总 2019.3

本人的 优快云 博客、简书专题和博客园正式加入“环材化生劝退”计划,接受相关内容的投稿。ApacheCN 开源社区接受各种环材化生转行咨询。写给分子科学与工程大一大二的学弟学妹们为什么要劝退分子科学与工程?是什么让你开始劝退的?(@韩冬)现在学生物出路真有那么不济吗?(@Mengjie Chen)盘点2018年化工行业大事故!回顾那些令人心痛的瞬间…触目惊心!2017年化工行...

2019-03-28 21:31:02 40831

原创 使用 XGBoost 进行交叉验证——通过 Tidymodels 提升客户流失分类

通过将数据分为训练集和测试集子集,实现交叉验证,模型在各个子集上进行拟合。目标是评估性能并将其推广到未见过的数据。这也可以帮助防止在模型在训练集上显著优于测试集的情况下过拟合,从而提高模型的鲁棒性。由于我在上一篇文章中介绍了逻辑回归和随机森林,我将在这个例子中使用 XGBoost 展示交叉验证,使用相同的数据集——Simarpreet Singh 的银行客户流失二分类合成数据,该数据集可在 Kaggle 上找到,并受。

2025-11-24 00:31:18 729

原创 使用不同采样技术的信用卡欺诈检测

在我们的欺诈检测用例中,最重要的一个指标是召回率。这是因为银行/金融机构更关心捕捉到大多数欺诈案例,因为欺诈是昂贵的,他们可能会因此损失大量资金。因此,即使有少数误报,即把真正的客户标记为欺诈,也可能不会太麻烦,因为这仅仅意味着阻止一些交易。然而,阻止太多真正的交易也不是一个可行的解决方案,因此,根据金融机构的风险偏好,我们可以选择简单的过采样方法或 SMOTE。我们还可以调整模型的参数,通过网格搜索进一步优化模型结果。有关代码的详细信息,请参阅以下链接在Github。

2025-11-24 00:30:48 430

原创 创意画布:使用 AI 绘画、编辑和风格化图像

我发现这些 AI 模型在编辑图像方面非常有用。总的来说,Runway ML 的擦除和替换以及图像到图像功能的结果非常出色。我认为每月 12 美元的费用是合理的,尤其是考虑到其他功能,如超分辨率图像缩放和视频生成。当然,Photoshop 内置的生成式 AI 功能提供了更多便利,但对我来说每月 23 美元似乎有点高。开源模型表现良好,而且它们实际上是免费的。(注意,我测试的两个模型都在 Google Colab 免费层提供的 T4 GPU 上运行。

2025-11-24 00:26:07 465

原创 使用 LangGraph 和 LangChain 创建任务导向对话系统

有了 LangGraph 和 LangChain,我们可以构建引导用户通过结构化互动的系统,借助 LLMs 帮助我们控制条件逻辑,从而减少创建它们的复杂性。通过结合提示、记忆管理和工具调用,我们可以创建直观且有效的对话系统,开启用户互动和任务自动化的新可能性。我希望这个教程能帮助你更好地理解如何使用 LangGraph(我花了好几天时间琢磨如何让这个库的所有部分协同工作)。

2025-11-24 00:25:36 730

原创 创建合成用户研究:使用人物角色提示和自主代理

现在我们模拟的研究已经结束,我们希望获得更多可操作的见解。我们可以创建一个总结代理来帮助我们完成这项任务,也可以在问答场景中使用它。这里要注意,较大的转录内容需要一个支持更大输入的语言模型(上下文窗口我们需要抓取所有对话— 从我们之前的模拟小组讨论中,作为用户提示(输入)提供给我们的总结代理。让我们为总结代理设计系统提示(指令)— 该代理将专注于根据之前的转录内容为我们创建定制化的报告卡,并为我们提供明确的建议和行动方案。

2025-11-24 00:25:05 288

原创 从零开始创建 SMOTE 过采样

原文:towardsdatascience.com/creating-smote-oversampling-from-scratch-64af1712a3be合成少数过采样技术(SMOTE)通常用于处理数据集中的类别不平衡。假设有两个类别,其中一个类别有更多的样本(多数类别)比另一个(少数类别)。在这种情况下,SMOTE 将在少数类别中生成更多的合成样本,使其与多数类别相当。在现实世界中,我们不会在分类问题中拥有平衡的数据集。例如,一个预测患者是否患有镰状细胞病的分类器。

2025-11-24 00:24:33 519

原创 创建卫星图像时间序列

原文:towardsdatascience.com/creating-satellite-image-timelapses-2b479f86ff52一段时间以前,我在我的文章中总结了从欧洲航天局 Sentinel 卫星收集和准备卫星图像数据的技巧,该文章标题为“深入剖析欧洲航天局 Sentinel API”。从那时起,欧洲航天局在 Sentinel Hub 上推出了多年未见的大更新,包括 API 访问方法的更新。因此,我简要回顾了如何从当前 API 获取数据。

2025-11-24 00:24:02 592

原创 使用 VSCode 在 Python 中创建项目环境

创建数据科学项目可以相当直接。随着如今可用的资源众多,这仅仅是一个选择开发工具并启动项目的问题。除了几个可以帮助您完成几乎所有想要创建的工作的 AI 机器人之外,文档也容易获得。然而,随着项目变得越来越复杂和专业,将项目彼此隔离的需求就会出现。有时,在项目 A 中协同工作良好的模块,可能在项目 B 中无法一起运行。或者,两个不同包中具有相同名称的方法可能会引起混淆。我的意思是,在非隔离环境中可能会发生很多事情。那就是我们需要开始隔离开发环境的时候了。

2025-11-24 00:18:50 633

原创 为(大量)乐趣和(一点)利润创建 OpenAI GPTs

我在上个月尝试了定制版的 GPT,以了解该系统的优势和局限性。我创建了一个名为RobGon 对话助手的创意写作聊天机器人,它建议基于公共领域文学的新对话。我还创建了两个版本的聊天机器人,用于根据公共领域的歌曲生成音乐和弦进行。第一个版本是RobGon 和弦作曲家,它从简单的文本文件中加载相关的歌曲数据。第二个版本是RobGon 和弦作曲家 Presto,它通过我编写的自定义服务获取歌曲数据。我为 Flask 服务编写了 Python代码。

2025-11-24 00:18:14 608

原创 创建具有互动性的 Power BI 仪表盘,吸引你的观众

原文:towardsdatascience.com/creating-interactive-power-bi-dashboards-that-engage-your-audience-05d267824677?

2025-11-24 00:16:59 327

原创 使用 dbt 在 Snowflake 表上创建动态数据透视表

当处理表格数据时,您通常会以最适合日常运营的格式呈现这些数据。例如,代表不同客户购买交易的行。数据透视表允许您将行旋转到列中,为大型数据集创建更组织化和易于消化的格式。您还可以聚合数据,例如计算总和、平均值或计数,并将这些结果作为每个汇总类别的唯一列显示。让我们看看一个有助于描述的视觉图。在这里,我们按用户值分组,然后计算每个交易的计数总和,并为每个产品创建一个唯一的列。作者图片。

2025-11-24 00:15:00 570

原创 使用 OpenAI 助理 API 和 Streamlit 创建助理

原文:towardsdatascience.com/creating-an-assistant-with-openai-assistant-api-and-streamlit-282d9be9f03e?

2025-11-24 00:14:30 452

原创 使用 GPT-4o 创建 WhatsApp AI 助理

我们将从 Webhook 接收有效载荷。示例有效载荷我更喜欢使用 Pydantic 来编写代码,以为我的 Python 代码添加类型安全性。此外,类型注解和 Pydantic 是 FastAPI 应用的最佳搭配。

2025-11-24 00:13:59 289

原创 创建用于卫星图像可视化的 Streamlit 应用程序:一步步指南

💾。

2025-11-24 00:13:27 760

原创 使用 Langflow 和 Astra DB 创建 RAG 聊天机器人

原文:towardsdatascience.com/creating-a-rag-chatbot-with-langflow-and-astra-db-582ad588cf37?

2025-11-24 00:12:56 452

原创 使用 Langflow 和 Astra DB 创建 RAG 聊天机器人

原文:towardsdatascience.com/creating-a-rag-chatbot-with-langflow-and-astra-db-582ad588cf37?

2025-11-24 00:11:42 494

原创 使用 Vercel V0 为你的 ML 应用程序创建前端

原文:towardsdatascience.com/creating-a-frontend-for-your-ml-application-with-vercel-v0-a25179ea1170为你的机器学习应用程序开发一个干净且吸引人的网站可能会很困难,尤其是如果你的主要工作是后端或机器学习任务。就我个人而言,我主要致力于开发机器学习模型和自动化任务,这意味着我不花太多时间编写前端代码或与设计打交道。我经常使用。

2025-11-24 00:10:32 630

原创 创建一个更好的仪表板——神话还是现实?

2023 年 2 月,我写了我的第一篇 Medium 文章:[## 如何在 Python 中自定义信息图表:技巧与窍门Dash 允许在 Python 代码的基础上构建交互式仪表盘,而无需学习复杂的 JavaScript 框架,如React.js。# Data# Datahole=0.3)# Data代码注释:首先,我们需要导入所有的库(包括 HTML 模块),并借助字符串初始化仪表盘。然后,我们将每个图形粘贴到 Dash 核心组件中,进一步将它们与其他 HTML 组件(dcc.Graph。

2025-11-24 00:08:15 506

原创 从零开始创建自己的提示增强器

在这篇文章中,我介绍了 OpenAI 最近添加的增强提示生成功能,并演示了如何使用它。此外,我还提供了关于如何使用编码复制此类功能的见解。我首先引导你设置一个新的开发环境,这对于任何编码项目都是必要的。接下来,我展示了如何使用开源的 LLM(大型语言模型)来模拟 OpenAI 的功能,特别是通过 Groq 使用 Meta 的 Llama 3.1 70B 模型,并结合 Gradio 开发的前端。我还包含了实现此解决方案所需的完整源代码。我们的开发分为两个关键部分。

2025-11-24 00:01:03 493

原创 使用 ChatGPT 创建你自己的餐单计划器

原文:towardsdatascience.com/create-your-own-meal-planner-using-chatgpt-1dc4dfe3af7e?

2025-11-24 00:00:31 374

原创 使用自助法和遗传算法创建更强的决策树

原文:towardsdatascience.com/create-stronger-decision-trees-with-bootstrapping-and-genetic-algorithms-1ae633a993c9?

2025-11-23 09:59:53 534

原创 使用自助法和遗传算法创建更强的决策树

原文:towardsdatascience.com/create-stronger-decision-trees-with-bootstrapping-and-genetic-algorithms-1ae633a993c9?

2025-11-23 09:57:43 574

原创 使用 MergeKit 创建专家混合

专家混合(MoE)是一种旨在提高效率和性能的架构。它使用多个专门的子网络,称为“专家与密集型模型不同,后者会激活整个网络,MoE 只会根据输入激活相关的专家。这使得训练速度更快,推理更加高效。稀疏 MoE 层: 这些层替代了变换器架构中的密集前馈网络层。每个 MoE 层包含多个专家,而每次输入仅会激活其中的一部分专家。门控网络或路由器: 该组件决定哪些标记由哪些专家处理,确保输入的每个部分都由最合适的专家处理。

2025-11-23 09:57:03 660

原创 使用 GPT4All LLM 在 Java 中创建和改进您自己的本地 PC 离线 ChatGPT

原文:towardsdatascience.com/create-and-revamp-your-own-offline-chatgpt-on-local-pc-with-gpt4all-llm-in-java-7c03996f28c8随着 OpenAI 推出的**(1)(2)(3)**“”等等。将(2)应用于现实世界情境,这一点极为相关,因为众所周知,在医疗保健和军事防御等高安全设置中的工作人员必须在没有或几乎没有网络访问的情况下完成大部分工作。

2025-11-23 09:56:23 594

原创 创建一个交互式地图以显示卫星影像的时间序列

💾。

2025-11-23 09:55:36 771

原创 创建一个 AI 驱动的电影问答游戏,使用 Gemini LLM、Python、FastAPI、Pydantic、RAG 等

原文:towardsdatascience.com/create-an-ai-driven-movie-quiz-with-gemini-llm-python-fastapi-pydantic-rag-and-more-e15322be4f66?

2025-11-23 09:54:51 495

原创 创建一个具有 OpenAI 函数调用功能的代理

如前所述,tools本质上是模型可以调用的函数描述。get_farms:根据用户的位置检索农场目的地列表。:提供特定农场的活动详细信息。:方便用户预定选择的活动。:提供一个简单的投诉流程。

2025-11-23 09:54:06 470

原创 使用计算机视觉和 ChatGPT 创建一个 AI 驱动产品

原文:towardsdatascience.com/create-an-a-i-driven-product-with-computer-vision-and-chatgpt-070a34ab9877在本文中,您将学习如何训练自定义和预训练的计算机视觉模型为医疗用例构建一个 LLM 语言系统漫步应用的使用任何数据集都可以创建一个 AI 驱动产品。

2025-11-23 09:53:09 491

原创 使用 Llama 3.1 创建合成数据集,以微调你的 LLM

Nemotron 4 340B 奖励使用 Llama 3.1 405B 和 Nemotron 4 创建合成数据集LinkedInTwitter。

2025-11-23 09:52:38 664

原创 CRAG – 直观且详尽解释

在我们讨论 CRAG 之前,我们应该首先讨论“检索增强生成”(RAG)。我有一篇专门的文章介绍这个主题,但我们将简要探讨其高级概念。检索增强生成 – 直观且详尽解释Retrieval Augmented Generation(RAG)的想法是通过补充一些信息来增强语言模型,使其能够提供更好的答案。在 RAG 中,这种补充信息通过将用户的查询与补充信息结合成一个单一的提示(有时被称为“提示增强”)来提供给语言模型。使用提示增强的一个例子,其中将一段上下文相关的信息和用户的查询组合在一起。来自。

2025-11-23 09:51:35 629

原创 使用 Python 制作定制词云知识问答游戏

以下代码定义了一个函数,用于加载维基百科页面 URL,提取“Plot”标题下的电影简介,并将文本作为字符串返回。我们将使用此文本来构建词云。= "h2":该函数使用 requests 库获取 URL,并使用 BeautifulSoup 解析输出。我们使用 BeautifulSoup 查找具有“Plot”ID的span元素。如果找到图表标题,我们初始化一个字符串(plot_text)来保存文本。接下来,我们开始遍历结果,查找被标记为p的段落并将它们连接到字符串中。然后我们使用strip()

2025-11-23 09:50:52 683

原创 使用 Python 制作定制词云知识问答游戏

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/80372824ab73a4f7d5a65ea4838db838.png游戏之夜词云(作者制作)你厌倦了游戏之夜的老套桌游了吗?如果你懂一点 Python,你可以轻松制作一个带有词云的定制知识问答游戏。词云是一种用于显示文本数据的视觉表示,用于在网站上显示称为标签的关键字元数据。在词云中,字体大小或颜色显示了每个标签或单词的重要性。这里有三个示例词

2025-11-23 09:49:19 409

AIGC系列报告202311.pdf

AIGC系列报告202311

2024-02-25

你并不了解 JavaScript(YDKJS)第二版:作用域与闭包.epub

你并不了解 JavaScript(YDKJS)第二版:作用域与闭包

2024-02-22

你并不了解 JavaScript(YDKJS)第二版:入门.epub

你并不了解 JavaScript(YDKJS)第二版:入门

2024-02-22

CSS 动画 101.epub

CSS 动画 101

2024-02-22

WGPU 学习手册.epub

WGPU 学习手册

2024-02-22

数据工程讲义:经济学分册.epub

数据工程讲义:经济学分册

2024-02-22

穿透 Laravel.epub

穿透 Laravel

2024-02-22

viml 学习手册.epub

viml 学习手册

2024-02-22

深入架构原理与实践.epub

深入架构原理与实践

2024-02-22

高效 C C++ 调试(Effective Debugging).epub

高效 C C++ 调试(Effective Debugging)

2024-02-22

Rust 宏小册.epub

Rust 宏小册

2024-02-22

高并发的哲学原理.epub

高并发的哲学原理

2024-02-22

Rust 中的命令行应用.epub

Rust 中的命令行应用

2024-02-22

架构治理模式.epub

架构治理模式

2024-02-22

web全栈体系.epub

web全栈体系

2024-02-22

Zig 学习手册.epub

Zig 学习手册

2024-02-22

Rust标准库内部原理(inside-rust-std-library).epub

Rust标准库内部原理(inside-rust-std-library)

2024-02-22

iceWebGL:WebGL上车指南.epub

iceWebGL:WebGL上车指南

2024-02-22

HuggingFace NLP 课程文档.epub

HuggingFace NLP 课程文档

2024-02-15

HuggingFace 音频课程文档.epub

HuggingFace 音频课程文档

2024-02-15

斯坦福CS229机器学习中文讲义(2022春季).pdf

斯坦福CS229机器学习中文讲义(2022春季)

2024-02-29

AIGC系列报告202306(上).pdf

AIGC系列报告202306(上)

2024-02-27

AIGC系列报告2022.pdf

AIGC系列报告2022

2024-02-27

AIGC系列报告202308(上).pdf

AIGC系列报告202308(上)

2024-02-27

AIGC系列报告202305(下).pdf

AIGC系列报告202305(下)

2024-02-27

AIGC系列报告202310(下).pdf

AIGC系列报告202310(下)

2024-02-27

AIGC系列报告202305(上).pdf

AIGC系列报告202305(上)

2024-02-27

AIGC系列报告202304(下).pdf

AIGC系列报告202304(下)

2024-02-27

AIGC系列报告202301-02(下).pdf

AIGC系列报告202301-02(下)

2024-02-27

AIGC系列报告202304(上).pdf

AIGC系列报告202304(上)

2024-02-27

AIGC系列报告202308(下).pdf

AIGC系列报告202308(下)

2024-02-27

AIGC系列报告202306(下).pdf

AIGC系列报告202306(下)

2024-02-27

AIGC系列报告202307.pdf

AIGC系列报告202307

2024-02-27

AIGC系列报告202310(上).pdf

AIGC系列报告202310(上)

2024-02-27

AIGC系列报告202301-02(上).pdf

AIGC系列报告202301-02(上)

2024-02-27

AIGC系列报告202309.pdf

AIGC系列报告202309

2024-02-27

AIGC系列报告202312(下).pdf

AIGC系列报告202312(下)

2024-02-25

AIGC系列报告202310(中).pdf

AIGC系列报告202310(中)

2024-02-25

AIGC系列报告202401(上).pdf

AIGC系列报告202401(上)

2024-02-25

AIGC系列报告202312(上).pdf

AIGC系列报告202312(上)

2024-02-25

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除