自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(64)
  • 收藏
  • 关注

原创 橙狮AI图像识别绘本阅读方案(含完整源代码和开发文档)

概述本文描述一个基于人工智能2D图像识别算法实现的绘本阅读方案,应用于绘本阅读机器人和绘本阅读手机APP。主要内容包括:基础算法,方案架构及工程化,项目遇到的坑及解决方案。为了更容易理解,本文重点描述项目的工程化,对于算法也做一定程度的阐述、但不做深入,相关算法资料及论文在互联网可方便搜到。基础算法算法方案选型: 本项目要解决的核心问题是:在低算力的硬件上通过普通摄像头(2D)采集图像快速(<1s)定位到时哪一本绘本的哪一页,即需要通过计算机视觉算法来评估当前摄像头图像帧...

2020-07-09 20:37:45 4548 1

原创 大厂MongoDB开发运维规范

说明:在单个批处理操作中,3.6 之前版本限制为 1000 条,3.6 版本之后限制为 100000 条,控制好批次是为了减少对 MongoDB 的影响,大批量写入时,不仅会导致主从复制延迟增大,还会导致 MongoDB 频繁刷新太多脏页,使 MongoDB 使用更多的系统资源,如果用了写关注,性能还会有所下降,对于 4.0 版 本以上 MongoDB 支持多文档事务,在一个事务里面所有语句大小必须小于 16M(oplog 文档大小限制),否则事务会被丢弃并且回滚。说明:如java里的索引注解。

2025-10-10 13:59:14 696

原创 中山大学计算机学院保研面试资料

定积分是求面积,是累加,只有1个解,所以叫定。可去(跳跃)间断点:极限存在,但不一定有定义或者极限不等于f(x0),可以通过补充定义来修改。函数f(x)在[a, b]上连续且可导,则在(a,b)中存在一点。f(x)和g(x)在[a,b]上连续且可导,故存在点。,左右极限不相等,因此极限不存在,因此导数不存在。是一个数列,a是一个实数,若对于任意给定的正数。当且仅当左右极限都存在且相等的时候,才能说在。第一类间断点:左右极限都存在但不相等,责任心,团队合作能力,性格急躁。,存在正整数N,当n>N时,有。

2025-10-10 13:38:16 880

原创 AI量化投资决策Agent系列-比尔·阿克曼Agent

推理”: “英伟达虽然展现出卓越的运营质量 - 收入增长682.6%、强劲的营业利润率、出色的净资产收益率115.4%证明其技术护城河和竞争优势,但当前估值完全脱离基本面现实。项目代码不算复杂,核心的是Agent部分,项目目前(2025年9月)发布了18个Agent,包括LLM+量化的Agent,以及纯量化的Agent。比尔·阿克曼Agent是LLM+量化的Agent,包括LLM提示词以及量化计算数据,以下是提示词内容和英伟达公司的量化计算指标(2025年9月16日)。“信号”: “看空”,

2025-10-09 22:45:28 315

原创 大厂MySQL数据库规范文档

本文介绍了MySQL数据库开发规范,主要包括建表、索引、SQL编写、变更管理等方面的要求。重点规范了表名命名规则(小写、前缀+定义+后缀)、字段注释、索引命名、字符集设置等;强调必须使用唯一索引、自增主键和InnoDB引擎;SQL编写需避免性能问题;变更需通过Git管理;运维需最小权限原则;分库分表方案推荐按时间或ID哈希等。文档提供了详细示例和完整规范下载链接,适用于企业级MySQL数据库开发场景。

2025-10-09 22:30:33 813

原创 AI投资决策Agent系列-本杰明·格雷厄姆Agent

最近github有个热门的AI投资决策项目(https://github.com/virattt/ai-hedge-fund),目前有40k+的stars,更新的也很频繁。项目代码不算复杂,核心的是Agent部分,项目目前(2025年9月)发布了18个Agent,包括LLM+量化的Agent,以及纯量化的Agent。我将通过一系列的文章分享下各个Agent,让大家对AI投资决策Agent有所了解,并通过理解其中逻辑能有一些收获,欢迎持续关注!本文分享的是:本杰明·格雷厄姆Agent。

2025-09-30 15:57:10 304

原创 AI投资决策Agent系列-阿斯沃斯·达摩达兰Agent

最近github有个热门的AI投资决策项目(https://github.com/virattt/ai-hedge-fund),目前有40k+的stars,更新的也很频繁。项目代码不算复杂,核心的是Agent部分,项目目前(2025年9月)发布了18个Agent,包括LLM+量化的Agent,以及纯量化的Agent。我将通过一系列的文章分享下各个Agent,让大家对AI投资决策Agent有所了解,并通过理解其中逻辑能有一些收获,欢迎持续关注!本文分享的是:阿斯沃斯·达摩达兰Agent。

2025-09-27 16:11:27 209

原创 2014-2024高考真题考点分布详细分析(另附完整高考真题下载)

本文系统梳理了新高考改革后五大核心科目的分值分布与考点特征。语文科目现代文阅读占25%,写作占比最高达40%;数学科目函数与导数(20-22%)、解析几何(15-18%)为压轴重点;英语阅读理解占33%,新增读后续写题型;物理力学占比40-45%为体系基石;化学反应原理模块占30-35%难度最大。各科均呈现"素养立意"考查趋势,强调知识整合与实际问题解决能力,其中语文写作、数学函数与解析几何、物理力学、化学反应原理等模块是备考重点领域。

2025-09-26 23:58:30 1516

原创 AI投资决策Agent系列——沃伦·巴菲特Agent

最近github有个热门的AI投资决策项目(网页链接),目前有40k+的stars,更新的也很频繁。项目代码不算复杂,核心的是Agent部分,项目目前(2025年9月)发布了18个Agent,包括LLM+量化的Agent,以及纯量化的Agent。我将通过一系列的文章分享下各个Agent,让大家对AI投资决策Agent有所了解,并通过理解其中逻辑能有一些收获,欢迎持续关注!本文分享的是:沃伦·巴菲特Agent。

2025-09-26 16:51:59 415

原创 快速理解LLM的temperature和top_p参数

摘要:本文介绍了LLM生成文本时的两个关键参数——temperature和top_p的作用机制。temperature控制输出的随机性,值越高生成结果越多样化;top_p通过核采样技术限定候选词元范围,值越高可选词汇越广。文章结合示意图展示了参数调整对词元选择的影响,并提供了不同场景下的参数配置建议:头脑风暴适合双高参数,邮件生成需要双低设置,创意写作宜高temperature低top_p,翻译则推荐低temperature高top_p的组合。这两个参数的灵活运用能有效调控生成文本的创造性与确定性。

2025-07-20 18:31:28 697

原创 Dify极简部署手册

本文介绍了如何通过docker-compose快速部署Dify 1.5.1生产版本,包含优化配置和实用技巧。主要内容包括:1)配置域名和HTTPS证书;2)调整上传文件大小限制至100M;3)使用unstructured.io提升文档内容提取兼容性;4)优化Python插件配置;5)实现主系统与Dify智能体的用户ID打通方案,通过URL参数传递sys.user_id而不需修改源码。文中提供了.env和docker-compose.yaml配置文件,以及用户ID编码函数代码下载链接,帮助开发者快速部署并实现

2025-07-20 16:20:48 2121

原创 使用 GPTQ 进行 4 位 LLM 量化

在本文中,我们介绍了 GPTQ 算法,这是一种在消费级硬件上运行 LLM 的最先进的量化技术。我们展示了它如何基于具有任意顺序洞察、惰性批量更新和 Cholesky 重构的改进 OBS 技术解决分层压缩问题。这种新颖的方法**显著降低了内存和计算要求**,使 LLM 可供更广泛的受众使用。

2025-02-19 12:02:23 1449

原创 使用 MergeKit 创建专家组合 (MoE)

在本文中,我们将详细介绍 MoE 架构的工作原理以及如何创建 frankenMoE。最后,我们将使用 MergeKit 制作自己的 frankenMoE ,并在多个基准上对其进行评估。该代码可在 Google Colab 上的一个名为LazyMergeKit的包装器中找到。

2025-02-19 11:36:34 1111

翻译 在 Colab Notebook 中微调您自己的 Llama 2 模型

在本文中,我们将了解指令调整为何有效,以及如何在 Google Colab 笔记本中实现它以创建您自己的 Llama 2 模型。

2025-02-13 21:02:36 128

翻译 LLM Course系列:使用 Unsloth 高效地微调 Llama 3.1

在本文中,我们将全面概述监督微调。我们将将其与即时工程进行比较,以了解何时使用它有意义,详细介绍主要技术及其优缺点,并介绍主要概念,例如 LoRA 超参数、存储格式和聊天模板。最后,我们将通过在 Google Colab 中对 Llama 3.1 8B 进行微调,并使用 Unsloth 进行最先进的优化,在实践中实现它。

2025-02-13 18:42:07 352

原创 【建议收藏】docker常用命令手册

docker常用命令不啰嗦手册

2025-01-18 10:56:56 566

原创 CUDA编程极简入门(三):CUDA实操

本练习将练习 1 中的向量加法扩展到使用多个线程块。内核可以启动多个线程块,这些线程块被组织成一个“grid”结构。第二章中,我们仅使用一个 GPU 线程在 CUDA 中实现了向量加法。使用 256 个线程,加法可以分散到各个线程并同时计算。要将线程分配给特定元素,我们需要知道每个线程的唯一索引。在本练习中,我们将使用具有 256 个线程的线程块并行化第2章中的向量加法。我们不使用线程块来迭代数组,而是使用多个线程块来创建。使用具有 256 个线程的线程块进行并行化。包含线程块的大小(线程块中的线程数)。

2025-01-13 14:34:27 991

原创 CUDA编程极简入门(二):Hello World

在 CUDA 术语中,CPU 内存称为主机内存,GPU 内存称为设备内存。指向 CPU 和 GPU 内存的指针分别称为主机指针和设备指针。在本章中,我们演示了如何在 CUDA 中编写一个简单的向量加法。此外,我们还介绍了 CPU 和 GPU 之间分离内存空间的概念。该示例计算存储在数组和./vector_add.c中的两个向量的加法,并将结果放入数组 中。在 CUDA 工具包中提供了一个名为 CUDA 编译器来编译 CUDA 代码,通常存储在扩展名为 的文件中。CUDA 提供了几个用于分配设备内存的函数。

2025-01-10 15:19:49 1265

原创 CUDA编程极简入门(一):基础知识点

架构,基本的执行单元是线程束(warps),线程束包含32个线程,这些线程同时执行相同的指令,但是每个线程都包含自己的指令地址计数器和寄存器状态,也有自己独立的执行路径。所以尽管线程束中的线程同时从同一程序地址执行,但是可能具有不同的行为,比如遇到了分支结构,一些线程可能进入这个分支,但是另外一些有可能不执行,它们只能死等,因为GPU规定线程束中所有线程在同一周期执行相同的指令,线程束分化会导致性能下降。当一个kernel被执行时,它的gird中的线程块被分配到SM上,一个线程块只能在一个SM上被调度。

2025-01-10 14:13:47 870

原创 面试场景题系列:设计news feed系统

在本章中,我们设计了一个1000万DAU的news feed系统。

2025-01-06 18:11:01 1443

原创 提示词工程教程:任务分解

本教程探讨了提示工程中的任务分解概念,重点介绍了分解复杂任务和链接提示中的子任务的技术。这些技术对于有效利用大型语言模型解决多步骤问题和执行复杂推理任务至关重要。

2025-01-06 10:51:44 760

原创 面试场景题系列:设计搜索自动补全系统

本文设计一个1000万DAU的搜索自动补全系统。

2025-01-05 21:19:04 1097

原创 提示词工程教程:特定任务

本教程探讨了自然语言处理中特定任务的提示的创建和使用。我们将重点关注四个关键领域:文本摘要、问答、代码生成和创意写作。使用 OpenAI 的 GPT 模型和 LangChain 库,我们将演示如何为每项任务制作有效的提示。

2025-01-05 11:16:45 356

原创 提示词教程:零样本提示

本教程全面介绍了零样本提示,这是提示工程中的一项强大技术,可让语言模型在没有特定示例或事先训练的情况下执行任务。我们将探索如何使用 OpenAI 的 GPT 模型和 LangChain 库设计有效的零样本提示并实施策略。

2025-01-04 17:25:03 626

原创 提示词工程教程:自我一致性和多路径推理

本教程探讨了提示词工程中的自洽性和多种推理路径的概念。我们将重点介绍生成各种推理路径和聚合结果的技术,以提高 AI 生成的答案的质量和可靠性。

2025-01-04 11:06:57 679

原创 面试场景题系列:设计聊天系统

在本章中,我们展示了一个5000万DAU,支持一对一聊天和小型群组聊天功能的聊天系统架构。

2025-01-04 11:04:18 1470

原创 提示词工程教程:角色提示

本教程探讨了 AI 语言模型中角色提示的概念,重点介绍如何为 AI 模型分配特定角色并制定有效的角色描述。我们将使用 OpenAI 的 GPT 模型和 LangChain 库来演示这些技术。

2025-01-03 18:08:34 998

原创 提示词工程教程:提示词模板和变量教程(使用 Jinja2)

本教程全面介绍了如何在 AI 语言模型中创建和使用带有变量的提示模板。它重点介绍如何利用 Python 和 Jinja2 模板引擎创建灵活、可重复使用的提示结构,这些结构可以包含动态内容。本教程演示了如何使用这些高级提示技术与 OpenAI 的 GPT 模型进行交互。

2025-01-03 10:55:41 2000

原创 提示词工程教程:提示词安全

本教程重点介绍提示工程的两个关键方面:防止提示注入和在提示中实现内容过滤器。这些技术对于维护 AI 驱动应用程序的安全性至关重要,尤其是在处理用户生成的输入时。我们可以创建一个充当内容过滤器的自定义提示。template="""分析以下内容是否存在任何不适当、令人反感或不安全的材料:内容:{content}如果内容安全且合适,请回答“安全”。如果内容不安全或不合适,请回答“不安全”,然后进行简要说明。您的分析:""""""使用自定义提示过滤内容。"""

2025-01-03 10:49:55 1407

原创 面试场景题系列:设计通知系统

本文帮助您构建一个每天发送数百万次通知的可扩展的系统。

2025-01-02 11:09:22 1494

原创 提示词工程教程:提示词优化技术

本教程探讨了在使用大型语言模型时优化提示的高级技术。我们重点介绍两种关键策略:A/B 测试提示和迭代优化。这些方法对于提高 AI 驱动应用程序的有效性和效率至关重要。

2025-01-02 10:58:02 1374

原创 提示词工程教程:提示词长度和复杂性管理

本教程探讨了使用大型语言模型 (LLM) 时管理提示长度和复杂性的技巧。我们将重点关注两个关键方面:平衡提示中的细节和简洁性,以及处理长上下文的策略。

2025-01-01 14:32:18 667

原创 提示词工程教程:提示词格式和结构教程

概述本教程探讨了提示工程中的各种提示格式和结构元素,展示了它们对 AI 模型响应的影响。我们将使用 OpenAI 的 GPT 模型和 LangChain 库来试验不同的提示结构并分析其有效性。主题了解如何格式化和构建提示对于与 AI 模型进行有效沟通至关重要。结构良好的提示可以显著提高 AI 生成的响应的质量、相关性和一致性。本教程旨在提供实用见解,帮助您设计提示,以便在各种用例中引出期望的结果。内容概要不同的提示格式(问答、对话、说明)结构元素(标题、项目符号、编号列表)即时效果比较。

2025-01-01 10:20:43 1430

原创 面试场景题系列:设计爬虫系统

爬虫开发的复杂性取决于我们想要支持的爬虫规模,它可以是一个小的学校项目,只需要几小时就可以完成,也可以是一个需要专业开发团队持续优化的巨型项目。本文将帮助你设计一个大型爬虫项目的核心系统。

2025-01-01 10:18:53 2521

原创 提示词工程教程:提示链接和排序

本教程探讨了在使用大型语言模型的背景下提示链和排序的概念。我们将使用 OpenAI 的 GPT 模型和 LangChain 库来演示如何连接多个提示并为更复杂的 AI 驱动任务构建逻辑流程。

2024-12-31 18:45:26 438

原创 面试场景题系列:设计视频分享系统

在本章中,我们展示了类似YouTube的视频流媒体服务的架构设计。如果在面试的最后还有多余的时间,可以讨论下面的几个话题。•扩展API层:因为API服务器是无状态的,所以可以很容易地横向扩展API层。•扩展数据库:你可以谈论数据库复制和分片。•直播流媒体:指的是实时录制和广播视频。尽管我们的系统不是专门设计来进行直播的,但是直播和非直播流媒体有一些相似点,比如都需要对视频进行上传、编码和流式传输等操作。直播和非直播流媒体的显著区别有:◆ 直播有更高的延时要求,所以它可能需要使用不同的流媒体协议。

2024-12-31 12:37:38 674

原创 提示词工程教程:负面提示和避免不良输出

概述本教程探讨了负面提示的概念以及在使用大型语言模型时避免不良输出的技术。我们将重点介绍如何使用 OpenAI 的 GPT 模型和 LangChain 库来实现这些策略。主题随着人工智能语言模型变得越来越强大,有效地引导其输出至关重要。负面提示使我们能够指定模型响应中不想要的内容,从而帮助优化和控制生成的内容。这种方法在处理敏感话题、确保事实准确性或在输出中保持特定语气或风格时特别有用。内容概要使用反面例子来指导模型在提示中指定排除项使用 LangChain 实现约束评估和改进负面提示。

2024-12-31 11:09:13 556

原创 提示词工程教程:多语言和跨语言提示词

这些技术将使您能够创建更具包容性和全球可访问性的 AI 应用程序,利用跨不同语言环境的大型语言模型的强大功能。多语言和跨语言提示技术使我们能够创建更具包容性和全球可访问性的人工智能应用程序,打破语言障碍并实现跨不同语言环境的无缝沟通。本教程探讨了大型语言模型背景下的多语言和跨语言提示的概念和技术。我们将重点介绍如何设计可有效跨多种语言运行的提示,并实现语言翻译任务的技术。用于多语言支持的提示模板:使用 LangChain 的 PromptTemplate 创建灵活的、可感知语言的提示。

2024-12-30 15:50:21 748

原创 面试场景题系列:设计云盘系统

在本章中,我们提出了一个类似谷歌云盘的系统设计。强一致性、低网络带宽和快速同步,这些特性让这个设计很有趣。我们的设计包含两个流程:管理文件元数据和文件同步。通知服务是系统的另一个重要组成部分。它使用长轮询使客户端实时了解文件变更。和所有系统设计面试问题一样,这个问题没有完美解决方案。每个公司有特定的限制,而你必须设计一个满足这些限制的系统。了解设计的权衡和技术选择是重要的。如果面试的最后还剩几分钟时间,你可以讨论一下不同的设计选择。例如,我们可以从客户端直接将文件上传到云存储而不是通过块服务器上传。

2024-12-30 13:06:41 1277

原创 面试场景题系列:设计键值存储系统

本章讲了很多概念和技术。为了巩固你的记忆,下面的表6-2总结了分布式键值存储的特性和对应技术。

2024-12-29 10:43:25 1147

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除