自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

互联网架构师笔记

一线互联网架构师笔记,关注微服务和DDD,分布式和高可用架构,职场进阶方法和生涯规划

  • 博客(528)
  • 资源 (1)
  • 收藏
  • 关注

原创 一次Token是一次调用?你可能误解了大模型的计费单位

关键词理解方式Token 是什么处理文本的最小单位,不等于字或词Token 用来干嘛模型输入输出的计费依据Token 怎么算按字符分割,有经验公式和工具可查如何节省 Token优化提示词、控制 max_tokens、拆分上下文Token 的底层意义是模型注意力机制的基本计算单位如果你觉得大模型太贵、跑得太慢,很多时候不是因为模型太差,而是你“没搞明白 Token”。它不只是一个“计费单位”,而是你和 AI 沟通的语言粒度。

2025-04-16 11:20:08 602

原创 如何理解AI-First产品设计模式

"AI-First" 是过去几年科技圈的高频概念,尤其在大模型时代重新被提起,代表着一种从AI能力出发设计产品、组织与商业模式的范式变革。

2025-04-08 22:51:03 526

原创 后智能稀缺时代

当智能变得无处不在且几乎免费时,我该怎么做?

2025-04-08 11:18:43 525

原创 大模型开发的不同范式:应用、微调和专有模型

层级范式门槛可控性成本适合人群1应用开发(API + Prompt)低低低初创、个人开发者2微调开发(SFT、LoRA)中中中专业团队3专有模型开发高高高科研机构、大厂。

2025-04-07 12:21:10 667

原创 使用 LangChain4j 构建本地 RAG 系统

最新的 chatGPT-4o 只能基于 2023 年 6 月之前的数据进行回答,距离目前已经快一年的时间,如果想让 GPT 基于近一年的时间回复问题,就需要 RAG(检索增强生成)技术了。

2025-04-07 12:14:59 610

原创 DeepSeek对比ChatGPT有何改进,可以用更低成本计算

下面是基于DeepSeek公开论文和代码,与ChatGPT对比后总结的改进点,以及其为何能用更少算力训练大模型的解析。

2025-04-07 09:53:23 726

原创 ChatGPT不是AI,而是数学?真相远比你想的复杂

ChatGPT不是AI,而是数学?”这个说法有点片面,也有其道理。它强调的是:AI的底层是人类智慧的结晶,是科学与工程的成果。但别忘了,飞机也是一堆金属、螺丝和电路,但它能带你飞越万里。ChatGPT也是一堆矩阵和公式,但它能用语言连接你我。这背后的逻辑和美感,远比“它只是统计”来得深刻。

2025-04-07 09:43:32 462

原创 为什么相同prompt,Transformer 返回结果不一样

Transformer 本质是生成“概率分布”,不是选唯一答案使用了不同的采样策略语言本身就有丰富的“多样性”和上下文理解偏差ChatGPT 等模型为了提高“互动性”、“创造性”,故意引入了“不确定性”

2025-04-06 23:58:44 388

原创 Transformer原理及知识体系大纲

Transformer原理以及通过案例讲解,包括 1. Transformer架构通过输入文本,预测下一个字的概率,实现自然语言处理任务。

2025-04-06 23:54:07 540

原创 如何通过句块训练法(Chunks)提升英语口语

句块练习:别学词,学“语言单元”,口语不是“拼词造句”,而是使用常见表达块(chunks),展开说说如何分场景快速积累句型和短语

2025-04-05 11:39:40 649

原创 提高英语口语要解决哪些问题

如何有效提高英语口语能力,比如说不好、说的慢、发音不标准、表述不够地道不够等,这是所有英语学习者都会遇到的问题,尤其是我们在国内学习多年,却很少有真实交流环境。

2025-04-05 11:33:53 949

原创 场景化英语口语学习书籍推荐

这些书籍将枯燥的口语练习转化为 场景闯关、角色扮演、剧情解锁 的互动体验,配合现代技术工具,让学习过程如同玩沉浸式游戏。

2025-04-05 11:29:32 884

原创 雅思7分听说读写专项书籍推荐

下面按照 听力、阅读、写作、口语、综合书籍 五大类来分别列举高分推荐书籍,每本书包括:适合人群、核心内容、推荐理由,并贴合7分+目标

2025-04-05 11:09:24 837

原创 词根词缀 = 英语的 IDE 智能补全

从软件分层架构出发,构建一份从词根视角出发的分层词汇体系词表,就像构建一个有层次的 API 文档,把英语的单词按“词根 + 词源 + 应用场景”分类整理,方便你系统性学习、精准记忆、迁移运用。

2025-04-04 13:20:33 632

原创 从软件分层架构视角理解英语学习

英语就像一个强大的操作系统,从日耳曼内核起步,不断集成法语服务、拉丁/希腊模块,最后通过全球插件包,实现了强大的表达力和适应性

2025-04-04 13:02:59 664

原创 英语发展历史与词根词缀演进

英语发展历史、词根词缀演进、语系区分

2025-04-04 12:40:20 504

原创 二语习得理论(Second Language Acquisition, SLA)如何学习英语

二语习得理论提供了一个有力的框架,帮助我们理解学习第二语言的过程。通过有意识的输入、输出、互动以及避免语言石化现象,我们可以有效地掌握外语。、

2025-04-03 23:47:15 645

原创 通过发音学英语单词:从音到形的学习方法

但不像拼音文字(如汉语拼音、西班牙语等)那么规则,而是。,否则可能会受到英语的不规则拼写影响。:希望通过语音提高拼写能力的学习者。:想要通过听说强化单词记忆的学习者。:希望通过节奏感强化记忆的学习者。来学习单词,但需要结合一些。CVC 结构、常见发音规则。拆解单词音节,提高拼写能力。查询单词发音(各国口音)使用 IPA 辨别近音词。:喜欢互动学习的学习者。跟读音频提高发音和拼写。通过游戏强化发音和拼写。:初学者到中级学习者。通过视频查找单词发音。通过音素规则拼读单词。通过押韵强化单词记忆。

2025-04-03 21:58:43 1196

原创 中国人学习英语的系统化建议

从第一性原理出发,针对中国人学习英语的系统化建议

2025-04-03 20:29:01 613

原创 如何像母语一样学习英语

要像母语一样掌握英语听说读写,以下是被广泛验证过的学习策略和方案。每个方法都有不同的适用人群和学习侧重点,并且能够解决特定的学习难点。

2025-04-03 18:53:04 1024

原创 OpenAI Function Calling 函数调用能力与外部交互

如果您遇到标记限制,我们建议限制函数数量或您为函数参数提供的描述的长度。为 OpenAI 模型提供了一种强大而灵活的方式与您的代码或外部服务进行交互。定义的,所以您可以利用它的许多丰富的功能,如属性类型、枚举、描述、嵌套对象和递归对象。流式传输可用于显示进度,通过显示在模型填充其参数时调用哪个函数,甚至实时显示参数。函数由其架构定义,架构告知模型其功能以及其所需的输入参数。然后,您将执行函数代码,发回结果,模型会将它们合并到最终响应中。但是,您不是将各块聚合成单个字符串,而是将各块聚合成编码的。

2025-04-03 15:20:08 849

原创 AI创业机会:寻找技术可实现但认知未普及领域

信息差(Information Asymmetry)确实是商业竞争中的核心变量,尤其在技术变革期会催生结构性机会。

2025-04-03 14:43:07 603

原创 大模型ReAct:思考与工具协同完成复杂任务推理

ReAct框架可以让现有应用得到一次智能化的进化的机会。以前需要人工编排服务调用链路会成为历史。

2025-04-03 11:46:19 980

原创 Function Calling 和 ReAct 让 AI 大模型更加智能

Function Calling 和 ReAct 让 LLM。

2025-04-03 11:41:43 950

原创 定制化自己的 RAG 框架:结合 LlamaIndex 与自定义优化

本篇文章将介绍如何定制自己的 RAG 框架,并重点探讨 LlamaIndex 在索引管理与句子窗口解析方面的优化,以及如何整合 RAG 框架的优点到自己的项目中

2025-04-02 22:37:29 664

原创 不同向量数据库(FAISS / Pinecone / Weaviate)在 RAG 中的优缺点

FAISS、Pinecone 和 Weaviate 是当前主流的向量数据库,它们各有优缺点,适用于不同的应用场景。

2025-04-02 22:06:24 1006

原创 RAG 在 AI 助手、法律分析、医学 NLP 领域的实战案例

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索和生成模型的技术,广泛应用于 AI 助手、法律分析、医学 NLP 等领域

2025-04-02 22:03:08 1209

原创 RAG(Retrieval-Augmented Generation)检索的实现原理

RAG 主要依赖于 向量数据库 和 相似度计算 进行信息检索,填补大模型的知识盲区,提高回答的准确性。

2025-04-02 21:56:49 632

原创 中小创业公司差异化定位出海案例

中小企业的出海本质是用中国效率收割全球市场红利,通过差异化定位与精细化运营成功实现出海盈利,在SHEIN、TikTok等巨头阴影下,唯有更灵活、更凶悍、更懂数据者方能生存。

2025-04-02 10:11:49 511

原创 创业实战经验学习与资源清单

以下是一份系统整理的创业学习资源清单,涵盖传记、访谈、公开课、书籍、行业报告等类别,重点聚焦中国本土创业者实战经验与全球创业方法论

2025-04-01 17:41:05 867

原创 传统摩尔定律与 AI 时代的挑战

这里涉及摩尔定律在 AI 时代的演进,以及算力增长和 AI 发展的关系

2025-03-31 18:05:24 279

原创 BabyAGI 快速上手应用

BabyAGI 是一个轻量级、自我迭代的任务管理 AI Agent,基于 OpenAI API 和 Pinecone 向量数据库构建。

2025-03-31 14:22:05 205

原创 使用 Spring AI 和 LangChain4j 实现聊天机器人对比分析

使用 Spring AI 和 LangChain4j 实现聊天机器人对比分析

2025-03-31 10:00:59 1399

原创 AI大模型下传统 Spring Java工程开发的演进和变化方向

传统的Spring Java工程正经历从“业务逻辑+数据库”向“业务逻辑+AI推理+数据智能”的演进。

2025-03-31 09:54:40 492

原创 人工智能、机器学习经典计算机课程

以下是人工智能(AI)、机器学习(ML)和 AI 大模型相关的经典计算机课程,从入门编程、数学基础到深度学习、强化学习、自然语言处理(NLP)及 AI 领域实践等,适合不同阶段的学习者

2025-03-31 09:36:55 936

原创 Stanford CS230 Deep Learning 课程内容

斯坦福大学 CS230 课程是 Andrew Ng 主讲的深度学习课程,专注于神经网络、优化技术及其在计算机视觉、自然语言处理等领域的应用。

2025-03-31 09:27:44 448

原创 机器学习与AI大模型必备数学知识

机器学习与AI大模型必备数学知识

2025-03-30 23:34:53 750

原创 AI Agent 人工智能相关公开比赛汇总

参与 AI 相关比赛是提升技术能力、接触前沿算法、积累项目经验的绝佳方式。以下是全球知名的比赛,以及适合不同水平选手的竞赛分类。NeurIPS/CVPR/ICML 竞赛、Facebook FAIR、NASA Space Apps。Kaggle 初级比赛、Google Kick Start、AI4Good Hackathon。Devpost Hackathons、Tianchi 天池、Baidu AI 竞赛。ACM-ICPC、Google Code Jam、Kaggle 竞赛。你对哪些比赛最感兴趣?

2025-03-30 20:59:09 1118

原创 使用FastAPI-MCP,让 FastAPI 应用秒变 MCP 服务器

FastAPI-MCP 是一款零配置工具,可让 FastAPI 应用自动暴露所有端点,并兼容 Model Context Protocol (MCP)。

2025-03-30 17:49:40 470

原创 FastAPI 在 AI 大模型开发中的应用

FastAPI 介绍、原理及其在 AI 大模型开发中的应用

2025-03-30 17:42:12 306

雷电梦想家小越版

梦想家小越版简易易玩,超牛无敌非常非常好网的游戏。

2013-06-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除