自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 llama4模型原理速览

2025年4月5日,meta发布了llama系列模型的第四代,包括Scout、Maverick和Behemoth。llama4支持多模态理解,工具调用,编程,多语种任务(暂不支持中文),知识截止到24年8月。多模态支持上,可输入文本和最多5张图片,输出文本;主要亮点:Maverick和 Scout模型此次也是首次采用了MoE混合专家结构,并且主打的亮点是原生的多模态能力、1千万上下文窗口,目前已经发布权重可用。

2025-04-06 12:51:59 1150

原创 Django框架联合创始人Simon Willison:解锁AI写代码的高效模式

Simon Willison开发了一个让AI总结某个项目codebase的工具,利用。cd /tmpAI输出的文档总结了项目的架构、数据流转过程、各个模块之间的依赖关系、如何部署、项目的优势和潜在提升项,借此可以快速了解一个代码仓库的原理。例如让AI总结Monolith工具的codebase。

2025-03-19 20:45:00 824

原创 深度解析manus:技术原理剖析、开源平替方案架构分析

2025年3月初,号称首个通用性智能体的Manus发布,让agent作为7/24小时自动打工人的多个场景随即在社交媒体上引发热议,内测邀请码一时洛阳纸贵,被炒制数万元,同时带动了150多只AI智能体概念股涨停。据媒体披露,Manus背后的母公司蝴蝶效应的投资方包括真格基金、腾讯等。爆火之后,Manus的资源也是好起来了。不到两周的时间,Manus团队很快与阿里通义千问团队正式达成战略合作,双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。

2025-03-18 22:00:00 2871 2

原创 deepseek GRPO算法保姆级讲解(数学原理+源码解析+案例实战)

GRPO(Groupwise relative policy optimization)群组相对策略优化是deepseek提出的一种RLHF(基于人类反馈的强化学习)技术。首次提出是在DeepSeekMath中,RL被证明在SFT阶段后能有效提升LLM的数学推理能力。在GRPO提出之前,有两种流行的RLHF技术被广泛用于大模型的对齐过程中,分别是PPO和DPO。

2025-03-16 23:06:33 1622

原创 openai agents SDK原理详解

上周manus大火,这周openai也坐不住了。3月12日凌晨,openai推出了新的agent开发套件,包括网页搜索、文件搜索、电脑使用、Responses API等,以及Agents SDK。Responses API 是 OpenAI 推出的一种新的 API 原语,它结合了 Chat Completions API 的简洁性和 Assistants API 的工具使用能力,旨在帮助开发者更轻松地利用 OpenAI 的内置工具构建agents.

2025-03-12 23:12:45 1169

原创 图灵奖得主Richard S. Sutton 苦涩的教训(the bitter lesson)|AI经典重温

从70年的人工智能研究中得到的最重要的启示是,利用计算能力的通用方法最终是最有效的,而且优势巨大。其根本原因在于摩尔定律,或者更准确地说,是计算能力单位成本持续呈指数级下降的普遍趋势。大多数人工智能研究都假设智能体可利用的计算能力是固定的(在这种情况下,利用人类知识将是提升性能的少数途径之一),然而在比典型研究项目稍长的时间内,必然会有海量的计算能力可供使用。为了在短期内取得显著改进,研究人员试图利用他们对领域的专业知识,但从长远来看,唯一重要的因素是利用计算能力。

2025-03-06 20:00:00 1207 1

原创 MIT 6.S184 流匹配与扩散模型公开课

MIT 2025年开设的关于流匹配算法与扩散模型的新课,6.S184: Generative AI with Stochastic Differential Equations(生成式人工智能与随机微分方程),授课教师是Peter Holderrieth和Ezrah Erives。生成式AI是一种能创建与训练数据相似的新数据的AI技术,例如生成逼真的图像、音乐或分子设计。课程涵盖涵盖扩散模型、基于流模型的训练、图像生成、生成式机器人技术和蛋白质设计等主题。并通过Google Colab提供实验代码。

2025-03-03 22:13:47 304

原创 claude3.7 Sonnet:首个混合推理大模型原理简介

2025 年 2 月 28 日下午 5:25,Anthropic发布了claude3.7 sonnet模型,这是首个混合推理语言大模型,即参照人类思考系统的快速反应与慢反思结合的工作模式,将LLM快速响应和思维链深度思考功能集成到统一的大模型中。其核心特点是能够在标准模式下提供近乎即时的响应,或在扩展思考模式下进行可见的逐步推理。从官网的介绍中,可以看到claude3.7在自己的长板能力(编程和前端开发)上取得了进一步的提升;

2025-02-28 22:15:00 1106

原创 2024年金喵奖(product hunt)上榜AI产品及发展趋势盘点

AI编程工具带来开发效率跃升AI编程工具使单个开发者产出媲美传统5人团队,生产效率跃升。Cursor通过深度整合Claude 3.5 Sonnet模型,实现了代码自动补全、跨文件操作和复杂逻辑生成;Supabase通过Postgres.new优化数据库管理,结合AI助手实现智能查询;bolt.new则以AI自动化配置开发环境,形成从编码到部署的全链条辅助。多模态AI技术进入成熟落地期。

2025-02-26 23:34:37 679

原创 大模型安全问题详解(攻击技术、红队测试与安全漏洞)

提示注入攻击(Prompt Injection)数据投毒攻击(Data Poisoning)模型克隆攻击(Model Cloning)拒绝服务攻击(DoS)和拒绝钱包攻击(DoW)插件安全漏洞(Insecure Plug-in Design)敏感信息泄露(Sensitive Information Disclosure)模型篡改 (Model Tampering)对抗性攻击 (Evasion Attacks)软件供应链攻击什么是LLM红队测试?如何进行LLM红队测试?

2025-02-22 21:25:17 1320

原创 openai agent第二弹:deepresearch原理介绍

2月2日openai上线了第二个agent: deep research,具体功能类似24年11月google gemini发布的deep research。

2025-02-05 22:45:19 1973

原创 operator: openai CUA agent原理介绍

继去年10月底Anthropic发布Claude 3.5的computer use能力之后,OpenAI在今年1月24日也发布了计算机使用agent(Computer-Using Agent, CUA)模型——Operator。这一模型结合了GPT-4o的视觉能力和通过强化学习获得的高级推理能力,能够解释截图并与图形用户界面(GUI)进行交互。它不仅能够执行日常任务,如在线购物、预订餐厅或购买活动门票,还能够在用户的指导和监督下完成更复杂的任务。

2025-01-24 23:28:37 2011

原创 Anthropic agent构建指南详解

2024年agent出现了非常多的框架,但是大多数其实是workflow,Anthropic的这份指南总结了agent和workflow的常见模式和适用场景,特别是prompt的分层编写技巧,值得一读。

2025-01-24 00:43:13 905

原创 openai swarm agent框架源码详解及应用案例实战

swarm是一个轻量级、高效、可控的agent协作和执行框架,Agent和handoffs是其中的两种原语抽象(primitive abstractions)。一个Agent包含和tools,并且可以在任何节点选择将对话任务移交给另一个Agent. Swarm类整体代码非常简洁,用不到五百行代码实现了智能体的基本功能。此外,为agent定义业务规则的结构化prompt也值得参考。数据类型。

2025-01-05 20:02:35 1829

原创 LLM提示词编写技巧-prompt必知必会

GPT提示词编写技巧

2024-05-23 16:21:56 2881

原创 飞行汽车简介|360行未来行业篇

飞行汽车的发展历史始于1917年,当时被称为“飞行汽车之父”的柯蒂斯首次尝试研制飞行汽车。到了2023年,Alef Aeronautics宣布其飞行汽车Model A获得了美国联邦航空管理局(FAA)颁发的特殊适航认证,这标志着飞行汽车技术向商业化和实用化迈出了重要一步。根据VFS的数据,截至2020年3月5日,共有260种飞行器,其中包括99种矢量推力、39种升力+巡航、26种无翼多旋翼、46种悬停自行车/飞行装置和20种电子直升机和电子陀螺仪。吉利收购美国Terrafugia。小鹏汇天发布飞行汽车。

2024-05-18 22:32:47 1082

原创 Python中的语法糖介绍

装饰器用于定义类方法。类方法是绑定到类而不是实例的方法,可以通过类名或实例名调用。在类方法中,第一个参数通常被命名为cls,表示类本身。使用装饰器来定义类方法,可以使得在调用该方法时,类会被作为第一个参数传递给方法。这对于在方法中访问类级别的属性或执行与类相关的操作非常有用。被。

2024-02-27 21:41:53 1453

原创 贝叶斯网络入门教程(原理介绍+python代码实现)

本文介绍了贝叶斯网络原理和基于python的实现,并通过一个小例子进行了说明

2023-03-01 22:59:28 13662 4

原创 如何用latex写论文

本文介绍了在overleaf网站上使用latex写文章的常用代码

2022-12-28 21:31:36 1136

原创 Frechet distance距离计算原理及python实现

Frechet距离的原理和python实现

2022-11-18 18:40:50 7205 2

原创 高斯过程回归(Gaussian process regression)原理详解及python代码实战

高斯过程回归(Gaussian process regression,GPR)是一个随机过程(按时间或空间索引的随机变量集合),这些随机变量的每个有限集合都服从多元正态分布,即它们的每个有限线性组合都是正态分布。高斯过程的分布是所有这些(无限多)随机变量的联合概率分布。定义:一个高斯过程是一组随机变量的集合,这组随机变量的每个有限子集构成的联合概率分布都服从多元高斯分布,即:f∼GP(μ,k)(1−1)f \sim GP(\mu,k) \qquad(1-1) f∼GP(μ,k)(1−1)其中μ(x)\m

2022-11-12 18:36:16 30970 6

原创 集成经验模态(EEMD)原理详解与python实现

本文介绍了集成经验模态分解算法的原理,以及代码实现

2022-11-12 18:34:18 18167 8

原创 pytesseract中文OCR安装详细步骤(windows环境)

下载tesseract安装依赖包pillowpip install -i https://pypi.tuna.tsinghua.edu.cn/simple pillow安装Tesseract-OCR直接下载地址:https://digi.bib.uni-mannheim.de/tesseract/下载v5-2019版本;安装exe时,选择安装中文简体和繁体的语言包,自定义安装路径;配置Tesseract-OCR 环境变量环境变量-系统路径中添加Tesseract在本机上exe对

2022-04-03 15:27:52 2494

原创 django概览

MTV模式model-template-view(模型-模板-视图)模式,模板是一个文本,用于分离文档的表现形式和内容。MTV 模式本质上与 MVC (Mode-View-Controller))相同,都是让各组件保持低耦合的关系。MVC模式中M:模型(Model),数据存取层,负责业务对象和数据库对象。V:视图(View),与用户的交互,负责显示与怎样显示。C:控制器(Controller),接受用户动作,调用模型,输出相应视图。三者像插件一样以松耦合的形式连接在一起。MTV 具体定义如下:M:模型

2022-03-15 11:30:41 1648

原创 免费英文有声书网站

lit2go英文有声书资源较为丰富,可以搜索。https://etc.usf.edu/lit2go/librivox网友业余爱好者自发录制上传有声书的平台。https://librivox.org/esl-bitshttps://esl-bits.net/专业的有声书资源网站

2022-02-25 17:33:54 1383

原创 图节点嵌入:编码器-解码器(cs224w笔记-lecture3.1)

文章目录图表示学习(graph representation learning)节点嵌入(embedding nodes)节点嵌入步骤节点相似度节点嵌入是一种无监督或自监督的学习方式,且嵌入具有任务独立的特点,即不针对特定任务,而是可以用于任何任务。图表示学习(graph representation learning)图表示学习的意义在于消除每次需要手工特征工程的繁琐,为在图上进行机器学习生成有效的、任务独立(task independent)的特征表示,用于节点分类、链接预测、图分类、异常节点检测

2021-09-12 20:35:10 1300

原创 地图匹配算法开源项目合集

ST-Matching算法基于隐马尔可夫模型,

2021-07-10 13:47:27 3905 7

原创 R语言奇妙配色(艺术家风格,BBC风格)

艺术家风格的配色https://github.com/tomasokal/rtist含十五位艺术家绘画作品的配色。library(rtist)# Display possible palettesrtist::rtist_help()#> rtist Painting Artist#> 1 raphael Saint Catherine of Alexandria Raphael

2021-06-11 15:23:28 725

原创 空间分析中的可变面元问题(MAUP)

可变面元问题(Modifiable areal unit problem,MAUP)因所选面积单元的不同对分区结果产生的影响称为可变面元问题,由MAUP问题造成的统计结果和分析结果的偏差常以尺度效应(scale effect)和分区效应(zoning effect)来描述.尺度效应尺度效应导致不同聚合水平间统计结果的差异,变量间的相关性依赖于数据聚合时的面积单元大小,即分区数目或区划分类数。分区效应分区效应描述了同一尺度下由于数据的组合和配置不同造成的统计结果的差异,即区划方案所导致的结果差异。

2021-06-10 09:18:54 4639

原创 合成控制法原理

合成控制法反事实思维是**鲁宾反事实分析框架(Rubin’s counterfactual framework)**下进行思考, 本质思想是为处理组(treated group)找到一个合适的控制组(control group)。合成控制法的思想是对于处理组,选择与处理组具有相似特征且未受到政策干预的控制组。通过对若干个控制区进行线性组合,构造一个近似处理组的合成控制区域(synthetic control region).对于未受政策影响的潜在控制组(donor pool),通过权重向量给控制组内每

2021-05-23 17:35:19 8278

原创 haversine公式计算两经纬度点距离

Haversine公式半正矢公式(haversine equation)用于计算两经纬度点的距离,公式为:d=2rargsin⁡(sin⁡2(lat2−lat12)+cos⁡(lat2)cos⁡(lat1)sin⁡2(lon2−lon12))d=2r\operatorname{argsin}(\sqrt{\sin^2(\frac{lat2-lat1}{2})+\cos(lat2)\cos(lat1)\sin^2(\frac{lon2-lon1}{2})})d=2rargsin(sin2(2lat2−la

2021-05-10 18:57:36 18968 4

原创 matplotlib+seaborn+pyecharts绘图总结

seaborn绘图https://www.cnblogs.com/dan-baishucaizi/p/9467064.html

2021-04-14 14:44:31 2557 4

原创 python-plotly绘图保姆级教程(各类图表、绘图配置、地理数据可视化、常见问题)

地理可视化https://plotly.com/python/map-subplots-and-small-multiples/

2021-03-25 17:58:44 15082 1

原创 kindle电子书资源搜索及制作教程

kindle 支持的电子书格式电子书支持格式 Kindle (AZW)/TXT/PDF/MOBI/PRC原格式/HTML/DOC/DOCX图片支持格式 PEG/GIF/PNG/BMP电子书支持格式 Kindle (AZW)/TXT/PDF/MOBI/PRC原格式/HTML/DOC/DOCX图片支持格式 PEG/GIF/PNG/BMP电子书搜索网站书伴站内有大量kindle电子书,还有kindle使用技巧。电子书制作calibre开源软件,支持各类电子书格式导入和导出,以及制作电

2021-03-20 16:46:02 945

原创 解决Try setting the GDAL_DATA environment variable

Try setting the GDAL_DATA environment variable to point to the directory containing EPSG csv files报错原因是GDAL装时缺少了gcs.csv数据文件,将此文件下载后放在GDAL对应的python目录下,然后在系统中添加GDAL_DATA的环境变量指向该路径即可。参考文章https://inbo.github.io/niche_vlaanderen/faq.htmlhttps://blog.csdn.

2020-12-26 21:37:01 1378

原创 配色色卡资源整理

中国传统颜色色卡https://colors.ichuantong.cn/http://color.xunmi.cool/http://zhongguose.com/#songshuanglv日本传统配色色卡https://www.colordic.org/w在线配色网站https://mycolor.space/?hex=%23845EC2&sub=1植物种子配色:https://www.design-seeds.com/blog/...

2020-11-18 14:45:06 15274

原创 SUMO交通仿真-核心概念和基础知识速览

sumo环境变量设置用户变量添加SUMO_HOME。官网说明

2020-11-07 15:46:27 7537 15

原创 设计素材搜索网站(长期更新)

1.pexelshttps://www.pexels.com/zh-cn2.hippopxhttps://www.hippopx.com/zh3.pixabayhttps://pixabay.com/images/search4.unsplashhttps://unsplash.com/5.视觉中国https://www.vcg.com/creative/

2020-08-11 21:04:41 2873

原创 jQuery-常用知识recap

jQuery recapjQueryjQuery选择器TraversejQuery托管(host jQuery)jQuery methodDOM manipulation插入元素事件监听(event listeners)监听鼠标:monitorEvents($0)监听按钮jQueryjQuery是一个javascript库,不包含任何的魔法。$相当于jQuery的指针,实质就是一个函数。使用jQuery可以轻松的访问DOM树,如$('div')可以访问div标签元素。获取页面上所有的<li>

2020-08-10 20:27:33 384

原创 python项目自动生成requirement文件

pipreqs-适用单个项目该包可以自动生成一个项目所用的所有包文件 。通过pip方式安装该包:pip install pipreqs查看安装的pipreqs包的版本:pip show pipreqsName: pipreqsVersion: 0.4.10Summary: Pip requirements.txt generator based on imports in projectHome-page: https://github.com/bndr/pipreqsAuthor:

2020-07-23 14:07:26 1036

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除