- 博客(111)
- 收藏
- 关注
原创 Uvicorn
Uvicorn 是现代化 Python Web 生态中的重要组件,尤其适合异步应用。如果你是 FastAPI 或 Starlette 用户,它几乎是默认选择。对于生产部署,建议搭配反向代理(如 Nginx)和进程管理工具(如 Gunicorn)。
2025-06-30 14:39:24
353
原创 Layer by Layer: Uncovering Hidden Representations in Language Models
研究发现,中间层的表示可以在多种下游任务中提供优于最终层的表现,这对模型的可解释性、鲁棒性和效率都有潜在影响。利用这些强相关性,可以在无监督的情况下选择高性能的层,例如通过基于DiME的层选择方法,可以使Pythia-410M模型的MTEB得分平均提高3%。总的来说,这项研究为理解大型语言模型的内部表示提供了新的视角,并为进一步的研究奠定了基础。更好的识别潜在特征和表示的方法可能会放大潜在偏见,因此未来的工作需要探索确保中间层表示不会不成比例地强化偏见或导致实际应用中的意外差异的方法。
2025-06-27 20:47:50
332
原创 Agent-to-Agent (A2A) 协议全面解析:定义、原理、应用与未来
Agent-to-Agent(A2A)协议是由Google在2025年4月正式推出的开放标准通信协议,旨在解决不同AI智能体之间的互操作性问题。该协议为异构AI系统提供了一套统一的交互规范,使来自不同平台、不同供应商的智能体能够像人类团队一样进行有效协作。A2A协议的诞生标志着AI技术发展进入了一个新阶段——从单一智能体的能力提升转向多智能体系统的协同增效。在A2A协议出现之前,AI领域面临着严重的"巴别塔困境":每个智能体都有自己独特的通信方式和数据格式,导致跨系统协作极为困难。
2025-06-27 15:11:30
1370
原创 Server-Sent Events (SSE)
Server-Sent Events (SSE) 是一种HTML5技术,允许服务器通过HTTP连接向客户端(通常是网页浏览器)单向推送实时数据。与传统的客户端轮询不同,SSE建立了一个持久连接,服务器可以随时通过这个连接发送数据更新。SSE是单向通信协议,数据只能从服务器流向客户端,这与WebSocket的双向通信形成对比。这种特性使得SSE特别适合只需要服务器推送数据的场景。
2025-06-27 15:01:38
1042
原创 SSE(Server-Sent Events)、WebSocket和Polling的对比
根据实际需求(实时性、双向性、兼容性)和系统资源(服务器负载、带宽)综合选择。
2025-06-23 18:06:27
447
原创 大语言模型智能体开发的技术框架与应用前景
大语言模型(LLM)智能体开发已成为人工智能领域最活跃的研究方向之一,它通过赋予大模型规划、记忆和工具使用能力,极大地扩展了传统语言模型的应用边界。本文将系统梳理当前智能体开发的主流技术框架与工具链,分析其核心特性和适用场景,并展望未来主要应用方向和发展趋势。从金融保险行业的自动化流程到多智能体协作系统,从开源框架的快速发展到企业级解决方案的涌现,智能体技术正在重塑人机交互模式和工作流程自动化。
2025-06-11 21:25:23
1085
原创 N8N概述
(发音为 “n-eight-n”)是一个开源的,类似于或,但更注重和。它允许用户通过可视化界面连接不同的应用程序、API 和服务,构建自动化流程(称为。
2025-06-06 22:24:57
763
原创 博弈论概述
中如何行动和决策的数学理论。博弈论通过数学模型揭示策略互动的本质,为理解竞争与合作提供了强大工具,但其应用需结合具体情境和现实约束。的情境中如何做出最优决策,即每个人的收益不仅取决于自己的选择,还取决于他人的选择。若不存在其他策略组合能使至少一人更好而不损害他人,则该策略组合是帕累托最优。动态博弈中,玩家的策略在每个子博弈中都是最优的(排除不可信的威胁)。不完全信息博弈中,玩家基于概率信念选择最优策略。无论其他玩家如何选择,某一策略对玩家始终最优。在均衡中,每个玩家的策略是对其他玩家策略的。
2025-06-06 22:12:02
425
原创 向量数据库和关系型数据库的区别,优点,缺点和典型应用场景
向量数据库和关系型数据库是两种截然不同的数据管理系统,各自针对特定的数据模型和查询模式进行了优化。随着人工智能和大数据技术的发展,向量数据库作为新兴的数据库类型,在处理非结构化数据方面展现出独特优势。本文将从数据模型、查询方式、优缺点及典型应用场景等多个维度,全面比较这两种数据库的区别。
2025-05-01 19:16:12
1160
1
原创 为什么vllm能够加快大模型推理速度?
vLLM加速大模型推理的核心技术原理可分解为以下关键创新点:KV Cache分页机制将传统连续存储的KV Cache拆分为非连续内存页,类似操作系统内存分页管理,消除内存碎片并实现动态分配。13B模型单请求KV Cache从1.6GB降至可弹性扩展的块状存储内存共享优化相同前缀的请求(如多用户问相似问题)可共享KV Cache内存页,降低重复计算连续批处理(Continuous Batching)动态合并不同进度的请求至同一批次,GPU利用率提升3倍以上定制化CUDA Kernel针对注
2025-04-26 21:07:14
660
原创 扩散模型简介
扩散模型通过逆扩散过程生成数据,在图像、文本等领域表现优异,但需权衡生成质量与计算效率。未来研究方向包括模型加速、多模态融合及理论优化。
2025-04-12 19:43:50
320
原创 python示例类
这是一个简单的 Python 类示例,这个类代表一个名为 Person 的对象,具有姓名、年龄属性,并且有自我介绍和增加年龄的方法。在类的外部,创建了一个 Person 类的实例 person1,并调用了 introduce 和 have_birthday 方法。_ 方法:这是类的构造函数,用于初始化对象的属性,也就是姓名和年龄。have_birthday 方法:用于增加对象的年龄并输出相关信息。introduce 方法:用于打印对象的自我介绍信息。
2025-04-02 18:04:12
270
原创 MCP(Model Context Protocol,模型上下文协议)
MCP(Model Context Protocol,模型上下文协议)是大语言模型领域由Anthropic公司于2024年11月推出的开放协议,旨在通过标准化接口实现LLM(大语言模型)与外部数据源、工具及服务的高效安全集成。
2025-03-29 08:48:55
356
原创 Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric
文章聚焦于大语言模型指令调优中数据多样性的度量问题,通过实验分析现有度量方法的不足,提出了新度量指标NovelSum和数据选择策略NovelSelect,为指令调优的数据工程实践提供了有效指导。
2025-03-21 23:10:44
459
原创 DoS攻击防范
实际防御需结合业务场景选择组合策略。例如,中小型网站可采用“CDN+WAF+流量清洗”方案,金融等高安全需求场景推荐“高防IP+集群化部署+实时监控”。
2025-03-13 22:46:18
246
原创 密码学研究热点
开发能够抵抗量子计算机攻击的加密算法,如基于格的密码学(LWE、NTRU)、基于同源的密码学(Isogeny)和基于编码理论的密码学。
2025-03-13 22:07:48
1347
原创 比特币中的相关技术
去中心化:没有中心机构控制。透明可查:所有交易公开,但用匿名地址保护隐私。防篡改:区块链+密码学确保数据安全。抗审查:任何人可自由参与转账和记账。
2025-03-08 19:43:57
1110
原创 JavaScript中的主要知识点
变量声明使用 var(函数作用域)、let(块级作用域)和 const(常量)声明变量,理解变量提升与暂时性死区。数据类型分为基本类型(Undefined、Null、Boolean、Number、String、Symbol、BigInt)和引用类型(Object、Array、Function)。注意类型转换规则(如 == 与 === 的区别)。运算符与控制流程包括算术、比较、逻辑运算符,以及 if/else、switch、for/while 循环等流程控制语句。
2025-03-06 11:36:52
364
原创 c++中的主要知识点
封装与访问控制通过 public、private、protected 控制类成员的可见性,隐藏实现细节。继承与多态继承实现代码复用,动态多态通过虚函数(virtual)和纯虚函数(抽象类)实现运行时绑定。静态多态包括函数重载和模板(编译期确定)。类与对象构造函数/析构函数、拷贝构造函数、深浅拷贝问题(需手动管理堆内存)。运算符重载(如 +、=)和友元函数。
2025-03-06 11:33:29
215
原创 java中的主要知识点
基本数据类型:byte、short、int、long、float、double、char、boolean,以及引用类型(类、接口、数组)。运算符与流程控制:算术/逻辑运算符、条件语句(if-else、switch)、循环结构(for、while)。数组与集合数组是固定长度的同类型元素集合,索引从 0 到 length-1,需注意越界异常。集合框架包括 List(如 ArrayList、LinkedList)、Map(如 HashMap)、Set(如 HashSet)等,支持动态扩容。
2025-03-06 10:54:26
266
原创 c语言中的主要知识点
程序结构包含顺序结构、选择结构(if/switch)、循环结构(for/while/do-while)。程序必须包含且仅有一个main函数作为入口。数据类型与变量基本类型:整型(int、long)、浮点型(float、double)、字符型(char)。构造类型:数组(需注意初始化规则)、结构体、共用体。常量与变量:常量需通过const或#define定义;变量需先定义后使用,区分全局变量(作用域整个程序)和局部变量(作用域限于代码块)。运算符与表达式。
2025-03-05 18:32:14
218
原创 python中的主要知识点
变量与数据类型动态类型:无需声明变量类型,支持整数、浮点数、字符串、布尔值等。核心数据类型:列表(可变有序)、元组(不可变有序)、字典(键值对)、集合(无序不重复)。代码结构与规范缩进:用4个空格表示代码块,替代大括号。注释:以#开头,多行注释可用三引号。输入与输出input()获取用户输入,print()输出内容,支持字符串格式化(如f-string)。
2025-03-05 18:28:56
249
原创 计算机视觉领域的研究热点
当前研究呈现两大特点:技术融合:如3D建模与生成模型结合、多模态与大语言模型协同;实用化导向:聚焦实时性(自动驾驶、机器人)、鲁棒性(跨域适应)和可解释性(医学诊断)。
2025-03-05 14:26:37
362
原创 人工智能技术的典型应用场景
以癌症筛查为例,传统的人工诊断可能会因为医生的经验和主观判断存在一定的误差,而AI辅助影像诊断系统可以对影像进行细致入微的分析,发现那些人类肉眼难以察觉的微小病变,大大提高了癌症早期筛查的准确率。例如,在航空发动机的维护中,预测性维护系统可以根据发动机的运行数据,提前发现潜在的故障隐患,避免因发动机故障导致的航班延误或事故。通过自然语言处理技术,人工智能系统可以对学生的作文、简答题等主观题进行准确批改,同时根据学生的答题情况生成详细的学习反馈,指出学生的优点和不足之处,为学生提供有针对性的学习建议。
2025-03-02 19:25:31
1239
原创 基于ai技术的视频生成工具
特点:支持数字人播报、文字转视频,提供免费模板和素材库,登录即送5分钟免费时长,每日签到可兑换额外额度。限制:免费版分辨率较低,部分高级功能需付费。
2025-03-01 19:30:46
815
原创 大语言模型的不足与研究热点
大语言模型的不足主要集中在技术局限、数据依赖和应用风险,而研究热点则围绕效率优化、多模态扩展及垂直领域深化展开。未来需结合人类反馈(如伦理审核)与技术创新(如轻量级微调),平衡模型能力与可控性。更多技术细节可参考相关研究。
2025-02-25 11:55:57
926
原创 Accurate predictions on small data with a tabular foundation model
TabPFN 是一种很有前景的表格数据基础模型,它能够实现高精度预测并具有强大的基础模型特性。TabPFN 的提出为开发更高效、更鲁棒的表格数据学习方法开辟了新的途径,并为各种应用场景提供了强大的工具。
2025-02-11 15:53:44
476
1
原创 降维算法概述
线性问题:优先选择PCA或LDA(若有标签)。可视化需求:t-SNE或UMAP(后者更高效)。流形结构数据:Isomap或LLE。深度学习场景:自动编码器。计算资源有限:随机投影或增量PCA。
2025-02-10 21:37:04
779
1
原创 机器学习中常用的数据预处理方法
广告 CTR 预测(构造用户行为组合特征);图像识别(提取边缘特征)。:归一化用于图像像素值处理;标准化用于非均匀分布特征(如年龄、收入)。:医疗数据(缺失较多时用模型填充);电商数据(删除缺失少的特征)。:独热编码用于性别、颜色;标签编码用于有序类别(如学历等级)。:图像数据压缩(PCA);高维聚类可视化(t-SNE)。(如图像/文本)依赖增强与向量化。侧重特征工程与缩放,
2025-02-08 15:47:18
957
原创 机器学习中常用的评价指标
### **一、分类任务常用指标**#### 1. **准确率(Accuracy)**- **定义**:正确预测样本数占总样本数的比例。- **优点**:直观易懂,适用于类别平衡的数据。- **缺点**:对类别不平衡数据敏感(如欺诈检测中99%的负样本)。- **应用场景**:类别分布均匀的简单分类任务(如手写数字识别)。#### 2. **精确率(Precision)与召回率(Recall)**
2025-02-07 11:24:36
1138
1
原创 大语言模型概述
大语言模型正从通用型向专业化、多模态、高效率方向演进,同时伦理安全与用户体验成为关键挑战。未来,技术突破将集中在深度推理、行业定制化及人机协作等领域,推动AI从工具向智能伙伴转型。
2025-02-04 20:29:10
804
1
原创 图算法概述
图算法在机器学习和深度学习领域扮演着重要角色,尤其在处理非欧几里得数据(如社交网络、分子结构、知识图谱)时表现突出。传统图算法侧重手工特征与统计方法,而深度学习(尤其是GNN)通过端到端学习自动捕获复杂模式。实际应用中需根据任务需求(实时性、数据规模、可解释性)选择合适的模型。
2025-02-03 19:37:32
776
1
原创 异常检测概述
异常检测是解决“大海捞针”问题的关键技术,其方法从传统统计模型发展到深度生成模型,应用场景覆盖工业、医疗、金融等核心领域。未来需进一步解决动态环境适应、可解释性及小样本学习等挑战,同时结合因果推理、自监督学习等前沿方向提升鲁棒性。异常检测是机器学习与深度学习中的重要研究课题,旨在识别数据中与大多数样本显著偏离的异常样本(离群点)。
2025-02-02 10:57:48
782
原创 遗传算法概述
遗传算法(Genetic Algorithm, GA)是一种模拟生物进化过程的启发式优化算法,其核心思想是通过模拟自然选择、遗传和变异的机制,逐步优化候选解以解决复杂问题。算法维护一个由多个个体(候选解)组成的种群,每个个体通过编码(如二进制、实数等)表示问题的潜在解。例如单点交叉、多点交叉等。通过适应度函数(目标函数)衡量个体的优劣,适应度越高,个体被保留的概率越大。以一定概率随机改变个体的部分编码,增加种群多样性,避免陷入局部最优。通过多代选择、交叉和变异,种群逐渐进化,最终收敛到近似最优解。
2025-02-02 10:53:22
897
原创 分享求职时遇到的一道面试题
5要求用识别率要达到95%以上【注意:测试结果要有10000个不同的样本,命名规范,xxx原图,xxx选择x角度的结果图,这样方便对应看结果】12您可以评估一个费用【如果您认为需要付款给您,也可以的,但是要达到100%的要求】,这个可以付费测试,但是要达到要求。4用程序拖动正确的距离【至少日志要求10000个不同的图片以上,如果有干扰的类似的图片,不算在10000以内】10要求每个步骤要求有日志,通过日志能看到具体的旋转认证码的图片,拖动距离,拖动后的正确与否的判断。百度的旋转认证码识别。
2025-01-31 15:03:30
303
原创 Efficient anomaly detection in tabular cybersecurity data using large language models
目的:帮助模型快速熟悉关键数据特征和模式。方法:随机选择一个正常样本和一个异常样本,将这些样本转换为JSON格式,便于模型处理和理解数据的结构和属性。效果:增强模型对关键模式的早期识别能力,从而实现更快、更准确的异常检测。
2025-01-27 19:02:18
1516
原创 LightGBM算法
LightGBM(Light Gradient Boosting Machine)是一个基于决策树算法的分布式梯度提升框架。它旨在减小数据对内存的使用、减小通信代价并提升多机并行时的效率,从而在数据计算上实现线性加速,在处理大数据集和高维特征时展现出更高的效率和扩展性,是机器学习领域的重要工具,通常应用于二分类、多分类和排序等场景。
2025-01-22 12:22:20
432
1
原创 UMAP(Uniform Manifold Approximation and Projection)算法
UMAP(Uniform Manifold Approximation and Projection)是一种非线性降维技术,主要用于数据可视化和异常检测。它通过构建数据的拓扑图并优化低维表示,能够在保留数据结构和相对距离的同时,将高维数据映射到低维空间。
2025-01-20 19:27:45
877
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人