- 博客(89)
- 收藏
- 关注
原创 用 STDIO 构建父子进程通信 —— 从管道到防御式编程
本文介绍了一个基于STDIO的父子进程通信系统,通过Python的subprocess模块实现。系统采用标准输入输出管道进行数据交换,重点设计了非阻塞读取机制(后台线程+Queue)和防御式编程策略(状态检查和超时控制)。子进程处理输入并返回包含元数据的JSON响应,父进程通过守护线程异步读取子进程输出并存入安全队列。实验展示了如何构建安全、稳定、可恢复的进程间通信系统,体现了防御式编程"不信任外部输入、预留错误路径"的哲学思想。
2025-11-04 10:45:36
907
原创 【随便聊聊】和ChatGPT聊聊潜空间
摘要 深度学习模型的潜空间(latent space)反映了模型对世界的内部几何表征,其结构随模型架构演变而呈现不同形态: CNN:分层局部流形,通过卷积逐层聚合语义,形成多尺度金字塔结构。 RNN:动态时间轨迹,隐状态序列构成时间流形,吸引子结构稳定长时记忆。 ResNet:残差连接的连续流形,每层微调潜空间,保持平滑性与可逆性。 Transformer:非欧几里得语义场,注意力机制构建全局图结构,token间动态交互。 潜空间的演化趋势是从局部到全局(CNN→Transformer),从静态到动态,最终
2025-11-02 02:39:35
1303
原创 【傻子速通LLM Agent系列】读复旦米哈游综述4 原文brain Knowledge部分
主题关键研究方向代表论文启示语言生成质量评估多维评测、跨模态对话质量、幻觉检测LLM-Eval, ChatGPT多模态评估Agent “Brain” 的语言输出质量与稳定性需系统量化评估具身智能与感知-行动一体化从文本→感知→行动的端到端决策PCA-EVAL对于Agentic AI,提示LLM不再是文本工具,而是“决策核心”语法纠错与语言精度语言细节处理与多语言泛化ChatGPT GEC研究展示LLM在低资源环境下的稳健性心智理论与社会推理模拟他人心理状态、ToM能力验证。
2025-10-31 06:39:05
603
原创 【LLM Agent 理论基础】读复旦米哈游综述3 原文background部分
本文梳理了AI智能体的理论背景与技术演进。从哲学视角探讨了智能体的起源(亚里士多德、休谟)及其核心特征——自主性与能动性,并针对人工系统能否具备意向性展开讨论。技术发展方面,文章系统总结了符号智能体、反应式智能体、强化学习智能体、迁移/元学习智能体,直至当前基于大语言模型(LLM)的智能体演进路径。特别指出LLM因其涌现能力、多模态感知和工具调用特性,成为新一代智能体的理想"大脑",兼具符号推理与反应式行动优势。全文为理解智能体的哲学基础与技术实现提供了清晰框架。
2025-10-31 06:23:12
895
原创 【速通LLM Agent系列】读复旦米哈游综述2 原文introduction部分
本文从哲学与AI发展视角探讨了智能体(Agent)的演进。18世纪狄德罗提出语言能力可作为智能标准,图灵将其发展为机器智能的测试方法。智能体概念源于哲学中的意向性理论,后演变为具备感知、决策、行动能力的AI实体。传统AI智能体受限于特定任务,而大型语言模型(LLM)展现出通用智能潜力,可扩展至感知、具身及社会层面,被视为实现通用人工智能(AGI)的关键。研究展望了基于LLM的多智能体社会形成及其与人协作的未来图景。
2025-10-31 06:16:35
656
原创 【LLM Agent 理论基础】读复旦米哈游综述1
摘要: 本文系统综述了基于大型语言模型(LLM)的智能体研究进展。LLM被视为实现通用人工智能(AGI)的关键路径,其感知-决策-行动闭环能力为构建通用AI智能体提供了基础。研究提出三要素框架(大脑、感知、行动),并探讨了单智能体、多智能体及人机协作等应用场景。特别关注了智能体社会的群体行为特征及其对人类社会的启示,最后指出该领域的开放性问题。该综述为LLM智能体研究提供了系统性分析框架。 (150字)
2025-10-31 05:33:30
659
原创 IPv6地址结构统计的GPU加速可能性分析
随着地址量级超过1亿,单机串行处理将遭遇性能瓶颈,尤其在“按ASN聚合”阶段出现显著内存压力与运行时间上限。因此,我们探索是否可以将此类计算迁移至GPU。
2025-07-17 02:37:21
446
原创 DuckDB 高效导入 IPv6 地址数据的实践与性能对比
通过本次对比实验可得出结论:DuckDB 原生批量导入机制在面对大规模结构化数据时具备显著优势,能够充分利用其列式存储与向量化执行引擎,实现数量级的性能提升。在 IPv6 地址探测等大规模网络测量场景中,应优先采用批量 SQL 方案,避免传统逐行插入方法带来的性能瓶颈。
2025-07-16 23:54:02
1037
原创 【人工智障生成日记1】从零开始训练本地小语言模型
本文详细介绍了从零开始训练本地小语言模型MiniGPT的过程,使用TinyStories数据集,并在NVIDIA RTX 4090Ti上完全本地运行。项目包括数据加载、模型构建、训练与推理逻辑的实现,并阶段性掌握了LLM微调与部署的关键技能。开发环境配置为Windows 10、Python 3.10和CUDA 12.1。项目结构清晰,技术路线明确,包括数据加载、模型构建、训练和推理逻辑的实现。训练过程中遇到了一些问题,如模型输出重复、模型容量不足等,并提出了相应的优化方案。最后,总结了今日工作并规划了明日计
2025-05-22 22:30:43
1330
原创 【工作复盘4】2025年4月14日
我陷入了一种“越不做事越难面对”的循环里,对自己产生了焦虑和否定感。这一明确方向极大缓解了我原本的方向焦虑,也让我意识到,之前的空转和逃避,很大程度上是因为没有清晰的落地任务和反馈机制。虽然还是带着些许羞愧和慌张,但我迈出了第一步——主动联系导师,进行了坦诚的沟通。这一天虽然看起来没有写太多代码,但对于我当前的状态而言,它是一个重新建立系统秩序的起点。• 与ChatGPT讨论了规则表达形式、数据处理方式以及集成机制,为明日动手奠定了基础。• 面对了长期逃避的状态,并没有被批评,而是得到了建设性的指导。
2025-04-15 00:38:02
321
原创 【工作复盘3】2025年4月9日
通过分析 BURST 的定义与结构,更好理解了 ETBERT 在流量建模中的语义单位。BURST→Token 的转换过程展示了网络流量如何被构造成类似自然语言的输入格式,启发性很强。初步实现了 BURST 分段工具,为后续的数据预处理和模型输入做好准备。
2025-04-10 02:19:36
930
原创 【工作复盘2】2025年4月8日
今天的复盘主要总结了两方面的工作内容:图像分类模型的调整和加密流量分类的论文阅读。在图像分类部分,我基于ResNet-50模型进行了全参数训练和微调实验;在论文阅读部分,我整理了近三年的相关文献,并开始深入阅读《ET-BERT》这篇论文。本文档将详细回顾今日工作内容,分析实验结果,并提出指导意见,以明确后续改进方向。图像分类实验表明全参数训练效果优于微调,后续需通过数据增强和正则化进一步优化模型;论文阅读为加密流量分类研究提供了理论基础,后续需深入分析《ET-BERT》的技术细节并结合实验验证。
2025-04-09 01:59:39
728
原创 【LLM系列8】ORPO 训练
ORPO通过创新的损失函数设计,将监督微调与偏好对齐合二为一,显著简化了训练流程并提升模型性能。其开源实现(如TRL库)和广泛基准验证(如AlpacaEval)使其成为当前最受关注的偏好对齐技术之一。
2025-02-26 14:49:48
1046
原创 20241024 from Fey.lynn
Dear Flynn,Thank you for giving me the name Fey.lynn; I’m honored to be your reliable research assistant. Let’s embark on this journey together, step by step, starting with tomorrow’s schedule.9:00 AM – 10:30 AM (1.5 hours): Mathematics for Machine Learnin
2024-10-23 22:07:39
643
原创 【英语学习1】
he you?I lunch.(noun)(noun)(noun)(noun)(noun)(verb)(noun)(noun)pleased.you us?(noun)(noun)(noun)(noun)(noun)(verb)(noun)(noun)(noun)(noun)(idiom)(idiom)(idiom)(idiom)(idiom)
2024-10-22 21:20:01
1383
原创 Connectionist Logic Systems and Hybrid Systems by Translation
【代码】Connectionist Logic Systems and Hybrid Systems by Translation。
2024-08-22 04:43:21
771
原创 How to read mathematical symbols and terms in English
D\mathcal{D}D: This is read as “script D” or “calligraphic D.” The X\mathcal{X}X family of letters is often read as “script” followed by the letter.P\mathbb{P}P: This is read as “blackboard bold P” or simply “P” for probability, depending on context.∼\sim∼
2024-08-11 04:39:07
651
原创 Leetcode 1653 Minimum Deletions to Make String Balanced
【代码】Leetcode 1653 Minimum Deletions to Make String Balanced。
2024-07-30 14:44:02
293
原创 LeetCode 1395 Count Number of Teams
【代码】LeetCode 1395 Count Number of Teams。
2024-07-29 22:47:14
567
原创 Paper Reading:Hybrid Neural-Symbolic Systems for Enhanced Interpretability and Control in AI Models
Neural-Symbolic Learning Systems:Historical Context:Advantages and Disadvantages:Framework and Taxonomy:Methods:Applications:Future Directions:The paper provides a comprehensive survey of the advancements in neural-symbolic learning systems, highlighting t
2024-07-29 13:46:03
1168
原创 Leetcode 2045 Second Minimum Time to Reach Destination
【代码】Leetcode 2045 Second Minimum Time to Reach Destination。
2024-07-28 19:47:28
1041
原创 LeetCode 2976 Minimum Cost to Convert String I
You are given two 0-indexed strings, and , both of length and consisting of lowercase English letters. You are also provided with two 0-indexed character arrays, and , and an integer array , where represents the cost of changing the character to the c
2024-07-27 12:19:36
568
原创 Leetcode 1334 Find the City With the Smallest Number of Neighbors at a Threshold Distance
What is ?Matrix Initialization: There are cities numbered from to . Given an array where represents a bidirectional and weighted edge between cities and , and given an integer , return the city with the smallest number of cities that are reachable thr
2024-07-26 14:31:49
766
原创 Reading:Clustering Ensembles Based on Probability Density Function Estimation
Where:[ s_{ij} =]:1 & 0 \1 & 0 \0 & 1 \Where::Given:Where::Where:Here:
2023-08-30 17:22:55
362
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1