- 博客(81)
- 收藏
- 关注
原创 【人工智障生成日记1】从零开始训练本地小语言模型
本文详细介绍了从零开始训练本地小语言模型MiniGPT的过程,使用TinyStories数据集,并在NVIDIA RTX 4090Ti上完全本地运行。项目包括数据加载、模型构建、训练与推理逻辑的实现,并阶段性掌握了LLM微调与部署的关键技能。开发环境配置为Windows 10、Python 3.10和CUDA 12.1。项目结构清晰,技术路线明确,包括数据加载、模型构建、训练和推理逻辑的实现。训练过程中遇到了一些问题,如模型输出重复、模型容量不足等,并提出了相应的优化方案。最后,总结了今日工作并规划了明日计
2025-05-22 22:30:43
1188
原创 【工作复盘4】2025年4月14日
我陷入了一种“越不做事越难面对”的循环里,对自己产生了焦虑和否定感。这一明确方向极大缓解了我原本的方向焦虑,也让我意识到,之前的空转和逃避,很大程度上是因为没有清晰的落地任务和反馈机制。虽然还是带着些许羞愧和慌张,但我迈出了第一步——主动联系导师,进行了坦诚的沟通。这一天虽然看起来没有写太多代码,但对于我当前的状态而言,它是一个重新建立系统秩序的起点。• 与ChatGPT讨论了规则表达形式、数据处理方式以及集成机制,为明日动手奠定了基础。• 面对了长期逃避的状态,并没有被批评,而是得到了建设性的指导。
2025-04-15 00:38:02
227
原创 【工作复盘3】2025年4月9日
通过分析 BURST 的定义与结构,更好理解了 ETBERT 在流量建模中的语义单位。BURST→Token 的转换过程展示了网络流量如何被构造成类似自然语言的输入格式,启发性很强。初步实现了 BURST 分段工具,为后续的数据预处理和模型输入做好准备。
2025-04-10 02:19:36
834
原创 【工作复盘2】2025年4月8日
今天的复盘主要总结了两方面的工作内容:图像分类模型的调整和加密流量分类的论文阅读。在图像分类部分,我基于ResNet-50模型进行了全参数训练和微调实验;在论文阅读部分,我整理了近三年的相关文献,并开始深入阅读《ET-BERT》这篇论文。本文档将详细回顾今日工作内容,分析实验结果,并提出指导意见,以明确后续改进方向。图像分类实验表明全参数训练效果优于微调,后续需通过数据增强和正则化进一步优化模型;论文阅读为加密流量分类研究提供了理论基础,后续需深入分析《ET-BERT》的技术细节并结合实验验证。
2025-04-09 01:59:39
597
原创 【LLM系列8】ORPO 训练
ORPO通过创新的损失函数设计,将监督微调与偏好对齐合二为一,显著简化了训练流程并提升模型性能。其开源实现(如TRL库)和广泛基准验证(如AlpacaEval)使其成为当前最受关注的偏好对齐技术之一。
2025-02-26 14:49:48
669
原创 20241024 from Fey.lynn
Dear Flynn,Thank you for giving me the name Fey.lynn; I’m honored to be your reliable research assistant. Let’s embark on this journey together, step by step, starting with tomorrow’s schedule.9:00 AM – 10:30 AM (1.5 hours): Mathematics for Machine Learnin
2024-10-23 22:07:39
613
原创 【英语学习1】
he you?I lunch.(noun)(noun)(noun)(noun)(noun)(verb)(noun)(noun)pleased.you us?(noun)(noun)(noun)(noun)(noun)(verb)(noun)(noun)(noun)(noun)(idiom)(idiom)(idiom)(idiom)(idiom)
2024-10-22 21:20:01
1032
原创 Connectionist Logic Systems and Hybrid Systems by Translation
【代码】Connectionist Logic Systems and Hybrid Systems by Translation。
2024-08-22 04:43:21
720
原创 How to read mathematical symbols and terms in English
D\mathcal{D}D: This is read as “script D” or “calligraphic D.” The X\mathcal{X}X family of letters is often read as “script” followed by the letter.P\mathbb{P}P: This is read as “blackboard bold P” or simply “P” for probability, depending on context.∼\sim∼
2024-08-11 04:39:07
610
原创 Leetcode 1653 Minimum Deletions to Make String Balanced
【代码】Leetcode 1653 Minimum Deletions to Make String Balanced。
2024-07-30 14:44:02
273
原创 LeetCode 1395 Count Number of Teams
【代码】LeetCode 1395 Count Number of Teams。
2024-07-29 22:47:14
537
原创 Paper Reading:Hybrid Neural-Symbolic Systems for Enhanced Interpretability and Control in AI Models
Neural-Symbolic Learning Systems:Historical Context:Advantages and Disadvantages:Framework and Taxonomy:Methods:Applications:Future Directions:The paper provides a comprehensive survey of the advancements in neural-symbolic learning systems, highlighting t
2024-07-29 13:46:03
1014
原创 Leetcode 2045 Second Minimum Time to Reach Destination
【代码】Leetcode 2045 Second Minimum Time to Reach Destination。
2024-07-28 19:47:28
1009
原创 LeetCode 2976 Minimum Cost to Convert String I
You are given two 0-indexed strings, and , both of length and consisting of lowercase English letters. You are also provided with two 0-indexed character arrays, and , and an integer array , where represents the cost of changing the character to the c
2024-07-27 12:19:36
542
原创 Leetcode 1334 Find the City With the Smallest Number of Neighbors at a Threshold Distance
What is ?Matrix Initialization: There are cities numbered from to . Given an array where represents a bidirectional and weighted edge between cities and , and given an integer , return the city with the smallest number of cities that are reachable thr
2024-07-26 14:31:49
701
原创 Reading:Clustering Ensembles Based on Probability Density Function Estimation
Where:[ s_{ij} =]:1 & 0 \1 & 0 \0 & 1 \Where::Given:Where::Where:Here:
2023-08-30 17:22:55
279
原创 A Detailed Instruction to a Subset of RISC-V Instructions
Listed by the sequence of opcode,assmbly instr,behavior and complete representation
2022-07-08 22:21:28
268
原创 Introduction to Assembly and RISC-V
A short instruction to RISC-V,esp for RV32I processor
2022-07-05 22:02:42
529
原创 Binary Number Encoding and Arithmetic
questions:questions:We can simply relabel some of the digits to represent negative numbers while retaining the nice properties of modular arithmaticIn two’s complement encoding,the high-order of the N-bit representation has nagetive weight:negative numbe
2022-07-04 18:27:54
170
原创 结构、联合和枚举
结构(structure)可能具有不同类型的值(member)的集合。联合(nuion)可存储不同类型的值,每次储存一个成员(member),无法储存全部成员枚举(enumeration)一种整数类型,它的值由程序员来命名结构是目前为止最重要的一种类型。结构变量数组有两个重要特性:数组的所有元素具有相同的类型为了选择数组元素需要指明元素的位置结构具有与数组非常不同的特性:结构的每个成员可以拥有不同的类型结构的每个成员都有自己的名字,为了原则结构的成员需要指明成员的名字而不是位置.
2022-05-15 21:21:04
522
2
原创 图图图图图
图的基本概念点边无向图有向图简单图:没有多重边和环 注意数据结构中只讨论简单图多重图简单完全图:边数为(n-1)+(n-2)+…+1 = (n-1)*n/2子图无向图中:连通(存在路径相连的两顶点)连通图(任意两顶点连通)极大连通子图(连通子图包含其所有的边)极小连通子图 (保持图连通又要使得边数最少的子图)连通分量(无向图的极大连通子图称为连通分量)有向图中:强连通(存在双向路径的两顶点)强连通图(任意两点强连通)极大强连通子图(连通子图包含其所有的边)极小强
2021-09-24 10:51:25
528
原创 网安2022新大纲
804-网络空间安全基础本考试科目包括离散数学和数据结构两部分内容,每部分内容各占1/2。考试形式闭卷、笔试。考试时间180分钟,满分为150分。(一)离散数学考查目标要求考生系统地理解与掌握离散数学的基本概念、计算和证明方法,以及应用概念和方法进行应用问题离散建模、计算求解和逻辑推理的能力。要求考生具有抽象思维能力,逻辑推理能力,和综合运用所学的知识分析问题和解决问题的能力。考试内容数理逻辑1.1 命题逻辑及其应用:命题、逻辑联结词、复合命题真值表、逻辑等价、析取范式与合取范式、命题的
2021-09-16 16:13:04
262
原创 数据结构4-6章 回忆总结
串的定义和实现:定长顺序存储;堆分配存储;块链存储串的模式匹配:简单的模式匹配算法、KMP算法、next数组的求法、KMP算法的进一步优化树的定义和基本术语:树是一种逻辑结构;祖先、子孙、双亲、兄弟;节点的度;分支节点、叶子节点;节点的层次、节点的深度、节点的高度;有序树、无序树;路径、路径长度;森林树的基本性质二叉树的定义,特殊二叉树:递归定义;满二叉树、完全二叉树、二叉排序树、平衡二叉树二叉树的存储结构:顺序存储、链式存储;实现二叉树的遍历:先序遍历、中序遍历、后序遍历;递归算法、非递归算.
2021-08-20 14:37:02
99
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人