- 博客(6)
- 收藏
- 关注
原创 计算机专业课复习:操作系统——存储管理
本文摘要: 存储管理主要包括连续分区和分页存储两种方式。连续分区分为固定和动态分区分配,采用首次适应、循环首次适应、最佳适应和最坏适应等算法。分页存储将进程逻辑地址空间划分为页,内存划分为物理块,通过页表实现地址转换,并引入快表和虚拟存储器提高效率。虚拟存储器通过请求调页和页面置换技术实现逻辑内存扩充,常用置换算法包括最佳置换、FIFO、LRU和Clock算法等。文章详细介绍了存储保护、地址转换、页面大小选择等关键技术,以及各种算法的优缺点和实现原理。
2025-06-24 21:12:34
1104
原创 计算机专业课复习:操作系统——进程管理
本文系统性地探讨了进程管理和线程调度的核心概念与技术要点。首先阐述了进程的基本概念及其与程序的区别,分析了进程状态转换和三组成部分(程序、数据、PCB)。在进程控制方面,介绍了创建、终止、阻塞/唤醒等原语操作。调度算法部分对比了FCFS、SJF、优先级等策略的性能指标。进程同步机制重点解析了信号量PV操作、临界区管理及经典同步问题解决方案。线程章节区分了用户级和内核级线程的实现差异。最后详细论述了死锁的四大必要条件、预防/避免/检测方法,尤其深入讲解了银行家算法和资源分配图检测技术。全文贯穿理论与实践结合,
2025-06-24 21:01:49
878
原创 计算机专业课复习:操作系统——引论
摘要:操作系统是管理计算机软硬件资源的核心软件,提供人机交互接口。它具有三种主要视角:扩展机器(抽象硬件)、资源管理(有效分配CPU、内存等)和交互界面(GUI/命令行)。操作系统运行在核心态,管理内存、处理器、设备和文件,并提供系统调用接口。主要类型包括批处理、分时、实时、个人计算机和网络操作系统。关键特征是并发执行、资源共享和异步性,通过虚拟化技术提高资源利用率。现代操作系统追求使用便捷性、高效资源管理和系统可扩展性。
2025-06-23 22:19:37
842
原创 SWiRL (Step-Wise Reinforcement Learning)论文笔记
Step-Wise Reinforcement Learning (SWiRL)——一种离线多步优化技术通过合成数据生成和多步强化学习提升语言模型在复杂推理和工具使用任务中的能力离线训练:通过合成数据实现高效、可重复的优化,避免在线工具调用带来的延迟。多步轨迹生成:通过LLM(如开源Gemma 2)与工具(如搜索引擎/计算器)交互,自动生成多步推理轨迹 trajectory(包含中间步骤的工具调用和思考链)。每一步骤中,模型自由生成思维链,动作要么是调用工具,要么是生成最终答案。
2025-05-06 15:48:35
1888
1
原创 DeepSeek_R1技术报告 超细致中文详解
仅使用强化学习(RL)激励推理能力,而不使用有监督的人工微调(SFT)→ 推理强,但存在可读性差、语言混淆的问题。则在RL之前加入了**多阶段训练(RL + 拒绝采样 + SFT)**和少量的冷启动数据最终效果可以达到OpenAI-o1-1217的推理效果。、基于Qwen2.5和Llama3从DeepSeek_R1 蒸馏 distillation出来的六个密度的模型**(1.5B, 7B, 8B, 14B, 32B, 70B)**。最终基座模型一共经历了两次微调和两次强化学习。
2025-03-30 19:23:04
1504
原创 新手必看:Git最详细操作代码!!
新手在刚上手git版本控制时可能会遇到各种各样的问题,本文详细列举了在使用git时可能会用到的一些操作代码。
2024-04-02 22:51:34
340
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅