自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

0-0

  • 博客(6)
  • 收藏
  • 关注

原创 基于Tomasulo算法实现的乱序CPU(O3 CPU)仿真实验(中山大学)

本文基于gem5模拟器对RISC-V架构的O3乱序CPU进行仿真实验,通过调整指令队列(IQ)、重排序缓冲区(ROB)和物理寄存器三个关键参数,运行daxpy程序并记录总时钟周期数。实验采用自动化脚本批量测试48种参数组合,结果表明IQ和ROB大小是影响性能的主要瓶颈,扩大乱序执行窗口能显著提升指令级并行性,但也存在边际效应递减现象。研究为理解CPU微架构参数对性能的影响提供了量化依据。

2025-10-24 15:08:19 930

原创 库推荐: Yquoter--跨市场行情数据一站式获取库

Yquoter是一款面向量化分析、科研与教学的跨市场行情数据获取工具,提供统一简洁的Python接口,支持A股、港股、美股三地数据一站式获取。核心功能包括历史K线、实时行情、基本面数据及常用技术指标计算,内置缓存机制提升效率,支持灵活配置数据源。其一次导入,三地通用的设计理念显著降低学习成本,适合量化初学者快速开展分析。项目开源且持续优化,欢迎社区反馈共建。

2025-10-21 00:15:05 612

原创 弦振动问题求解的通用思路链

本文系统探讨了一维波动方程(弦振动问题)的通用求解思路。首先,通过问题诊断与分类,从方程的齐次性、空间定义域和边界条件三个维度确定求解策略。随后,介绍三种核心解析方法:达朗贝尔解法适用于无界域问题,揭示行波传播的物理机制;行波延拓法将半无界域问题转化为无界问题,通过对称延拓处理边界条件;分离变量法用于有界域问题,将复杂振动分解为驻波模态的叠加。文章还讨论了齐次化原理,以简化非齐次问题。这些方法不仅具有理论深度,还与信号处理、并行计算等现代技术密切相关,展现了数学物理方程的广泛适用性。

2025-09-30 13:26:41 1121

原创 HPC入门:矩阵计算初步优化尝试

矩阵乘法是AI计算的核心瓶颈,其效率直接影响模型训练与推理速度。本文通过不同语言(Python、Java、C)实现1024×512与512×2048矩阵乘法,对比性能差异。Python因解释执行效率低,耗时364秒;Java通过JIT优化提升至4.79秒;C语言通过循环顺序调整和编译优化(-O2)进一步缩短至0.44秒,最终结合向量化指令和优化库(MKL/AOCL)实现0.21秒,性能提升1700倍。关键优化点包括:循环顺序调整(提升缓存命中率)、编译器优化、硬件加速指令(如AVX2)及高效数学库调用

2025-09-19 16:57:08 1123

原创 基于多层感知机(MLP)的回归任务:房价预测实现

基于MLP的回归任务的初步尝试

2025-05-06 21:41:38 1780

原创 经典15-puzzle问题的简单优化尝试

A*算法与ID A* 算法的简单优化尝试

2025-04-09 15:53:58 899 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除