自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

分享实践与思考

技术探索-交流学习-欢迎入群:955817470,801295159

  • 博客(173)
  • 资源 (27)
  • 收藏
  • 关注

原创 DeepSeek-OCR 部署、配置解析与测试完整指南

DeepSeek-OCR 是 DeepSeek-AI 提出的用于探索视觉 2D 映射压缩长上下文可行性的视觉语言模型(VLM),由DeepEncoder(核心编码器,~380M 参数)和DeepSeek3B-MoE-A570M 解码器(激活 570M 参数)构成;其核心优势在于 DeepEncoder 通过串联窗口注意力(SAM-base)、16× 卷积压缩器与全局注意力(CLIP-large),实现高分辨率输入下的低激活内存与高压缩比,实验显示在 Fox 基准上。

2025-11-10 19:00:40 1822 2

原创 深度解读 DeepSeek-OCR 论文:通过视觉模态实现高效文本压缩

DeepSeek-OCR 是 DeepSeek-AI 提出的用于探索视觉 2D 映射压缩长上下文可行性的视觉语言模型(VLM),由DeepEncoder(核心编码器,~380M 参数)和DeepSeek3B-MoE-A570M 解码器(激活 570M 参数)构成;其核心优势在于 DeepEncoder 通过串联窗口注意力(SAM-base)、16× 卷积压缩器与全局注意力(CLIP-large),实现高分辨率输入下的低激活内存与高压缩比,实验显示在 Fox 基准上。

2025-11-10 18:50:33 1064

原创 PP-OCRv5文本识别流程及原理解析

总的来说,PP-OCRv5通过其图像预处理→文本检测→文本方向分类→文本识别的四步流水线,构建了一个高效、精准且轻量的文字识别解决方案。其在手写体、多语言场景下的强劲表现,以及适合边缘部署的特性,使其成为文档数字化、教育、金融、智能交通等多个领域的理想选择。模块核心算法输入输出关键创新文本检测DBNet完整图像所有文本行的包围框可微分二值化(高效特征融合)、针对任意形状文本的优化方向分类轻量级CNN单个文本行图像文本方向类别极致的轻量化、将方向问题转化为多分类问题、依赖高质量合成数据。

2025-11-03 19:31:41 1372

原创 ReAct 与 Function Call:两种主流 Agent 技术解析与实践

在人工智能领域,Agent 技术正成为推动 AI 系统向主动推理、复杂任务处理演进的核心方向。本文将深入解析当前主流的两种 Agent 技术 ——ReAct(推理与行动协同框架)和Function Call(结构化功能调用),探讨其技术原理、应用场景及开发实践要点。

2025-11-03 19:23:11 855

原创 详解混合检索中 RPF 排序算法(Reciprocal Rank Fusion)

RPF(Reciprocal Rank Fusion)排序算法作为一种高效的结果融合方法,能够有效整合多个检索系统的输出,生成更优的排序结果

2025-10-15 18:08:31 694

原创 从大模型到轻量级部署:知识蒸馏优化技术

知识蒸馏(Knowledge Distillation, KD)是一种模型压缩与优化技术,旨在将复杂高性能模型(教师模型,Teacher Model)的 “知识” 迁移到轻量模型(学生模型,Student Model)中,使学生模型在参数量和计算成本大幅降低的同时,尽可能保留教师模型的性能。

2025-10-10 18:31:02 390

原创 Dify 源码本地部署启动及完整步骤解析

Dify 源码本地部署启动及完整步骤解析

2025-09-29 19:04:54 1222

原创 Docker 快速部署 Dify + 应用构建完整流程

Dify 部署与应使用 Docker Compose 快速部署 Dify 用构建

2025-09-26 19:17:26 1328 2

原创 深入浅出地讲解如何使用CURL命令行工具进行API测试

深入浅出地讲解如何使用CURL命令行工具进行API测试

2025-09-26 18:59:54 796

原创 HTTP 请求体格式全解:none/form-data/urlencoded/raw/binary/msgpack 原理与 Python 实现

在 HTTP 请求中,请求体(Request Body)的格式决定了数据的组织方式,不同格式适用于不同的场景。HTTP请求体(Body)的格式根据数据类型和编码方式不同,主要分为:none、form-data、raw、urlencoded、binary和msgpack。

2025-09-24 19:11:48 754 1

原创 15 种 HTTP 请求方法详解:从 GET/POST 核心方法到 WebDAV 扩展及Python实现示例

HTTP(Hypertext Transfer Protocol)是一种在计算机网络中用于传输超媒体文档的应用层协议。HTTP 协议定义了客户端和服务器之间的通信规则,并规定了客户端向服务器发送请求时需要采用的请求方法(请求方式)。

2025-09-08 19:13:59 1247

原创 接口设计标准化流程,结合RESTful最佳实践和实际开发经验,涵盖从需求分析到部署的全过程

接口设计标准化流程,结合RESTful最佳实践和实际开发经验,涵盖从需求分析到部署的全过程

2025-09-03 19:32:30 748

原创 深入理解CI/CD:构建、测试和部署的完整流程

CI/CD 旨在通过自动化流程和工具简化并加快软件开发生命周期,它是现代软件开发中的核心实践,通过自动化流程将代码变更快速、可靠地交付到生产环境。

2025-09-02 21:16:01 1616

原创 DevOps 详解:文化、实践与工具链

DevOps是 Development(开发)和 Operations(运维) 的融合,通过打破部门壁垒、自动化流程和工具链集成,实现软件交付效率最大化和系统稳定性最优化。

2025-09-01 19:01:36 765

原创 Windows/Linux 环境下 Jmeter 性能测试的安装与使用

在 Windows 和 Linux 上用 Jmeter 做性能测试

2025-08-27 18:56:31 926

原创 在 Linux 和 Docker 中部署 MinIO 对象存储

MinIO 对象存储部署:适配 Linux 与 Docker 的方法

2025-08-20 19:42:14 1533 1

原创 利用 Windows GPU 在 WSL2 中安装并配置 CUDA Toolkit

要在 WSL2(Ubuntu 22.04)中使用 GPU,需依赖 Windows 的 NVIDIA 驱动提供硬件支持,并在 WSL 内安装 CUDA Toolkit 及配置环境。

2025-08-20 19:07:29 1933 1

原创 Elasticsearch全文检索中文分词:IK分词器详解与Docker环境集成

IK分词器(IK Analyzer)是Elasticsearch中广泛使用的中文分词插件,专门针对中文文本进行高效的分词处理。

2025-08-18 19:40:01 2060 3

原创 详解 doclayout_yolo:Python 文档布局检测

doclayout_yolo 是一个基于 YOLOv10 架构的文档布局检测工具包,旨在快速、高效地识别文档中的不同元素(如文本、图像、表格、标题等)。它结合了 DocSynth-300K 数据集的预训练模型和全局到局部的感知机制,适用于论文、教科书、试卷、幻灯片等多种文档类型的布局分析。

2025-08-18 19:31:50 1044

原创 PyMuPDF 详解:Python 高效处理 PDF 文档

PyMuPDF(又称 `fitz`)是一个功能强大的 Python 库,用于处理 PDF、XPS、EPUB、MOBI 等文档格式。它基于 MuPDF(轻量级 PDF 渲染引擎),提供高效的文本提取、渲染、编辑和文档分析功能。

2025-08-14 17:55:59 950

原创 一文吃透 pdf2image:Python 处理 PDF 转图片的完整指南

pdf2image 是一个用于将 PDF 文件转换为图像的 Python 库,它基于强大的 poppler-utils 工具集,提供简单高效的 PDF 到图像的转换功能。

2025-08-12 17:55:02 1822

原创 数据存储与解析:深度剖析 Parquet 文件处理全流程

Parquet文件数据处理与解析

2025-08-11 17:51:19 1799

原创 Docker 加载镜像时出现 “no space left on device” 错误的解决方法

在 Docker 使用过程中,"no space left on device" 错误是常见的磁盘空间不足问题。本文将结合实战操作,详细介绍该问题的排查与解决步骤,帮助开发者快速定位并修复问题。

2025-08-07 17:49:18 954

原创 FastGPT极速上手指南:Docker容器化部署实战

使用 Docker Compose 快速部署 FastGPT 4.9.7版本

2025-06-23 20:56:37 2370 5

原创 知识库搜索新范式:FastGPT知识库搜索方案全解析

FastGPT 知识库结构设计,理解其 QA 的存储格式和多向量映射,以便更好的构建知识库

2025-06-23 19:56:54 1456

原创 RAG检索增强生成技术:原理剖析、应用场景与优劣对比

RAG检索增强生成:从理论到实践的应用与挑战检索增强生成(RAG)全面解析:原理、场景与优化方向

2025-06-18 20:59:50 849

原创 基于vLLM高效部署多模态大模型Qwen2.5-VL实战指南及优化策略

基于vLLM高效部署多模态大模型Qwen2.5-VL实战指南及优化策略

2025-06-18 20:12:09 5368 2

原创 通用对象定位与识别大模型GLEE:原理部署训练全流程解析与实战指南

通用对象定位与识别大模型GLEE:原理部署训练全流程解析与实战指南

2025-06-16 21:34:09 1210

原创 Python包管理工具之uv使用指南

uv 是一个新兴的 Python 包管理工具,它旨在提供比 pip 和 poetry更快、更现代的依赖管理体验。

2025-06-16 20:50:09 2080

原创 高效管理Python环境:Miniforge、pyenv和Poetry深度对比与应用

在 Python 开发中,构建和管理环境是至关重要的。为了更好地隔离项目依赖、管理不同版本的 Python 解释器以及简化包管理,开发者常使用工具来辅助开发环境的搭建。以下是三种常见的 Python 环境管理工具Miniforge、pyenv和Poetry,它们各有特点,适用于不同的场景。

2025-06-12 19:40:07 1453

原创 基于vLLM高效部署:Qwen2.5与DeepSeek-R1-Distill-Qwen实战指南

基于vLLM高效部署:Qwen2.5与DeepSeek-R1-Distill-Qwen实战指南

2025-06-12 12:07:15 1616

原创 Windows搭建CUDA开发环境

Windows搭建CUDA开发环境搭建

2025-06-12 10:04:10 1764

原创 Milvus vs. ElasticSearch:向量库检索性能测试

Milvus vs ElasticSearch 向量检索性能测试

2025-03-20 21:23:42 2724 1

原创 《实战指南:基于Linux环境部署与应用Milvus向量数据库》

Milvus向量数据库部署、图像化管理及使用

2025-03-19 19:53:57 1791

原创 《实战指南:基于Linux环境部署与应用ElasticSearch搜索引擎》

基于Linux环境部署和使用ElasticSearch搜索引擎

2025-03-05 20:29:29 1321

原创 《深度解析:如何在PyTorch中实现.pt模型文件与.bin二进制格式的高效转换》

PyTorch模型文件格式 .pt 与二进制格式 .bin 转换

2025-03-05 20:19:52 2280

原创 面向多模态检索的向量数据库对比分析和技术选型:Elasticsearch、Milvus、Pinecone、FAISS、Chroma、PGVector、Weaviate、Qdrant

面向多模态检索的向量数据库对比分析和技术选型:Elasticsearch、Milvus、Pinecone、FAISS、Chroma、PGVector、Weaviate、Qdrant

2025-03-05 20:08:33 4872

原创 NVIDIA GPU 架构详解:Pascal、Volta、Turing、Ampere、Ada、Hopper、Blackwell

NVIDIA 的 GPU 架构持续演进,每一代都在计算能力、能效比和专用硬件加速方面取得突破。以下是主流架构的核心特性对比与应用场景分析。

2025-03-03 20:44:50 17694

原创 深度解读 Chinese CLIP 论文:开启中文视觉对比语言预训练

本文提出了 Chinese CLIP,这是一个专为中文设计的视觉 - 语言基础模型。构建了一个包含约 2 亿个样本的预训练数据集,并使用所提出的两阶段预训练方法对一系列 Chinese CLIP 模型进行预训练,提高了预训练的效率和效果。Chinese CLIP 在多个跨模态检索数据集上,无论是零样本学习还是微调设置下,都能达到最先进的性能,在 10 个数据集的零样本图像分类任务中,也能取得颇具竞争力的成绩。

2025-02-27 21:38:09 1708

原创 深度解读 CLIP 论文:从自然语言监督中学习可迁移的视觉模型

本文深度讲解对比语言 - 图像预训练(CLIP)模型,该模型通过自然语言监督学习可迁移视觉模型,在多领域展现潜力,也分析了模型的性能、局限和社会影响

2025-02-26 19:48:04 1204

UNSW-NB15 入侵检测数据集.zip

UNSW_NB15入侵检测数据集,相比于KDD99和NSL KDD数据集更适合相关研究人员用于入侵检测系统的研究。

2022-04-16

ClassProjectCity-C++实现课程设计源码资源.zip

1、内容概要:本资源主要是使用C++实现课程设计作业,City.cpp源码实现了课程作业的所有要求,供学生学习使用。 2、源码主要实现内容:(1)用名称、人口、海拔高度、天气、年份等数据成员建立一个名为City的类。建立一个产生City对象的类。(2)将产生的City对象(数量大于200个)填充至一个容器,容器的类型自选。(3)对于City对象的具体属性值通过创建发生器来生成。生成规则如下:年份为2006年;名称由4-8个英文小写字符随机构成;人口在范围[100000,10000000)内随机选取;海拔高度在范围[0,4000)米内随机选取;上述三值均不可重复;天气在枚举常量表中{Rainy,Snowy,Cloudy,Sunny}随机选取(1年天气取12个值,即每月一个值)。(4)容器填充完毕后,将其内容写入一个名为City.txt的文件。

2022-04-20

项目实战-KNN算法实现手写数字识别源码及数据集.zip

1、内容概要:本资源主要基于KNN算法实现手写数字识别,适用于初学者学习机器学习KNN算法使用。 2、主要内容:训练集trainingDigits;手写数字识别测试集testDigits;KNN算法实现手写数字识别源代码KNN_digits.py。

2022-04-17

项目实战-KNN算法改进约会网站的配对效果源码及数据集.zip

1、内容概要:本资源主要基于KNN算法改进约会网站的配对效果,适用于初学者学习机器学习KNN算法使用。 2、主要内容:训练集datingTestSet.txt;测试集datingTestSet2.txt;源代码KNN.py

2022-04-17

项目实战-朴素贝叶斯算法实现新闻分类源码及数据集.zip

1、内容概要:本资源主要基朴素贝叶斯算法实现新闻分类,适用于初学者学习文本分类使用。 2、新闻分类源码实现过程:将数据集划分为训练集和测试集;使用jieba模块进行分词,词频统计,停用词过滤,文本特征提取,将文本数据向量化,使用朴素贝叶斯算法进行分类。 3、主要内容:搜狗新闻数据集SogouC,标签包括财经、IT、健康、体育、旅游、教育、招聘、文化和军事;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;News_NB.py新闻分类实现源码。

2022-04-17

项目实战-朴素贝叶斯算法实现垃圾邮件过滤源码及数据集.zip

1、内容概要:本资源主要基朴素贝叶斯算法实现垃圾邮件过滤分类,适用于初学者学习文本分类使用。 2、主要内容:邮件数据集email,email文件夹下有两个文件夹ham和spam,其中ham文件夹下的txt文件为正常邮件,spam文件下的txt文件为垃圾邮件;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;Email_NB.py垃圾邮件分类实现源码。

2022-04-17

NASA MDP 软件缺陷数据集.zip

1、NASA MDP 软件缺陷数据集介绍:软件缺陷预测研究中心广泛应用NASA公布的NASA IV&V Facility Metrics Data Program(MDP)数据集。 MDP包括 13个不同的数据集,这些数据均来自NASA 的13个实际软件项目,由最常见的开发语言编写。每个数据集包含来自不同软件项目的若干模块,规模从 125个模块到 17186 个模块不等。各个数据集由LOC、McCabe、Halstead等几类度量元属性和是否包含缺陷的类别标记(defective)组成。MDP数据集所提供的记录,一行代表一个模块,每个字段对应一个属性。 2、NASA MDP 数据集是软件缺陷预测使用的数据集; 3、该数据集是向官方索取的,包含13个数据集文件,用于实验研究; 4、数据集文件格式是arff格式。

2022-04-16

Linux环境下编译的TensorFlow C++ API动态库文件.7z

1、TensorFlow C++ API的编译是线上使用TensorFlow C++ API调用预先训练好的模型完成预测项目的必经之路,但是TensorFlow C++ API的编译并不是这么顺利,期间遇到了很多错误,它对版本要求非常严格,版本不对应会出现很多问题,尤其protobuf是最重要的一个。本资源是TensorFlow C++ API顺利编译和测试的过程,为线上使用TensorFlow C++ API的使用打下基础 2、Linux环境下编译TensorFlow C++ API生成的动态链接库:libtensorflow_cc.so,libtensorflow_framework.so。

2022-04-16

CNNVD 软件安全漏洞数据集.zip

1、CNNVD是中国国家信息安全漏洞数据库。 2、软件漏洞数据包括1999年以前的漏洞数据-2018年的漏洞数据。 3、漏洞数据存储格式为xml,供软件安全研究人员研究使用。

2022-04-16

NVD 软件安全漏洞数据集.zip

1、NVD是美国国家计算机通用漏洞数据库(National Vulnerability Database,NVD)。 2、漏洞数据包括2002年-2019年的漏洞数据(总共5万多条漏洞,23个漏洞类型)。 3、漏洞数据存储格式为xml,供软件安全研究人员基于该数据集分析研究使用。

2022-04-16

NSL-KDD 入侵检测数据集.zip

NSL-KDD数据集是KDD99数据集的改进,可以作为有效地基准数据集,各机器学习算法可以在NSL-KDD数据集上进行入侵检测实验。 NSL-KDD数据集是KDD 99数据集的改进: 1、NSL-KDD数据集的训练集中不包含冗余记录,所以分类器不会偏向更频繁的记录; 2、NSL-KDD数据集的测试集中没有重复的记录,使得检测率更为准确。 3、来自每个难度级别组的所选记录的数量与原始KDD数据集中的记录的百分比成反比。结果,不同机器学习方法的分类率在更宽的范围内变化,这使得对不同学习技术的准确评估更有效。 4、训练和测试中的记录数量设置是合理的,这使得在整套实验上运行实验成本低廉而无需随机选择一小部分。因此,不同研究工作的评估结果将是一致的和可比较的。

2022-04-16

KDD99入侵检测数据预处理和分类源代码及数据集.zip

1、内容概要:本资源主要基于Python实现kdd99入侵检测数据集预处理,搭建DNN和CNN神经网络实现kdd99入侵检测分类,适用于初学者学习入侵检测分类使用。 2、入侵检测数据集: 该数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。KDD99数据集总共由500万条记录构成,它还提供一个10%的训练子集kddcup.data_10_percent_corrected和测试子集corrected。 3、源代码Handle_data.py是kdd99数据集预处理源代码,kddcup.data_10_percent_corrected.xls是预处理后的数据集。 4、源代码:Kdd_dnn.py是基于DNN神经网络对入侵检测数据集进行分类;kdd_cnn.py是基于CNN神经网络对入侵检测数据集进行分类。

2022-04-16

XGBoost与LightGBM文本分类源代码及数据集.zip

1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。 5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。

2022-04-16

项目实战-英文文本分类电影评论情感判别源码及数据集

1、内容概要:资源主要包括:英文文本分类电影评论情感判别源码及数据集等文件。 标注的训练集:labeledTrainData.tsv;测试集:testData.tsv;没有标签的额外训练集:unlabeledTrainData.tsv;停用词过滤表:stopwords.txt;源代码:movie_reviews_analysis.py 2、本资源适用于初学者学习文本分类使用,主要包括数据预处理、机器学习、文件的读取和写入等。

2022-04-09

中文句子类型分类工具及数据集.zip

1、内容概要:本资源主要包括中文句子类型分类工具sentypes_v1.2及数据集 2、句子类型判别工具sentypes_v1.2的句子优先级为:正反问句,反问句,选择问句,疑问词问句,是非问句;祈使句,把字句,被子句,比较句,存在句,是字句,连字句;陈述句;其他句子。 3、sentypes_v1.2 工具包含五个命令参数,分别是输入文件、输出文件、分词模型(cws.model)、词性标注模型(pos.model)和句法分析模型(parser.model)。

2022-04-09

项目实战-Bert文本分类(keras-bert实现)源代码及数据集.zip

1、内容概要:本资源主要基于bert(keras)实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:bert_model.py是基于keras-bert构建Bert模型对文本进行分类。

2022-04-09

项目实战-TextCNN文本分类(keras实现)源代码及数据集.zip

1、内容概要:本资源主要基于TextCNN(keras)实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:textcnn_model.py是基于Keras构建CNN、TextCNN卷积神经网络模型对文本进行分类。

2022-04-09

项目实战-中文商品评论情感分析源代码及数据集.zip

1、内容概要:资源主要包括:中文商品评论情感判别源代码和数据集。中文情感分析 商品(书籍、酒店、计算机、牛奶、手机、热水器)评论数据包括pos积极评论数据和neg消极评论数据。源代码svm_w2v_model.py 是基于Word2vec生成词向量,求平均获得句向量,构建SVM模型完成文本评论情感预测。 2、本资源适用于初学者学习文本分类使用,主要包括数据预处理、机器学习、文件的读取和写入等。

2022-04-09

社交网络影响力最大化(Python实现)及Wiki-Vote数据集

1、内容概要:社交网络影响力最大化(Python实现)及Wiki-Vote数据集。(1)线性阈值模型(LT模型)代码实现(代码有详细注释);(2)LT模型改进算法-贪心算法代码实现(代码有详细注释); 2、源代码适用于学生或研究者等人,该研究方向的学生可以对源代码及相关论文进行学习实验。 3、影响力最大化的应用场景十分丰富,包括病毒营销,推荐系统,信息扩散,时间探测,专家发现,链接预测等。 4、主要文件有:BAcreate.py,linear_threshold.py,linear_threshold_clime.py,LT_improve.py,test_linear_threshold.py,test_linear_threshold_clime.py,Wiki-Vote.txt。

2022-04-08

LSTM实现对股票数据进行预测(Keras实现)源代码及数据集

1、内容概要:本资源将初步探究 LSTM 在股票市场的应用。通过使用LSTM对股票收益的预测,可以了解到:(1)如何将原始数据集转换为可用于时间序列预测的数据。(2)如何准备数据并使LSTM适合多变量时间序列预测问题。(3)如何进行预测并将结果重新调整回原始数据。 2、本资源适用于对量化交易感兴趣的学生学习实验参考使用。 3、资源内容主要包括:股票数据(20支).rar,LSTM实现对股票数据进行预测(Keras实现)源代码lstm_model.py(源码以600000.SH股票数据为基准进行分析,以2016年3月1日至2017年12月31日为回测期,进行收益率的预测模拟),2016年3月至2017年12月的股票回测模型损失和RMSE计算数据excel。

2022-04-09

Python3对股票数据进行分析源代码和股票数据集

1、内容概要:本资源主要包括Python3对股票数据进行分析源代码、Python3对股票的收益和风险分析源代码、Python3对多股票的投资组合进行分析源代码、北京某投资管理有限公司20支真实股票数据、20支股票整体绘图分析结果展示等。 2、本资源适用于对量化交易感兴趣的学生学习实验参考使用。 3、量化交易是以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,极大地减少了投资者情绪波动的影响,避免在市场极度狂热或悲观的情况下作出非理性的投资决策。本资源仅供学习使用,不可作为真实场景模拟操作。 4、源代码主要包括:股票的开盘价、最高价、最低价、收盘价、成交量、市值、换手率、pe、pb等指标分析,绘制K线图、股票指标相关性分析、移动平均线、股票收益率分析、风险性衡量、投资组合等。

2022-04-09

CNN卷积神经网络实现Mnist手写数字识别数据集

1、Mnist_cnn.py 该脚本文件 用TensorFlow框架 实现CNN卷积神经网络处理Mnist手写数字识别数据集,准确率达到99.21%; 2、Mnist_cnn_tensorboard.py 该脚本文件在Mnist_cnn.py的基础上实现可视化。

2018-05-26

pyltp_wheel安装包.7z

哈工大自然语言处理ltp在windows10下的安装使用,两个文件针对不同的python版本下载一个即可pyltp-0.2.1-cp35-cp35m-win_amd64.whl和pyltp-0.2.1-cp36-cp36m-win_amd64.whl

2019-11-27

截止到2020全国飞机场名字和火车站名字汇总.7z

截止到2020全国飞机场名字和火车站名字汇总

2020-01-10

IEEE Access 论文模板下载

IEEE Access 论文模板下载 IEEE Access 论文模板包括word模板和Latex模板下载

2019-01-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除