- 博客(64)
- 收藏
- 关注
原创 《自然语言处理》课程设计--电影知识图谱问答系统
本文介绍了一个基于NLP技术的电影信息问答系统,该系统集成了8个功能模块和12项NLP技术。系统采用三层架构设计,支持文本和语音输入,能够识别用户意图、提取关键信息并进行纠错。核心功能包括:输入文本处理(意图识别、人名/电影名提取、拼写纠错)、语音识别、多轮对话管理、情感分析、相似推荐、摘要生成、数据管理和智能问答。系统通过CSV文件存储电影知识图谱数据,并提供用户问答和管理员数据管理双界面。该系统实现了从多模态输入到结构化输出的完整技术链条,为电影信息查询提供了智能化解决方案。
2025-12-22 09:00:00
2067
1
原创 论文精读--《Training LMs to follow instructions with human feedback》--InstructGPT:大模型SFT+RLFH(PPO)详解,含代码
原文介绍了一种通过人类反馈微调(RLHF)来对齐大型语言模型与用户意图的方法。先通过监督学习微调模型(SFT),再训练奖励模型(RM)预测人类偏好,最后用强化学习(PPO)优化模型。实验表明,1.3B参数的InstructGPT模型输出比175B的GPT-3更受人类偏好,且在真实性、毒性方面有所改善。该方法能以较低成本显著提升模型的有用性和安全性,但仍存在过度服从指令、编造事实等问题。研究证明人类反馈微调是语言模型对齐的有效方向,但需注意价值观偏差和泛化局限性。本博客给出了含详细注释的SFT+RLHF代码。
2025-12-22 00:00:00
2221
原创 论文精读--《Chain-of-Thought Prompting Elicits Reasoning in LLMs》--CoT“开山鼻祖”,含CoT微调实验过程
原论文探索了思维链(Chain-of-Thought, CoT)提示方法如何显著提升大语言模型在复杂推理任务中的表现。通过提供包含中间推理步骤的示例,该方法能有效激发大型语言模型的推理能力。实验表明,CoT提示在算术、常识和符号推理任务上均能带来性能提升,具有任务普适性,尤其对大型模型(如540B参数的PaLM)效果显著。研究发现CoT推理能力是模型规模达到约100B参数时涌现的特性,且对提示示例的变化具有鲁棒性。文章还讨论了CoT的局限性(如大模型依赖、推理路径不可控)为未来研究提供了新思路。
2025-12-15 00:00:00
2001
原创 论文串读--OpenAI-GPT系列1.2.3.4--大语言模型标准架构和预训练流程
本文系统梳理了GPT系列模型的技术演进路线,从GPT-1到GPT-4的核心技术始终基于Decoder-only Transformer架构。GPT-1首创无监督预训练+微调范式,通过任务特定输入表示实现迁移学习;GPT-2转向纯预训练,探索zero-shot能力;GPT-3突破性地提出few-shot上下文学习,利用1750亿参数实现元学习;GPT-4则实现多模态突破,通过RLHF提升对齐能力。
2025-12-08 00:00:00
2253
原创 论文精读--《SignGraph: A Sign Sequence is Worth Graphs of Nodes》一个手语序列等价于节点图--连续手语识别----翻译+笔记+复现
原论文提出了一种简单而有效的架构将手语序列表示为图结构,在图层面上提取与手语相关的特征。具体来说,为了学习一帧中跨区域特征的相关性,提出了局部手语图LSG模块,该模块动态地在一帧中的节点之间建立边,并聚合帧内跨区域特征。为了跟踪相邻帧之间跨区域特征的交互,提出了时序手语图TSG模块,该模块在相邻帧之间的节点之间动态构建边,捕获帧间跨区域特征。此外,还使用不同块大小的多尺度方式来构建模型以确保节点的表示可以在不同粒度上捕获跨区域特征。在公开数据集上的大量实验证明了SOTA的性能。
2025-12-05 03:43:21
1685
原创 深度学习常用 Linux + tmux + conda + GPU + 网络/系统检查 指令总表
本文系统整理了深度学习研发在 Linux 服务器上最常用的指令与工具,共分为十一大类,涵盖从文件系统操作、环境管理、GPU 查询、tmux 会话管理,到网络诊断、系统监控、编辑器使用等几乎所有日常开发场景。无论你是在远程服务器中训练模型、排查 GPU 问题、管理 conda 环境、维护后台进程,还是编辑配置文件、监测网络状态,这篇速查手册都能作为你随时可查的工具合集。同时,文章用简洁的“指令用法 + 作用说明”格式呈现,便于快速搜索与记忆,是一份适合开发者长期收藏的 Linux 深度学习实践备忘录。
2025-12-01 00:00:00
1815
原创 论文精读--《Continuous Sign Language Recognition with Correlation Network》使用相关网络进行连续手语识别--翻译+笔记+复现
原论文提出了一种用于连续手语识别(CSLR)的新型网络结构CorrNet,通过显式建模跨帧人体运动轨迹来提升识别性能。论文主要贡献包括:1) 设计相关模块动态计算相邻帧间的相关性图,捕获手部和面部等关键部位的运动轨迹;2) 提出识别模块利用多尺度时空卷积定位信息区域,强调重要身体部位;3) 将两个模块插入现有CSLR框架,在不依赖额外监督的情况下实现端到端训练。实验表明,CorrNet在四个数据集上达到SOTA性能且结构轻量,可灵活插入不同骨干网络。
2025-11-24 00:00:00
1942
原创 《人工智能联合大作业》课程报告--论文精读--ProtoGCN:面向细粒度骨架动作识别的结构建模与其优化探索
针对现有GCN在相似动作识别中的不足,ProtoGCN创新性地提出MTE动态拓扑增强、PRN原型重构和CSCL类特异性对比学习三个核心模块,从结构、表示和监督三个层面提升细粒度识别能力。通过理论分析和代码复现,验证了模型在各常见数据集上的有效性。同时指出原型选择机制、结构正则化等潜在改进方向,并与BlockGCN、DeGCN等模型进行对比,总结GCN在骨架动作识别中的演进趋势。研究成果为细粒度动作识别提供了新思路,也为后续优化奠定基础。
2025-07-21 23:59:34
1980
1
原创 《人工智能与脑认知》期末复习(认知科学概述、脑电EEG、相关事件电位ERP、主要实验范式)
本文是基于《人工智能与脑认知》课程的复习纲要,主要涵盖人工智能、认知科学、脑电特征和事件相关电位等内容。课程介绍了智能的定义、认知过程、脑结构功能及ERP技术应用,包括视觉/听觉成分分析、实验范式(如Oddball、Go-Nogo范式)和脑机接口基础。重点阐述了P300、MMN等ERP成分的神经机制及其在认知研究中的意义,为脑机接口研究提供理论基础。课程强调跨学科整合,涉及心理学、神经科学和计算机科学等多领域知识。
2025-06-09 00:00:00
3196
5
原创 自然语言处理nlp--9.情感分析(一般框架、公开数据集,含LSTM/SnowNLP代码示例)
情感分析是通过计算技术对带有情感色彩的主观性文本进行分析和推理的过程,旨在识别用户的态度和观点。其核心任务包括情感信息抽取和情感分类。该领域发展得益于公开评测如TREC、NTCIR和丰富的数据如Cornell、MPQA和情感词典如GI、HowNet。技术上,情感分析方法从早期的基于规则和词典的方法发展到如今的机器学习如LSTM、SVM、预训练语言模型,其中SnowNLP等库提供了开箱即用的解决方案。不过情感分析仍面临评价词语歧义、领域适应性等挑战,需要进一步研究细粒度情感分析和跨语言情感计算等技术。
2025-06-02 00:00:00
1986
原创 《人工智能与脑认知》实验报告--视觉词性判断任务所激发的EEGLAB脑电数据分析
本实验利用EEGLAB分析视觉词性判断任务中的脑电数据,探讨名词、动词、事件名词及动名兼类事件名词在语义加工中的神经差异。实验通过滤波、重参考、ICA等预处理步骤,提取ERP成分及时频特征(ERSP、ITC)。结果显示,不同ERP成分在关键通道(Cz、F3、TP7)上的脑电特征存在显著差异,验证了词性判断过程中的多通道协同机制。实验揭示了词汇加工的时空动态,为视觉刺激任务的神经电生理反馈提供了证据。尽管结果与预设理论一致,但本研究为单被试案例,未来可扩展至多被试及多语境刺激以深化研究。
2025-05-26 00:00:00
2144
原创 自然语言处理nlp--8.文本摘要
文本摘要是从原文提取核心信息并生成简洁概括的技术,分为抽取式和生成式两类。抽取式方法(如TextRank)直接选取关键句子,计算高效但灵活性不足;生成式方法(如Seq2Seq)通过深度学习重新组织语言,表达自然但需要大量数据。评估主要采用ROUGE等指标计算内容重合度。当前趋势是结合两种方法优势,在保证准确性的同时提升可读性。随着大模型发展,生成式摘要质量显著提高,但平衡信息密度与流畅性仍是挑战。
2025-05-12 00:00:00
2100
原创 从0开始机器学习--13.主动学习、半监督学习(学习策略、学习思想,TSVM、图半监督、“多视图”分歧半监督,含代码)
主动学习通过选择最有价值的样本进行标注,最大化模型性能与标注效率;半监督学习则利用未标注数据的结构信息辅助训练。二者分别从“减少标注量”和“利用未标注”出发,适用于标注成本高、数据分布复杂的任务场景。
2025-04-28 00:00:00
1876
原创 自然语言处理nlp--5.语义分析(命名实体识别与关系抽取,含各自不同方法代码)
命名实体识别(NER)和关系抽取(RE)是语义分析的核心技术。NER识别文本中的人名、地名等实体,主要方法包括规则匹配、统计学习和深度学习;RE抽取实体间的语义关系,分为基于规则、监督学习、半监督和开放抽取等方法。两者共同支撑知识图谱构建和智能问答等应用,当前趋势是结合深度学习和弱监督技术,以提升模型泛化能力并降低标注成本。
2025-04-21 00:00:00
2957
原创 自然语言处理nlp--4.语篇分析(语义理论、格语法、语义网络、概念依存理论、词义消歧算法与算法性能评估、指代消解、语义角色标注,含词义消歧、角色标注实验代码)
系统阐述了自然语言语义计算的理论体系与技术方法,围绕语义理解的核心任务,深入探讨了格语法、语义网络和概念依存三大理论模型,分别从语义角色、概念关系和动作基元的角度解析语言含义。在应用层面,详细分析了词义消歧、指代消解和语义角色标注等关键技术,特别关注了汉语特有的零指代和流水句等处理难点。通过整合经典理论(如真理条件语义学)与现代技术(如深度学习),构建了从词汇到篇章的多层次语义分析框架,为自然语言理解提供了完整的理论支撑和方法体系,同时揭示了语义计算在处理复杂语言现象时面临的主要挑战。
2025-04-14 00:00:00
3522
原创 自然语言处理nlp--3.句法分析(依存句法分析、性能评价、汉英句法短语结构,含SpaCy\LTP\HanLP示例代码)
句法分析通过树状结构分析句子语法合规性,任务涵盖歧义消除和结构解析,依赖形式化语法(CFG、LFG、HPSG)和算法(CYK、移进-规约)。基于规则的方法受限于覆盖度和主观性,而依存语法以动词为中心,定义配价和支配关系,遵循Robinson四公理。spacy、LTP、Stanford CoreNLP和HanLP实现中英文依存分析,输出结构化结果及可视化树。汉语特点包括流水复句、缺少形态变化,需分层处理;英语侧重结构完整性。性能评估涉及UA、LA、等指标。短语结构可通过中心词规则转为依存结构,存在理论关联。
2025-04-07 00:00:00
2762
5
原创 自然语言处理nlp--2.词汇分析(中英文单词形态分析,汉字自动分词原则、算法,未登录词识别,词性标注方法,词汇分析性能评价,含python.jieba库分词实验代码)
自然语言处理中的词法分析与词性标注是NLP的基础任务,其中词法分析包括英语的形态还原(处理规则/不规则变化、特殊形式和合成词)和中文分词(解决歧义切分和未登录词识别),主要采用最大匹配法、最短路径法和统计语言模型等方法;词性标注则针对词性兼类问题,结合规则(如词缀和上下文规则)、统计模型(HMM、ME)和深度学习方法(BiLSTM-CRF、BERT),并依赖标准标注集(如北大和Penn Treebank),其性能通过正确率、召回率和F值评估,这些技术为上层NLP应用提供基础支撑。也介绍了jieba库的原理。
2025-03-31 00:00:54
2386
原创 自然语言处理nlp--1.绪论(概念辨析、研究内容、主要困难、研究现状、研究方法、中/英文汉字/单词极限熵-信息量的比较)
自然语言处理的研究内容涵盖了从基础的语言理解到实际应用的多个方面,如机器翻译、信息检索、自动文摘等。其基本问题包括形态学、句法、语义、语用学和语音学等问题,主要困难在于歧义、未知语言现象、数据不充分性和语言知识表达的复杂性等。研究方法则主要分为理性主义方法和经验主义方法,近年来逐渐趋向于两者的融合。同时,给出了不同规模语料和不同语种字符的熵的比较和计算--单个汉字所携带的信息量平均为3.25个英文单词所携带的信息量,而全文的信息量不论语种应是趋于相同的。单个字符的熵最终会趋于收敛与一个定值。
2025-03-24 00:00:00
1955
原创 代表网络串讲(MLP BNN VGG ResNet SENet UNet 多模态CLIP Vilt YOLO RNN VAE GAN 扩散模型 LSTM GRU Transforme注意力 ViT)
本文系统梳理了深度学习领域的重要模型发展历程,从基础的多层感知机(MLP)到前沿的大规模预训练模型。首先介绍了MLP的基本原理和训练过程,包括防止过拟合的方法;随后重点分析了适合图像分类的经典网络(BNN、AlexNet、VGG16、GoogLeNet、ResNet、SENet)及其创新点;然后探讨了目标检测网络(R-CNN、YOLO、SSD)和图像生成网络(GAN、VAE、扩散模型)的算法特点;最后阐述了处理序列数据的RNN系列模型和Transformer架构,以及NLP大模型GPT、BERT和多模态模型
2025-02-10 00:00:00
2498
原创 网络爬虫Spider--一篇搞懂(入门基础知识-网络、并发、练习网站,初级爬虫-Requests、BeautifulSoup库,中级爬虫-Scrapy框架,高级爬虫-动态页面、反爬虫,部署,含代码)
从入门到精通python网络爬虫技术:涵盖解析HTML和DOM结构,包括使用Python的requests库发送GET和POST请求,设置Headers和管理Session,通过BeautifulSoup解析HTML提取数据。对于动态内容,Selenium或Playwright等工具模拟浏览器执行JavaScript和处理AJAX请求。Scrapy框架管理爬取流程,支持登录和Token验证,并通过代理和其他策略应对反爬措施。爬取的数据可存入数据库或导出为文件,中间件和日志工具则优化爬虫的性能与调试。
2025-01-13 04:42:31
5070
原创 《智能系统控制》上机实验MATLAB(开环/闭环系统对比,专家PID控制器及五条规则,模糊控制及隶属度函数,模糊控制器设计实例-水箱、洗衣机,神经网络控制-BP逼近、RBF逼近、自适应控制,遗传算法)
《智能控制(第四版)-刘金琨》课本例题和课后上机实验代码汇总(部分)
2025-01-04 00:47:35
1991
2
原创 《信息论》研讨--信息论的深度学习模型理解
本文综述了信息论在深度学习中的关键应用,重点探讨了信息瓶颈理论、互信息估计和编码率减少原则三大方向。在信息瓶颈理论方面,研究表明深度网络训练呈现"拟合-压缩"两阶段动态,非线性激活函数能促进信息压缩以提升泛化能力,变分信息瓶颈(DVIB)框架可有效提高模型可解释性。互信息神经估计(MINE)方法通过Donsker-Varadhan表示实现了高维数据中的高效互信息估计。最大编码率减少(MCR²)原则通过优化特征空间的多样性判别性平衡,在分类任务中展现出优于交叉熵的性能。生成对抗网络的理论分
2024-12-11 16:29:47
2744
原创 《人工智能前沿》课程报告--论文精读--Seeing the Unseen: A Frequency Prompt Guided Transformer for Image Restoration
《看见未见之物:一种频率提示引导的用于图像修复的变换器》图像修复是计算机视觉中的重要任务,特别是在恶劣环境下,如雨天或雾霾中拍摄的图像。传统方法依赖空间信息,忽视频率成分,而频率成分对图像质量有重要影响。本文提出了一种基于频率提示的修复方法FPro,通过动态学习低通和高通滤波器解耦图像特征,利用频率提示调制器增强修复效果。与传统方法相比,FPro能更有效恢复图像细节和结构,尤其适用于复杂退化情况。该方法利用频率域信息提升修复效果,尤其是在去雨、去雾等任务中表现出色。
2024-12-08 23:53:26
2087
2
原创 从0开始机器学习--12.决策分析-运筹优化与数学建模(决策分析方法,评价模型-层次分析法AHP、灰色综合评价法/灰色关联法、模糊综合评价法、TOPSIS法、数据包络分析DEA、组合评价法,含代码)
机器学习与评价模型的关系紧密,决策分析方法用于解决多目标、多准则的问题,广泛应用于评价模型中。常见的评价模型包括层次分析法(AHP)、灰色综合评价法(灰色关联法)、模糊综合评价法、TOPSIS法、数据包络分析(DEA)及组合评价法。从思想原理、算法步骤、应用场景、优缺点、简单python代码方面介绍和实现这些方法。
2024-12-05 02:15:19
2553
原创 Python制图(数据可视化处理与分析绘图大全,词云图,瀑布图、桑基图、旭日图、蜡烛图、地图,机器学习模型解释性图、训练决策边界、梯度优化过程、拟合结果,TensorBoard介绍,含代码和展示)
本文介绍了多种数据可视化方法,使用经典数据集如iris或伪数据为例,绘制了以下图表:核密度图、箱线图、小提琴图、气泡图、蜂群图、三维散点图、折线图、雷达图、散点图回归线、条形分布图、堆叠条形图、饼图、配对图、热力图、极坐标图、分面图、区域图、平行坐标图、漏斗图、瀑布图、树状图、甘特图、桑基图、旭日图、蜡烛图、地图,以及文字形式的词云图、网络图等。此外,还介绍了tensorboard的使用以及展示了模型解释性图表,如梯度下降过程的三维可视化和训练集与测试集分布对比图以及模型的训练可视化结果。
2024-11-29 02:04:09
9994
1
原创 从0开始机器学习--11.关联规则挖掘基础(概念-频繁项集、关联规则、支持度置信度提升度,经典算法-Apriori、哈希树优化支持计数,关联模式评估与复杂度分析,应用与未来趋势,含代码)
关联规则挖掘是一种从海量数据中发现隐藏模式的核心技术,广泛应用于零售、网络安全、医疗诊断等领域。通过经典算法如Apriori和高级优化方法如FP-Growth,结合支持度、置信度等评估指标,解决复杂数据分析难题。面对高维数据和倾斜支持度等挑战,未来趋势包括深度学习融合、实时挖掘和隐私保护。探索关联规则挖掘,助力数据价值最大化!
2024-11-18 00:54:21
3553
原创 《操作系统OS》期末复习笔记(引论、进程描述与控制、处理机调度与死锁、存储器管理、虚拟存储器、系统调用概念及UNIX系统命令)
根据《计算机操作系统(第四版)--汤小丹 梁红兵等》整理的操作系统前五章期末复习笔记及UNIX系统中常用的系统调用命令整理(知识点+例题)。操作系统的主要功能和四大特性、引起进程创建和终止的事件、进程同步机制和经典的进程同步问题、线程概述、作业和进程调度算法、如何避免死锁、连续分配存储管理方式、分页和分段存储管理方式、快表、请求分页和请求分段存储管理方式以及各自的地址变换流程、页面置换算法、系统调用和常见的UNIX命令。
2024-11-12 02:18:16
1674
原创 《数字图像处理》课程设计--基于灰度变换、Harris角点检测与聚类的图像区域分割方法--报告+代码
设计要求:对图像中任意感兴趣区域提取和标记。
2024-11-09 03:17:15
1510
原创 《数字图像处理》课程设计--基于预处理和EasyOCR的图像文本识别技术研究--报告+代码
解决问题:分割随机角度拍摄的图中的标签,并将标签中的字符按序识别出来。
2024-11-09 02:51:14
1883
4
原创 《DIP数字图像处理》复习笔记--6.图像分割与描述识别(边缘检测-Canny检测,直线检测-霍夫Hough变换,阈值分割,区域生长分割,模板、算子,图像表达与描述,模式识别概论)
根据“冈萨雷斯《数字图像处理》(第四版)”教材,本文重点介绍了图像分割和边缘检测技术,包括基于边界和区域的分割方法,以及Canny边缘检测、阈值分割、区域分割和分水岭变换,并且介绍了各类检测模板和算子。此外,简述了图像特征描述方法,如链码和傅里叶描述子,及模式识别在图像分类中的应用。
2024-11-08 04:58:14
1586
原创 《DIP数字图像处理》复习笔记--5.图像编码基础(图像压缩、冗余、编码定理,霍夫曼Huffman编码、香农Shannon-Fano编码、算术编码、LZW字典编码、行程编码、预测编码、变换编码,案例)
根据“冈萨雷斯《数字图像处理》(第四版)”教材,本文讨论图像编码基础。图像压缩旨在通过编码减少数据冗余,以便节省存储空间和传输带宽。编码方式分为有损与无损压缩,常见方法包括霍夫曼编码、Shannon-Fano编码、算术编码和LZW编码等。JPEG和MPEG则通过离散余弦变换与熵编码实现高效压缩。不同编码技术可根据需求在存储、传输和处理效率间取得平衡。
2024-11-08 02:35:44
2016
原创 《DIP数字图像处理》复习笔记--4.彩色图像处理(色彩基础、颜色模型及转换、色彩变换,灰度映射、彩色图像增强,含matlab中的相关函数)
根据“冈萨雷斯《数字图像处理》(第四版)”教材,本文主要讨论了图像颜色的基础知识和相关模型,重点包括颜色的三要素(色调、饱和度、明度),三基色原理,RGB、CMY、HSV等颜色模型的定义及应用,并介绍了色度图和伪彩色处理的技术。文中还概述了不同颜色模型的转换方法和在特定领域(如视频处理)的应用特点。
2024-11-08 00:08:59
2756
原创 《DIP数字图像处理》复习笔记--3.频率域滤波(傅里叶变换FT、余弦变换CT、沃什变换和哈达玛变换、低通滤波、高通滤波)
根据“冈萨雷斯《数字图像处理》(第四版)”教材,本文介绍了傅里叶变换在数字图像处理中的应用,包括其将图像从时域转换到频域以简化滤波和降噪。傅里叶变换使卷积操作更高效,有助于频域滤波器的设计,用于增强或抑制图像特征。在频域中,低频位于中心代表平滑区域,高频位于边缘表示细节。
2024-11-07 20:32:10
1923
原创 《DIP数字图像处理》复习笔记--2.灰度变换与空间滤波(图像运算,图像增强,直方图修改技术,空域滤波-图像平滑、中值滤波、线性滤波,什么是卷积,图像边界处理策略,图像锐化-梯度算子、拉普拉斯算子)
根据“冈萨雷斯《数字图像处理》(第四版)”教材,系统介绍了图像增强、滤波、编码和分割等基础知识,图像增强技术通过灰度变换、锐化和滤波等手段,提升图像质量,利于识别和分析。空域与频域处理结合逻辑、算术运算,用于噪声抑制与细节增强,广泛用于医学、遥感等领域。
2024-11-07 17:03:43
1838
2
原创 《DIP数字图像处理》复习笔记--1.数字图像基础(定义,概念、图像数字化,采样定理,量化级数选择,插值公式,参数信息、图像分类、像素间的相邻关系、图像存储)
根据“冈萨雷斯《数字图像处理》(第四版)”教材的顺序展开,解释数字图像处理中的重要知识点,本章主要介绍了数字图像处理的基本概念、过程和技术。数字图像是由具有不同灰度值的像素组成,通过采样、量化和编码等步骤实现数字化。图像处理的过程包括图像的采集、存储、传输和处理,广泛应用于医学、遥感等领域。处理的核心问题涉及图像数据的有效化、存储和传输,并且通过采样定理保证图像信号的完整性。图像的分辨率、灰度级和存储需求是影响图像质量和处理效率的重要因素,同时还介绍了邻接像素点之间的关系一级距离的计算。
2024-11-07 11:02:26
2812
原创 《计算机网络》详细复习笔记(概述、物理层、数据链路层、网络层、运输层,含重要知识点、协议讲解,名词解释,英语缩写介绍)
根据教材《计算机网络》谢希仁编著(第八版),包括计算机网络的基本概念包括分层模型(如OSI七层和TCP/IP四层)、数据传输方式(电路交换、报文交换、分组交换)、协议要素(语法、语义、同步)、时延与性能(传播时延、发送时延、处理时延)、数据链路层功能(帧封装、差错控制)、网络层路由机制(IP地址、路由器)及网络设备(如交换机、网桥)。运输层则涵盖UDP和TCP协议,包括UDP与TCP首部结构、socket定义、数值端口号、TCP连接的三次握手、数据发送、四次挥手,以及滑动窗口、流量控制和拥塞控制等概念。
2024-11-05 17:10:18
1531
原创 大模型微调、优化与评估(什么是大模型,知识外挂RAG,前缀微调prefix-tuning,低秩适应方法LoRA、QLora,微调方法对比总结,迁移学习,领域适应,评估指标BLEU、ROUGE)
大模型的出现就是一次生产力的进步,本文深入探讨大模型微调、优化与评估技术,尤其微调和领域适应,通过详尽实例、图表和清晰解释什么是检索知识增强RAG、指令微调低秩适应方法LoRA以及他的改进版QLora,让复杂概念易于理解。微调技术涵盖知识注入和指令微调,以实际案例展示RAG方法增强信息检索。文中进一步介绍迁移学习的原因与分类及适用场景、评估标准(如BLEU和ROUGE)。
2024-11-01 03:37:05
1818
原创 《数据结构》课程设计--c++快速排序、希尔排序、冒泡排序、堆排序、归并排序、基数排序
使用c++实现 std::sort函数、快速排序(第一个元素作为枢纽元、中间的元素作为枢纽元)、希尔排序、冒泡排序、堆排序、归并排序、基数排序。含代码和分析。
2024-10-27 04:15:57
1083
原创 《博弈论与强化学习》课程报告--论文精读--基于Offline-to-Online深度强化学习的分散式任务卸载策略研究
原论文通过离线预训练和在线微调相结合,构建了O2O-DRL模型以解决冷启动问题,从而在边缘环境中实现高效、实时的任务调度。实验结果表明,O2O-DRL在多种负载条件下优于传统方法,展示了其在边缘计算应用中的可行性和扩展潜力。
2024-10-27 03:47:45
2355
原创 《数据挖掘》课程设计--表单票据的理解识别
本次实验,本组成员在colab环境下利用Layoutlmv3模型对XFUND数据集中的中文、德语、日语、法语、意大利语表单进行内容识别,通过改进模型以及选择不同的模型提升表单识别准确率,验证了Layoutlmv3模型在处理多语言、复杂布局表单的内容识别任务中的有效性,同时深入了解了Layoutlmv3这种多模态模型。目的使用Layoutlmv3模型对XFUND数据集进行预测。方法1. 使用cnn和bert拆解Layoutlmv3模型;2. 在colab上运行layoutlmv3模型。结果。
2024-10-27 01:16:42
1320
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅