自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 5天学会Python丨Day 4丨让项目上线!用Flask构建你的第一个Web应用

是一个用。

2025-07-07 11:51:29 876

原创 python实战 第三天|用Pandas和Matplotlib玩转电影数据分析

是Pandas提供的标准转换函数,能智能地将看起来像数字的列转换为真正的数字类型。如何让你的朋友、同事,甚至全世界的人都能看到你的成果?今天,从数据清洗到探索性分析,再到多维度、多形式的可视化呈现,你已经掌握了分析数据的方法。你不再只是一个会写代码的程序员,更是一个能从数据中发现价值、并用优美图表讲述故事的分析者。运行后,你将看到一张词云图,会发现“哈利”、“蝙蝠侠”、“小森林”等词语出现的频率很高。在昨天的学习中,我们成功地从豆瓣抓取了Top250的电影数据,并将其存成了CSV文件。

2025-06-29 14:48:42 836

原创 告别手动复制粘贴!Python Day 2带你全自动抓取豆瓣电影TOP250

今天,我们将亲手打造一个简单的网络爬虫,从大名鼎鼎的豆瓣电影网站上,抓取TOP250电影的榜单数据。

2025-06-28 13:06:06 505

原创 别再Hello World了!这才是Python第一课的正确打开方式

本系列专为已有一定编程基础(例如熟悉 Java, C++, JavaScript 等)的你设计。我们不会从“什么是变量”或“什么是循环”开始,而是通过每天一个有趣的项目,带你领略 Python 语法的简洁之美、标准库的强大,并快速建立起“Pythonic”的编程思维。

2025-06-26 21:25:26 570

原创 Coding一下:社交媒体帖子数据清洗与分析

假设你是一名数据分析师,现在拿到了一批模拟的社交媒体帖子数据。这些数据比较杂乱,包含了许多非文本信息,如网址链接、@用户、话题标签以及表情符号等。你的任务是清洗这些文本数据,提取有用信息,并进行初步的分析。

2025-06-24 22:10:04 468

原创 大模型RAG 之 文本召回

文本召回模型是RAG系统的核心,主要分为稠密向量检索(如DSSM、SBERT、DPR)和稀疏向量检索(如TF-IDF、BM25)两类。稠密模型通过双塔结构将文本映射到低维向量空间,使用余弦相似度或欧氏距离衡量相似性,擅长语义匹配;稀疏模型则侧重关键词检索。其中对称检索处理相似文本对,非对称检索处理问答对(问题与长段落)。DSSM通过点击数据训练双塔网络优化排序损失,SBERT基于BERT进行微调支持多种训练目标,DPR专为问答设计优化问题-段落匹配。这些模型共同支撑了高效准确的文本召回功能。

2025-06-20 16:30:12 349

原创 一文搞懂什么是RAG

摘要:RAG(检索增强生成)通过结合外部知识检索与大模型生成能力,解决大模型的知识更新滞后、幻觉问题和高训练成本等痛点。其工作流程分为数据准备(向量库/搜索引擎/图数据库)、检索召回(相似性搜索)和答案生成(结合上下文)三阶段。与模型微调相比,RAG无需训练、支持动态知识更新,适用于开放域问答、事实核查等场景,但依赖检索质量。典型应用如实时问答、医疗咨询等,需权衡检索延迟与生成准确性。开源模型(如Qwen-chat)可结合RAG减少幻觉,提升答案可靠性。

2025-06-15 22:57:24 997

原创 谣言检测|论文阅读:Knowledge-Aware Multimodal Pre-Training for Fake News Detection

【代码】谣言检测|论文阅读:Knowledge-Aware Multimodal Pre-Training for Fake News Detection。

2025-06-12 18:50:27 637 1

原创 UIE报错AttributeError: module ‘paddle‘ has no attribute ‘fluid‘

PaddlePaddle在更新到2.0版本后进行了一些重大的变化。在旧版本的PaddlePaddle中,确实存在名为fluid的模块,但在新版本中,这个模块已被改名为paddle。Paddle 1.8 与 Paddle 2.0 API 映射表如下,如果还有其他报错,可以在表中查找并替换。在使用 paddle 的UIE进行信息抽取时,运行convert.py会报错。

2025-03-30 12:47:30 468

原创 虚假新闻检测方法研究:《QNMF A quantum neural network based multimodal fusion system for intelligent diagnosis》

首先,使用编码电路𝑉将融合的多模态数据特征𝒙𝑖编码为量子态,以获得量子数据|𝒙𝑖⟩,其中作者采用的方法是幅度编码,然后,编码后的量子态通过量子电路𝑈 (𝜽) 演化,得到最终状态|𝜓 ( 𝜽;作为智能诊断的通用融合系统,作者使用乳腺癌诊断和Covid-19诊断数据集进行实验来验证QNMF的有效性,为了提高数据的利用率,从而提高智能诊断的准确性,本研究将患者图像数据和EHR数据进行整合,作者利用 Pennylane 模拟真实的量子电路并从输入图像中提取特征,然后将其与 EHR 数据融合。

2024-04-01 13:19:30 2029

原创 虚假新闻检测方法研究:《Dual emotion based fake news detection A deep attention-weight update approach》

方法的具体流程:输入句子对(双重情感:发布者和社交情感),进行预处理,以消除数据重复和不一致,避免对模型的预测率产生负面影响。GRU 是用于收集时态数据的简化且专业的网络,它是流行的 LSTM 顺序学习网络的简化版本,GRU 有两个门:更新门和重置门,与 LSTM 网络类似,GRU 网络在不使用单独的记忆单元的情况下改变单元内的信息,它还能够依靠单词的长度来改善长距离,从而防止最小样本上的过拟合并增强稳定性,bi-GRU的实际优势在于它可以同时提取后向和前向的隐藏层特征,这使得它可以有效地获取上下文信息。

2024-03-27 16:46:41 1524 1

原创 量子+人工智能安全

在量子机器学习领域,安全问题是一个重要的研究方向。以下是一些当前前沿的相关量子机器学习安全问题和研究的入手点:鲁棒性与对抗性攻击:研究如何提高量子机器学习模型对对抗性攻击的鲁棒性,例如对抗性样本生成和检测算法,以及针对量子计算机的量子对抗攻击;探索鲁棒性算法,使模型能够在存在噪声、干扰或敌对操作时仍能保持良好的性能。什么是对抗性训练?数据隐私保护:研究如何在量子机器学习中保护数据隐私,特别是当涉及到处理敏感信息时,如何设计安全的协议和算法来保护数据隐私,避免潜在的隐私泄漏。

2024-03-26 15:12:44 2173

原创 ValueError: Expected more than 1 value per channel when training, got input size torch.Size([1, 384]

drop_last-如果数据集大小不能被批次大小整除,则设置为True可删除最后一个不完整的批次。如果为False,并且数据集的大小不能被批次大小整除,则最后一个批次将更小。(默认值:False)这个错误通常发生在使用PyTorch训练神经网络时,输入数据维度不符合预期,不能batch_size整除。可能是输入的数据有剩余但不足以达到batch_size所导致的。解决办法:只需要将这里的drop_last=True,问题便可解决。

2024-02-28 23:10:51 1178

原创 C++ | 指针、数组 & 自由存储空间

计算机程序在存储数据时必须跟踪三个基本属性:信息存储在何处; 存储的值为多少; 存储的信息是什么类型;指针是一个变量,其存储的是值的地址,而不是值本身。那么,如何找到常规变量的地址呢?只需对变量应用地址运算符(&),就可以获得它的地址。比如,a是一个变量,则&a是它的地址。下面这段代码演示了地址运算符(&)的用法:#include<iostream>using namespace std;int main() { /*定义

2021-08-22 12:33:20 567

原创 C++ | 数组、结构体

1.数组 是一种用于存储多个同类型的值的数据格式。例如,数组可以存储30个int类型的值,其中,每个值都存储在一个独立的数组元素中,在计算机内存中依次存储数组中的各个元素。1.1数组的声明声明数组的通用格式为:typeName arrayName [arraySize];其中 typeName 是这组元素的数据类型,arrayName 是数组名,arraySize 是元素数目,它必须是整型常数(如 10)或 const 值,也可以是常量表达式(如 3*5 )。...

2021-08-20 17:59:24 1046

原创 C++ 入门(编写第一个C++程序)

第一章 遇见C++ 欢迎进入C++世界!目录1.1 C++介绍1.2 C++程序创建1.3 集成开发环境(IDE)的选择1.4 第一个 C++ 程序1.4.1 main()函数1.1 C++介绍 C++ 是在C语言的基础上添加了面向对象和泛型编程的支持,它是21世纪最重要的编程语言之一,C++继承了C语言的高效、简洁、快速和可移植性的传统。下面是目前世界编程语言使用的排行榜。...

2021-06-30 00:16:17 19449

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除