- 博客(28)
- 问答 (1)
- 收藏
- 关注
原创 【Datawhale AI夏令营】让AI读懂财报PDF(多模态RAG)(Task 2)
这直接决定了我们系统的第一步必须是 文档解析 (Document Parsing) 。我们不能简单地把PDF当成一个黑盒。需要设计一个流程,能自动化、结构化地从这些PDF中提取出两种核心信息: 文本块 (Text Chunks) 和 图片 (Images) 。更进一步,提取出的每一份信息,都必须牢牢绑定它的元数据——它来自 哪个文件 (filename) 和 哪一页 (page) 。这要求我们在整个处理流水线中实现 元数据(Metadata)的持续追踪 。我们需要建立一个能让机器“看懂”图片,并将其与文本关
2025-08-09 21:46:39
775
原创 【数据迁移】Windows11 下将 Ubuntu 从 C 盘迁移到 D 盘
摘要: 本文记录了将WSL(Ubuntu-18.04)和Docker数据从C盘迁移至D盘的尝试过程。通过wsl --export导出数据、注销实例后,再使用wsl --import重新导入。但重要警示:实际操作发现Docker迁移后出现严重问题(命令不可用、设置界面卡死),强烈不建议参考该方法。Ubuntu迁移虽暂未发现问题,但仍需谨慎操作。作者保留错误案例作为警示,强调数据迁移前务必多方验证,避免数据丢失风险。
2025-08-03 17:06:06
636
原创 【解决方案】删除Quartus相关文件后“应用和功能”中仍有残留着软件卸载项(Win11)
摘要:用户在Win11系统中发现未正确卸载的Quartus软件残留,通过删除注册表项(HKEY_CURRENT_USER和HKEY_LOCAL_MACHINE中Software/AlteraCorporation)后,再通过控制面板卸载程序,成功清除残留条目。操作中忽略卸载报错提示,无需重启即可生效。(98字)
2025-08-03 01:15:04
516
原创 【Datawhale AI夏令营】科大讯飞AI大赛(大模型技术)/夏令营:让AI理解列车排期表(Task3)
【代码】【Datawhale AI夏令营】科大讯飞AI大赛(大模型技术)/夏令营:让AI理解列车排期表(Task3)
2025-07-30 22:21:09
205
原创 【Datawhale AI夏令营】科大讯飞AI大赛(大模型技术)/夏令营:让AI理解列车排期表
本文记录了在DataWhale夏令营(让AI理解列车排期表)遇到的两个问题及解决方案:1)注册和获取API密钥时,若不清楚token可参考指定教程;2)baseline输出的JSON数组直接用于训练会报错,需通过脚本转换为独立的JSON对象。文章提供了完整的Python转换代码,包括将JSON数组转为JSONL格式,以及修复output字段类型问题,确保数据格式符合平台要求。转换过程包含错误处理机制,最终生成可直接用于训练的JSONL文件。
2025-07-27 20:53:20
345
原创 【Datawhale X 李宏毅苹果书 AI夏令营】Task2笔记
该分类器通过一系列卷积层(Conv2d)、批归一化层(BatchNorm2d)、激活函数(ReLU)和池化层(MaxPool2d)构建卷积神经网络,用于提取图像特征。随后,这些特征被输入到全连接层进行分类,最终输出11个类别的概率,用于图像分类任务。分类任务使用交叉熵作为性能衡量标准。
2024-08-28 18:22:44
708
原创 【Datawhale X 李宏毅苹果书 AI夏令营】Task1笔记
不同的参数也需要不同的学习率(而不是固定不变的):如果在某一个方向上梯度值很小(非常平坦),我们会希望学习率调大一点;MGBD需要随着时间的推移逐渐降低学习率:在梯度下降初期,能接受较大的步长(学习率),以较快的速度进行梯度下降;在物理的世界里,一个球如果从高处滚下来,就算滚到鞍点或鞍点,因为惯性的关系它还是会继续往前走。具体而言,AdaGrad在每次更新时对每个参数的学习率进行缩放,使得学习率对于梯度较大的参数较小,而对于梯度较小的参数较大。低维度空间中的局部极小值点,在更高维的空间中往往是鞍点。
2024-08-27 20:45:12
1051
1
原创 【科学计算与数学建模】自编码器
自编码器是一类尝试使用反向传播算法重新创建输入数据作为输出的神经网络。自编码器包含两部分:编码器和解码器。编码器读取输入并把它压缩成紧凑表示,解码器则读取紧凑表示并用其重建输入。我们把训练样本用噪声污染,然后使用解码器解码出干净的照片,以获得去噪自动编码器。
2024-03-22 00:00:00
1428
原创 【科学计算与数学建模】循环神经网络
RNN处理序列的方式是,遍历所有序列元素,并保存一个状态,其中包含与已查看内容相关的信息。实际上,RNN是一类具有内部环的神经网络(如下图)。在处理两个不同的独立序列(比如两条不同的IMDB评论)之间,RNN状态会被重置,因此,你仍可以将一个序列看作单个数据点,即网络的单个输入。真正改变的是,数据点不再是在单个步骤中进行处理,相反,网络内部会对序列元素进行遍历。
2024-03-21 00:30:00
978
1
原创 【科学计算与数学建模】Keras基础与简单应用
上面我们已经重塑了X_train和X_test的形状,但是mnist图片是通过矩阵存储在计算机里面,矩阵里的每一个元素都是一个像素点,每个像素都转换成了0~255的值,其中0代表白色,255代表黑色。该方法返回的是输入的类向量中所有类别所对应的one-hot编码构成的矩阵。请学员通过编程把X_train和X_test里面的像素点归一化到0-1之间的值,并查看X_train的第2个例子的第100个到150个像素点的值。参数dytpe表示需要转化的数据类型,其他参数都有缺省值,这里用不到,可以不用管。
2024-03-21 00:00:00
869
1
原创 【科学计算与数学建模】词嵌入模型
在前面的实训中,我们已经使用过简单的one-hot编码,one-hot编码是将标记转换为向量的最常用,最基本的方法。对于单词级别的one-hot编码,它将每个单词与一个唯一的整数索引相关联,然后将这个整数索引i转换为长度为N的二进制向量(N是词表的大小),这个向量只有第i个元素是1,其余都是0,对于字符级别的one-hot编码,它将每个字符与一个唯一的整数索引相关联,其余与单词级别的类似。
2024-03-21 00:00:00
972
1
原创 【科学计算与数学建模】logistic回归预测二分类
任务描述 相关知识 数据集以及任务介绍 任务 数据集 数据属性信息 提供的特征属性格式 提交的数据格式 实现方法—Logistic Regression 加载数据 数据标准化 逻辑回归模型 验证集的使用(Validation set) 训练过程 画图函数 测试数据的使用预测二分类 编程要求 测试说明任务描述本关任务:通过二分类,确定一个人是否年收入超过5万美元。相关知识为了完成本关任务,你需要掌握:
2024-03-19 22:40:30
1549
原创 【科学计算与数学建模】线性回归预测PM2.5值之模型训练及测试
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。y^为预测值,自变量x和因变量y是已知的,而我们想实现的是预测新增一个x,其对应的y是多少。这里的更新规则中学习率是固定不变的,是开始给定的一个超参数。然而adagrad算法则是修改了学习率 ,使之成为一个可变参数,每一次学习率 的变化都是基于之前的梯度。其中, 是一个对角矩阵,其中每一个对角元素i是梯度的平方,即从 直到 , 则是平滑项,通常取值为1e-8,避免除数为0。数据的读取如上训练数据的读取。
2024-03-08 00:25:47
1183
1
原创 【科学计算与数学建模】线性回归预测PM2.5值之数据处理
所有训练和测试的Data中含有18项污染物的观测数据AMB_TEMP, CH4, CO, NHMC, NO, NO2, NOx, O3, PM10, PM2.5, RAINFALL, RH, SO2, THC, WD_HR, WIND_DIREC, WIND_SPEED, WS_HR。本次作业是使用某监控站的观测记录,分成train set 以及 test set,train set 是该站每个月前20天的所有资料,test set 是从该站剩下的资料中取样出来。但是需要用到所有18类污染物的前9个数据。
2024-03-05 10:41:38
936
原创 【学习记录】FISCO BCOS之账户权限控制:基于角色的权限控制
FISCO的账户权限控制分为基于角色的权限控制和基于表的权限控制。本文内容是基于角色的权限控制。本博客仅用于个人记录学习过程,对于更详尽全面的教程内容、需求与设计等,请参考官方文档而非本文。
2023-08-12 13:00:13
1568
3
原创 【学习记录】FISCO BCOS之开发第一个区块链应用
本博客仅用于个人记录《FISCO BCOS之开发第一个区块链应用》的学习过程、复盘和保留的疑惑,对于更详尽全面的教程内容、需求与设计等,请参考官方文档而非本文章。
2023-08-04 02:03:58
834
8
原创 【计算机原理与结构】实验2《算术逻辑运算电路设计》
学校课程的实验。因为做实验时走了不少弯路,想记录一下,给后来做这个实验的朋友当个参考,希望大家都少走点弯路,能顺利做出来
2023-07-01 15:04:09
537
原创 【解决方案】Qt项目打包后,图片不能显示的一种可能原因
问题:项目打包后运行可执行文件,发现程序内控件label的pixmapd-图片没有显示解决方案:把.ui文件里label的pixmap处【选择文件】->选择图片的过程变为【选择资源】->选择图片,再重新构建运行,再打包。
2022-12-28 00:05:27
5830
原创 【个人记录】字符串部分复制和指针参数单向传递的问题发现
我曾以为函数的形参表只要有指针那就是双向传递,太图样图森破了,指针参数也有单向传递的情况。
2021-12-29 20:54:27
1175
原创 【报错】关于[Error] cannot bind non-const lvalue reference of type ‘std::String&‘ to an rvalue……的一个解决方案
使用dev c++进行一波教科书代码的练习时出现了一点问题,于是来记录一波。报错信息如下:[Error] cannot bind non-const lvalue reference of type 'std::String&' to an rvalue of type 'std::String'我的解决方案是:加了一个const引用
2021-12-20 16:32:02
11717
5
原创 【报错】关于[Error] unable to find string literal operator ‘operator“……的一个解决方案
在cout出现的报错,我个人粗心大意造成的原因
2021-12-13 23:39:31
10896
3
Qt使用QMediaPlaylist,资源文件下部分音乐媒体无法播放
2022-07-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅