- 博客(517)
- 资源 (69)
- 收藏
- 关注

原创 通俗易懂的Latex教程文档
本篇文档可以搭配视频讲解使用。讲解视频: 通俗易懂的Latex教程(附数学建模国赛美赛模板) 这是一份面向刚入门数模,想要快速上手Latex排版的同学的Latex教学文档。在线编辑网站overleaf:https://www.overleaf.com/我所使用的环境:TeX Live (自带编辑器TeXworks) 编辑器:TeXstudioTeX Live和TeXstud
2021-10-05 17:02:15
32857
16
原创 【Ragflow】11. 文件解析流程分析/批量解析实现
本文继续对ragflow文档解析部分进行分析,并通过脚本的方式实现对文件的批量上传解析。
2025-04-04 18:48:36
115
原创 【Ragflow】10. 助理配置参数详细解析/模型响应加速方法
Ragflow的助理配置中,有很多参数,尽管官方文档给出了一定程度的解释,但不够详细。本文将对各项参数进行更详细的解释说明,并进一步挖掘某些参数中隐含的潜在陷阱。
2025-04-03 16:01:39
834
原创 【Ragflow】9.问答为什么比搜索响应慢?从源码角度深入分析
前几天看到有群友提到一个现象:Ragflow的搜索界面的问答速度很快,但聊天界面的问答速度很慢,究竟是什么原因?在深入挖掘源码之后,逐渐发现了问题的答案。
2025-04-02 18:22:06
450
原创 【Ragflow】8.基于ragflow API 搭建极简聊天Web界面
ragflow,dify之类的,对一些普通人来说还是不太友好,有没有什么开源平台对接api,给用户提供一个像千问,kimi那样的用户界面?之前的文章,看到有朋友这样留言。想来确有道理,ragflow 即便不让用户自己上传文档,也需要创建助理、预设提示词、选择知识库,对用户的确不友好。从商业角度上考量,为什么支付宝要做碰一碰支付?省去一步打开付款码操作,也会带来无穷的商业价值。因此,有必要实现一个更简单的界面,让用户打开即用。
2025-03-31 21:03:03
430
原创 Meissonic:一个轻量级的文生图模型
最近看了下文生图领域的最新进展,发现ICLR 2025有篇工作实现了轻量化的文生图模型,看效果图着实不错,本文来试玩一下。
2025-03-30 14:58:21
574
原创 【Ragflow】7. Ragflow-plus和Ragflow有什么关系?主流问题Q&A
Ragflow 是主流 RAG 结合大模型问答的框架之一,然而其开源版本存在诸多问题,例如,团队使用时,成员间知识库共享操作繁琐,缺乏有效的用户管理后台。因此,我对其进行二次开发,解决了部分问题。解决方案开源共享出来,起名为仓库地址:https://github.com/zstar1003/ragflow-plus。
2025-03-29 12:55:59
744
原创 【Ragflow】5.看完Python API文档,竟然成为了官方仓库的Contributor
本文将对Ragflow pythonAPI文档进行中文化梳理,主要根据原文档对主要功能模块的example进行梳理,对于详细参数,可根据英文标识进一步参考原文档。
2025-03-27 11:32:23
615
原创 【大模型】DeepSeek攻击原理和效果解析
> 前几天看到群友提到一个现象,在试图询问知识库中某个人信息时,意外触发了DeepSeek的隐私保护机制,使模型拒绝回答该问题。另有群友提到,Ollama上有人发布过DeepSeek移除模型内置审查机制的版本。于是顺着这条线索,对相关内容进行进一步探究。
2025-03-24 23:47:57
919
原创 【Ragflow】4.增加文档撰写功能,实现全新交互模式
在你习惯和大模型进行问答交互时,是否考虑过一个问题?如果用大模型辅助论文写作,问答是否是最优交互方式?ChatGPT中用Canvas实现编码的动态交互插入,这种交互形式是否可以进一步推广到文档撰写?于是我在ragflow框架的接口基础上,实现了该功能。
2025-03-24 16:31:02
728
原创 【大模型】Token计算方式与DeepSeek输出速率测试
本文将围绕token,对输入token进行统计分析,并对本地部署的DeepSeek大模型token的输出速度进行相关测试。
2025-03-18 23:52:03
1211
原创 【大模型】如何正确评估DeepSeek-R1各版本所需推理显存?KV Cache原理和显存计算解析
本文主要回答以下几个问题:1. 本地部署大模型时,如何快速判断所需显存量?2. 大模型推理所需显存由哪几部分构成?3. KV Cache是什么,为什么只有KV Cache而没有Q Cache?4. KV Cache显存如何进行计算?5. 大模型为什么会出现失忆现象,本质原因是什么?6. Ollama中,如何修改上下文长度?
2025-03-18 21:42:50
1364
原创 【Ragflow】3.给聊天界面打个美化补丁
本文是ragflow相关系列的第三篇,本文将介绍如何进行前端界面调试,并为聊天界面打一个美化补丁包。
2025-03-17 23:48:10
809
原创 【Ragflow】2. rag检索原理和效率解析
本文是ragflow内容解析系列的第二篇。本文将详细解析Ragflow是进行一轮信息检索的过程,并通过实验对比 Elasticsearch和 Infinity在检索效率上的差异。
2025-03-17 11:10:02
1614
原创 【实用技巧】如何优雅的批量保存网页快照?
正在研究LLM,师妹跑过来问我:"师兄,能不能写个程序,帮我批量保存一下网页快照。"我心想,保存网页快照,这不简单?但我研究一番发现,似乎没那么简单。
2025-03-15 22:40:10
809
2
原创 【科研工具】Zotero+DeepSeek:搭建科研辅助神器
去年写过一篇。当时众多插件中,有一款叫的插件,把Chat GPT的API集成进Zotero。然而,在当时LLM API普遍较贵的情况下,并不具备较高的使用价值。然而,随着 DeepSeek 将API价格打下来之后,用LLM API确实成为一条可行论文辅助阅读方案。看到不少文章已经讲解了如何在 Zotero 中配置 DeepSeek ,但是对具体的使用方式却所提甚少。因此,本文将从配置和使用两个角度,谈谈如何用 DeepSeek 辅助文献阅读。
2025-03-13 23:16:07
1092
2
原创 Ragflow技术栈分析及二次开发指南
Ragflow是目前团队化部署大模型+RAG的优质方案,不过其仍不适合直接部署使用,本文将从实际使用的角度,对其进行二次开发
2025-03-09 21:14:20
4526
5
原创 Academicagent v0.1.0:自制科研助理
这两天mauns很火,它整合了现有大模型和各种工具,实现将各种指令的整合落实。比如,现在用户问DeepSeek一个问题,它只会告诉用户具体怎么去做,而mauns直接去做,把各种结果和中间文件给到用户,仿佛是一个全能秘书。尽管mauns看上去的能力很强大,但我仍不看好这个产品,主要原因如下:没有提升基础大模型的性能与DeepSeek等工作相比,mauns更多是现有产品的整合,并没有从根源上提升基础大模型的性能,像DeepSeek等现有大模型,通常存在“幻觉”问题。
2025-03-07 16:37:21
715
原创 【Bug解决】Error response from daemon: failed to create task for container: failed to create shim task
在执行。
2025-03-05 23:49:51
881
原创 【大模型】DeepSeek-R1各版本模型推理显存需求测算【理论+实践】
最近临危受命,调研了一下DeepSeek需要什么硬件配置才能本地部署。查询中文社区相关资料,发现不少帖存在夸大唬人嫌疑。于是撰写本文,辅以实验验证,以正试听。
2025-03-05 00:03:54
2056
原创 【论文阅读】YOLOv12:基于注意力的实时检测器:YOLOv12:Attention-Centric Real-Time Object Detectors
注意力机制如(ViT系列架构)已被证明在建模能力上具有显著优势,但一直没有在YOLO等主流实时检测器上去采用,主要原因是在CNN上,注意力的计算效率不足。直接将注意力机制应用到CNN,存在额外的计算复杂度注意力机制内存访问低效(此点已被
2025-02-25 00:24:05
799
1
原创 【论文阅读】用于低空无人机视角目标检测的分层主动学习:Hierarchical Active Learning for Low-Altitude Drone-View Object Detection
本文是主动学习结合目标检测任务的一篇工作,发表在IJCV 2024。本文标题:Hierarchical Active Learning for Low-Altitude Drone-View Object Detection论文地址:https://link.springer.com/article/10.1007/s11263-024-02228-y开源情况:未开源。
2025-02-22 23:20:35
695
1
原创 【论文阅读】李飞飞团队的“50美元”大模型性能超o1-preview:s1: Simple test-time scaling
如题所示,这篇文章核心就是在验证"test-time scaling"这条定理,即在推理时增加推理时间,可以让模型的性能得到提升。为验证此定理,本文构建了一个高质量的1K条数据集s1K,在的基础上,对该数据集进行监督微调,微调在16张NVIDIA H100 GPU进行,共花费26分钟,按照H100的租赁成本,总成本约在50美元左右。
2025-02-20 19:01:04
720
1
原创 【论文阅读】原生稀疏注意力NSA:Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention
这篇文章相较于DeepSeek-R1这篇文章,聚焦范围更加小,R1的重点在于提出了一个文本生成的训练策略和蒸馏策略,这篇文章则是提出了一个注意力机制NSA,主要解决的是长序列做注意力时带来的效率问题。通篇文章看下来,它的实际意义可能比较局限,因此本文仅关注其主要内容,对于具体细节和实验结果并不进一步细究。
2025-02-19 23:30:20
1336
1
原创 【实用技巧】云服务器+FRP搭建自己的远程控制向日葵
组内公共机(windows系统)采用向日葵远程连接,向日葵本身提供的免费服务速度很慢,尤其是多人同时连接时情况更颇为糟糕。于是打算利用windows本身自带的远控服务,开辟一条自己的绿色通道。
2025-02-19 00:12:39
1078
原创 DeepSeek-R1论文阅读及本地调用
DeepSeek已经火了一段时间了,对于这项“国运级”的技术成果,即便研究的不是这个方向,也不免好奇前来看看。本文将先解析一下DeepSeek-R1这篇论文,再对DeepSeek的本地部署使用进行研究配置。
2025-02-14 17:18:21
3329
1
原创 【实用工具】搭建一个可转债打新提醒小助手
年末了,突然发现今年错过了无数次打新债的机会,经常想起来时,发现已经下午四点休市。于是想到是否可以做一个小助手来自动帮我看新债信息,如果有,直接给我发微信提醒。
2024-12-26 21:44:42
965
原创 【论文阅读】渐进解纠缠域适应检测:Instance-Invariant Domain Adaptive Object Detection via Progressive Disentanglement
本文是域适应目标检测任务的一篇工作,发表在TPAMI2021。目标检测中,当训练和测试图像来自不同的领域时,模型的泛化能力很差。比如,训练集和测试集具有不同的照明和不同的风格,在训练集上训练的模型就很难在测试集上取得良好的效果。域适应目标检测(domain adaptive object detection, DAOD)就用来解决这个问题。
2024-12-01 17:07:16
805
1
原创 解决Qt打包发布Windows时缺少依赖的问题
使用msvc编译完debug版本的qt项目,迁移到其它未安装QT的windows平台,出现一些缺乏依赖的报错,例如:问题的原因是编译时没有将相关运行依赖一起打包到build包中。
2024-10-24 23:58:59
649
原创 【论文阅读】基于一致性的目标检测主动学习方法:Consistency-based Active Learning for Object Detection
主动学习旨在通过以有限的预算选择信息量最大的样本来提高任务模型的性能。主动学习最早应用于图像分类中,目前一些工作逐渐将主动学习推广到目标检测任务中。
2024-10-16 00:22:38
976
1
原创 卫星遥感图像瓦片处理发布——以高分二号卫星图像为例
本文目的是将高分二号卫星拍摄的图像映射到谷歌地图上,由于之前没了解过相关领域,解决起来颇为坎坷,因此将解决过程记录如下。本人非GIS相关专业,以下内容为个人理解,仅供参考。
2024-07-16 00:55:41
1571
原创 【论文阅读】遥感大模型GeoChat : Grounded Large Vision-Language Model for Remote Sensing
本文是遥感领域的大模型相关的一篇工作,发表在CVPR2024。
2024-06-02 17:16:25
3090
11
原创 Docker配置MindSpore-GPU环境
项目指定MindSpore为推理框架,可惜该框架不支持在Windows系统中调用gpu,于是想通过Docker在Win10中调用MindSpore的Linux镜像,本文记录一下配置过程。
2024-05-16 23:25:11
1415
原创 【论文阅读-域自适应】Can We Evaluate Domain Adaptation Models Without Target-domain Labels?
无监督域自适应(Unsupervised domain adaptation)目的是对源域上训练的模型进行调整以适应未标记的目标域。然而由于目标域没有标签,因此很难有效评估UDA 模型的性能。对此,本文提出了一种迁移分数(Transfer Score)的评估指标。
2024-05-11 18:54:10
1140
1
原创 【科研工具】文献管理阅读工具Zotero7的安装与常用插件配置
工欲善其事,必先利其器。之前一致用ReadPaper这个软件看文献,不过最近其调整了付费策略,一些原本免费的功能如阅读时长记录变成需要付费解锁,加上其文献均存储在云端,导致在给别人分享文献时需要重新去网站下载。
2024-05-09 23:48:26
14134
3
原创 JetBot手势识别实验
本实验目的在JetBot智能小车实现手势识别功能,使用板卡为Jetson Nano。通过小车摄像头,识别五个不同的手势,实现小车的运动及灯光控制。
2024-04-25 23:43:07
1766
1
数据集spacenet/AICrowd/CHN6-CUG/deepglobe-road-dataset/Massachuset
2022-07-07
苹果科技官网前端界面(纯H5/CSS/Javascript)
2022-06-13
【Android】husbandry项目工程文件
2022-06-13
Android:简单登录注册Demo
2022-06-13
雾霾定位探测系统(App)
2022-05-11
MLP/LeNet/AlexNet/GoogLeNet/ResNet在三个不同数据集上的分类效果实践
2022-05-02
雪堆博弈-最小节点覆盖问题程序与文档
2022-05-02
医学数据库MIMIC-III v1.4
2022-05-01
一个简单实现登录和注册的小demo
2022-02-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人