自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 收藏
  • 关注

原创 LLM | 论文精读 | Spatial-RAG:于空间检索增强生成的真实世界空间推理框架

空间数据的结构化特性空间数据通常以几何形状(如点、线、多边形)存储在空间数据库中,需要通过专业的 SQL 查询语言进行检索。用户可能希望在特定区域内找到满足条件的目标(如“寻找离我最近的餐厅”),这需要模型能够理解并处理几何约束。自然语言的非结构化特性用户的查询通常是自然语言形式,包含模糊或复杂的空间意图。例如,“在从家到公司途中推荐一个可以快速吃午餐的地方”。传统的空间查询系统无法直接解析自然语言,而 LLMs 对几何概念的理解能力有限。空间与语义的结合。

2025-03-08 01:03:28 695

原创 LLM | 论文精读 | GIS Copilot : 面向空间分析的自主GIS代理

Temitope Akinboyewa,Zhenlong Li,Huan Ning,M. Naser Lessani等arXiv在地理信息系统(GIS)领域,生成式人工智能特别是大语言模型(LLMs)的出现为空间分析带来了革命性的可能。

2025-03-05 14:20:37 1047

原创 LLM | 论文精读 | CVPR | PEACE : 通过多模态大语言模型(MLLMs)赋能地质图全面理解

地质图以图形化方式展示地质特征,是地质学家研究地球历史、资源分布和自然灾害的重要工具。标题:标识物理区域、地图类型、作者等信息。比例尺:展示地图与实际地面距离的关系。图例:解释岩石类型、地质年代和地质特征的符号和颜色。主地图:显示区域的地质特征,包括岩石分布、褶皱和断层。索引图:显示与邻近区域的关系。剖面图:提供地表下岩层排列的垂直切片。地层柱状图:展示区域内岩层的序列、厚度和类型。

2025-03-04 00:25:57 1214

原创 Log | Hugo+PaperMod+Github创建自己的博客网站

Hugo+PaperMod+Github创建自己的博客网站

2025-02-25 17:07:51 995

原创 杂货 | 吐槽 | GPT无法上传文件

不知道怎么说,这几天GPT都无法将文件进行上传并进行理解,让我这种付费用户觉得很不值,有没有什么其他的推荐?

2024-11-30 12:20:48 834 2

原创 LLM | 论文精读 | CVPR | FairCLIP:追求视觉语言学习中的公平性

数据集包含了10,000名患者的记录,每条记录包含一张扫描激光检眼镜(SLO)眼底图像和一份临床笔记,这些记录用于青光眼的诊断。该数据集包含丰富的受保护人口统计属性,例如年龄、性别、种族、民族、语言偏好和婚姻状况。不同于常见的放射学报告,该数据集的临床笔记不仅记录了影像描述,还提供了如药物、非影像测试结果和家族病史等详细的临床信息,使其更符合典型的临床文档。数据集发布:提出了数据集,该数据集用于医疗领域VL模型的公平性研究,包含了丰富且详细的人口统计学信息。基于Sinkhorn距离的优化方法。

2024-11-25 15:50:57 760

原创 杂货 | 每日资讯 | 2024.11.21

声明:以下内容皆由GPT总结~

2024-11-21 14:17:33 675

原创 LLM | 论文精读 | CVPR | Alpha-CLIP —— 一个聚焦目标区域的CLIP模型

论文标题:Alpha-CLIP: A CLIP Model Focusing on Wherever You Want。作者:Zeyi Sun, Ye Fang, Tong Wu, Pan Zhang, Yuhang Zang等。期刊:CVPR 2024。

2024-11-21 14:09:43 1629

原创 LLM | 论文精读 | CVPR | 基于问题驱动图像描述的视觉问答增强引言

本文提出了一种增强视觉问答(VQA)性能的新方法,通过生成问题驱动的图像描述作为中间步骤,将上下文信息有效融入到问答过程中,尤其在零样本场景中展现出显著的优势。研究通过关键词提取技术使描述与问题紧密结合,从而提高了模型的理解和推理能力。实验结果表明,问题驱动的描述对提升多种问题类型的回答准确性效果显著,特别是在验证和属性类问题上。未来工作将着眼于更大规模语言模型的集成和对模型可解释性的提升。

2024-11-08 17:03:54 1227

原创 AI 大模型:重塑软件开发的未来

AI 大模型是通过海量数据训练的复杂神经网络模型,能够执行自然语言处理(NLP)、图像生成、文本理解等多种任务。这些模型通常拥有数以亿计乃至数以千亿计的参数,使得它们具备了强大的理解能力和推理能力。与传统的机器学习算法不同,AI 大模型不仅能够执行特定的任务,还能通过上下文理解和推理能力处理复杂和多样化的问题。以 GPT-4 为代表的生成式 AI 模型,不仅能够生成自然语言文本,还能完成代码编写、问题解答、自动文档撰写等任务。

2024-11-08 16:46:17 885

原创 杂货 | 每日资讯 | 2024.11.3

MIT的HPT模型为机器人学习提供了新的思路,特别是在应对环境变化和数据不足的情况下,展示了强大的适应能力。CoreWeave成立于2017年,总部位于新泽西州罗斯兰,主要通过其14个数据中心出租英伟达的AI芯片,计划在年底前将数据中心数量增至28个。该模型借鉴了大型语言模型(如GPT-4)的架构,能够整合来自不同传感器和环境的信息,通过变压器将这些数据汇总,进行统一的训练。2023年8月,CoreWeave从部分投资者处筹集了23亿美元的债务融资,以英伟达的AI芯片作为抵押品。

2024-11-03 23:35:27 385

原创 LLM | 论文精读 | AAAI | EarthVQA:向可查询地球迈进的多模态视觉问答研究

EarthVQA 是一个用于地球遥感场景理解的多模态视觉问答(VQA)数据集,包含 6000 幅高分辨率遥感图像及 208,593 对问答对。该项目旨在推动复杂地理场景中对象关系推理的研究。为此,我们提出了对象感知的语义框架(SOBA),通过深度语义分割和混合注意力机制提升模型性能。在实验中,SOBA 在对象计数和关系推理任务上表现出色,显著优于现有方法。本文详细介绍了 EarthVQA 数据集设计、SOBA 框架的构建及各模块的性能贡献,为遥感信息智能化提供了新方向。

2024-11-03 23:29:09 1405

原创 杂货 | 每日资讯 | 2024.11.2

大会期间,专家学者围绕自动化与人工智能的深度融合展开讨论,探讨新产业、新技术的创新发展。这两场会议的召开,体现了我国在人工智能与自动化领域的快速发展和深度融合。此外,大会还设立了多个专题论坛,涵盖智能制造、机器人技术、人工智能算法等领域,旨在促进产学研合作,推动科技成果转化。西安市政府表示,将继续加强与科技企业的合作,推动人工智能技术在城市治理、产业升级等方面的应用,打造智慧城市新标杆。2024年11月2日,人工智能领域迎来了两场重要会议,分别在西安和青岛举行,聚焦于人工智能与自动化的融合发展。

2024-11-02 20:45:33 411

原创 LLM | 论文精读 | CVPR | SelTDA:将大型视觉语言模型应用于数据匮乏的视觉问答任务

本文提出了SelTDA(Self-Taught Data Augmentation)方法,用于在数据稀缺的视觉问答(VQA)任务中增强大规模视觉语言模型(VLM)的性能。SelTDA通过教师模型生成图像的伪标签(问题和答案),然后用这些标签对学生模型进行训练,实现了在无需额外人工标注的情况下扩充数据集。该方法主要包括教师模型训练、伪标签生成和学生模型微调三个步骤。实验结果表明,SelTDA不仅提升了模型在数据稀缺任务中的表现,还显著增强了其跨领域泛化能力和数值推理能力。

2024-11-02 20:37:25 2645

原创 杂货 | 每日资讯 | 2024.11.1

新的搜索功能使ChatGPT能够实时获取互联网信息,弥补了之前模型仅限于2021年或2023年之前数据的局限性。用户在与ChatGPT互动时,模型可以自动或手动触发网络搜索,提供最新的新闻、股票行情、天气预报等信息。2024年11月1日,人工智能领域的多项重要事件标志着技术发展的新阶段。OpenAI为ChatGPT新增搜索功能,提升了AI模型的实时信息获取能力;IEEE发布的报告为未来技术发展指明了方向;武汉设计日的开幕展示了设计创新在城市发展中的重要作用,特别是人工智能在设计领域的深度融合。

2024-11-01 17:38:48 1255

原创 LLM | 论文精读 | 地学视觉语言大模型:Towards Vision-Language Geo-Foundation Model: A Survey

Towards Vision-Language Geo-Foundation Model: A SurveyYue Zhou, Litong Feng, Yiping Ke, Xue Jiang, Junchi Yan, Xue Yang, Wayne Zhang未提供。

2024-10-31 22:57:06 1346

原创 杂货 | 每日资讯 | 2024.10.31

在2024年10月30日,人工智能领域涌现出一些重要的新发展和大事件。这些新进展涉及人工智能在金融、搜索技术以及大型科技公司业务扩展中的广泛应用。本文将详细解读当天的几大AI事件,以便大家更好地理解当今AI技术的最新动态。

2024-10-31 22:30:45 1003

原创 杂货 | 如何看待诺贝尔物理学奖颁给了机器学习与神经网络?

这对未来科学的发展意味着什么?面对这一变化,作为科学的见证者和受益者,我们不妨对未来充满期待,并积极参与到科技进步的浪潮中去,共同迎接一个更加智能和充满可能性的世界。在神经网络的设计中,很多灵感来源于物理学的基本原理,比如能量函数的优化和系统的稳定性。而随着研究的深入,神经网络的行为也反过来启发了物理学家对复杂系统的理解,例如相变、混沌和非线性系统的动态表现。通过对数据进行模式识别和特征提取,神经网络可以从繁杂的实验数据中找到隐藏的规律,从而使物理学研究得以突破传统理论的限制,向更广阔的未知领域进发。

2024-10-28 15:52:09 885

原创 LLM | 论文精读 | NeurIPS 2023 | SWIFTSAGE: 结合快思考与慢思考的生成智能体

SWIFTSAGE的目标是通过结合快思与慢思两个模块,来实现复杂交互任务的高效解决。SWIFT 模块:这是一个小型的编码-解码语言模型,通过模仿学习对其进行微调,用于模拟人类的直觉思维。它能够快速解码出下一个动作,适合简单且直接的任务。SAGE 模块:使用类似于 GPT-4 的大型语言模型,模拟深度分析的推理过程。规划阶段和执行阶段。规划阶段负责生成高层次的任务建议,执行阶段则将这些建议转化为可执行的具体操作。

2024-10-28 01:42:42 1105

原创 LLM | 论文精读 | 基于LLM的智能体的崛起与潜力(The Rise and Potential of Large Language Model Based Agents: A Survey)

基于大型语言模型的智能体通过大脑、感知和行动三个模块,展现了强大的自然语言交互和环境感知能力。无论是在单一应用还是在多智能体协作、人与智能体交互方面,LLM智能体都表现出了巨大的潜力。尽管面临挑战,但未来的智能体将会更加智能化、自动化,并且在人类的日常生活中扮演越来越重要的角色。

2024-10-25 19:07:00 963

原创 LLM | 论文精读 | 基于大型语言模型的自主代理综述

基于大型语言模型的自主代理综述

2024-10-25 14:03:02 1286

原创 LLM | Hugging Face | 如何利用几句代码实现强大的AI效果(pipeline)?

pipeline()是 Transformers 库中一个高层次的 API,用于快速加载模型并执行推理任务。无论是文本分类、情感分析,还是机器翻译,甚至是语音识别,pipeline()都提供了一个简便的方法来进行处理,无需开发者手动加载模型、分词器或特征提取器等。

2024-10-20 14:33:17 801

原创 编程小白如何成为大神?大学新生的最佳入门攻略

编程学习之路~

2024-10-15 11:42:09 742

原创 LLM | Hugging Face | 微调属于自己的大模型(Fine Tuning)

利用hugging face进行模型微调

2024-10-15 01:23:15 1336

原创 LLM | Tokenization 从原理与代码了解GPT的分词器

GPT Tokenizer原理与代码

2024-10-11 00:24:46 1452

原创 State of ChatGPT ---- ChatGPT的技术综述

关于预训练、微调、强化学习... 引导入门把,技术细节不是很深入。

2024-10-06 23:31:50 1193 4

原创 Hello Algorithm:Capture 1,2 初识算法

能力有限,欢迎大家一同交流讨论!

2024-09-27 00:32:45 688

原创 从0开始理解sklearn中的贝叶斯分类器,包含原理与代码案例,从今天开始不在困惑(python,sklearn,numpy)

大家好,我又来了。今天带大家了解一下sklearn中的贝叶斯分类器。这里由于听说贝叶斯分类器比较重要,我就仔细了解了一下其原理,并给大家带来一些具体的案例 :)

2024-09-17 14:42:37 1083

原创 机器学习中的线性回归、非线性回归、多项式回归、多重共线性原理与sklearn实现(Python,sklearn,numpy)

以便更好的理解。共线性分析。

2024-09-16 00:36:28 1069

原创 SVM、混淆矩阵、ROC与AUC代码实现(python,sklearn,numpy)--别问我为什么没原理,因为我不会!

大家好,今天我学习了SVM(支持向量机),主要简单给大家讲解一下原理与案例。所以只是简单的了解了一下,用其代码实现了iris的分类而已。(真不是我偷懒 :)源代码。

2024-09-10 20:03:47 1055

原创 Kmeans原理与sklearn实现,通俗易懂,带有案例!!!0基础入手Kmeans使用!!!(Python, sklearn, numpy)

在前段时间我学习了一些简单的机器学习算法,今天终于到来了聚类算法的学习。。

2024-09-08 16:48:05 900

原创 利用PCA进行人脸特征降维提取,手把手实现(代码不能运行你捶我!!!)-- Python, Sklearn, numpy

还记得前几天我们进行了PCA原理的讲解吗?本来在原理上应该没有太多问题,但是选择的案例貌似有点太抽象了。因此,,意在帮助大家更好了解PCA。这里附上链接和邮箱.源代码ipynb,强烈推荐看这个PCA原理与基本实现。

2024-09-07 01:14:00 1181

原创 PCA降维算法原理与实现,0基础开始讲解,新手强烈推荐!!!(Python, sklearn, 机器学习)

主成分分析(Principal Component Analysis,PCA)是一种常用的数据降维技术,广泛应用于统计学、机器学习和数据科学等领域。它的主要目标是通过将数据从高维空间映射到低维空间,以保留数据的主要特征,并减少数据的维度。数据降维:提取主要特征,减少算法的计算量高维数据可视化:将高维数据通过PCA降维为2或3维,便于进行可视化。...

2024-09-05 01:30:15 687

原创 机器学习基石-数据处理篇 : 数据预处理Preprocessing (从0开始手把手教学,超级详细!)

机器学习中的数据处理

2024-08-25 12:28:24 1413 1

原创 Transformer从0阅读,从原论文《attention is all you need》开始向你深入浅出的解释注意力机制与Transformer -- 架构补充与广播机制

Transformer中的掩码与整体结构,详细解释广播机制

2024-08-24 20:03:06 1095

原创 Transformer从0阅读,从原论文《attention is all you need》开始向你深入浅出的解释注意力机制与Transformer,并利用Pytorch进行复现 -- 架构实现篇

从论文开始了解注意力机制与transformer,并复现

2024-08-19 20:31:35 729

原创 随机森林RandomForest详解(分类森林与回归森林),以及手把手教学案例实现,图文并茂帮助你从0了解随机森林(超级详细,0基础快速上手!)

自己原创总结,难免有错误不严谨之处,请大家理解,并欢迎指出 :)有疑问或者错误欢迎讨论在评论区,或者Email: yuhan.huang@whu.edu.cn在今天,我们将会对于随机森林进行一个详解与案例展现。我们需要注意的是,随机森林是根据决策树构建的。因此,如果你对于决策树(DecisonTree)的原理不是非常了解,请先去看我之前写的两篇博客,并自己动手完成相关代码。文章链接:决策分类树决策回归树。

2024-08-16 19:48:55 5323

原创 Sklearn应用案例:Kaggle竞赛Titanic(泰坦尼克号), 手把手处理数据并利用决策分类树预测存活乘客 (numpy, pandas, sklearn)(超级详细!0基础)

决策分类树案例, Kaggle竞赛, 数据预处理

2024-08-15 03:11:58 1047

原创 Decision Tree Regression决策回归树原理与代码实现,并与MLP进行对比(Pytorch), sklearn,numpy(超级详细,0基础!)

今天我们继续学习决策树,对于决策树中的回归树,我们进行原理的讲解与案例的实现,与此同时,我复习了一下MLP的Pytorch实现,其中并没有调用太多的库函数,大家应该也能看懂。我们对比一下两个模型的效果,发现对于非线性的拟合,神经网络的效果还是明显优于决策树。

2024-08-13 14:03:05 1280

原创 DecisionTreeClassifier决策分类树详解(sklearn),并利用红酒数据集进行分类(0基础也能学会,超级详细)

决策树分类,红酒数据集,小白也能理解

2024-08-12 15:55:01 1739

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除