- 博客(31)
- 收藏
- 关注
原创 前端开发——(1)使用vercel进行网页开发
在现代前端开发中,选择一个高效的部署平台至关重要。Vercel 提供了快速、简便的部署方式,特别适合静态网站和 Next.js 应用。本文将带你逐步了解如何使用 Vercel 部署并运行你的网页项目。
2024-09-22 17:04:25
947
原创 VLMEvalKit 评测实践:InternVL2 VS Qwen2VL
多模态技术的突破,正在改变我们理解和交互世界的方式。无论是强大的感知能力、复杂的推理分析,还是图文融合的创新应用,InternVL2 与 Qwen2-VL 展现了大模型的无限可能。
2024-09-16 19:51:15
3327
原创 AI大模型赋能游戏:更智能、更个性化的NPC
在传统游戏中,NPC(非玩家角色)的行为往往是预先设定好的,缺乏灵活性和变化性。然而,基于大模型的NPC可以利用其强大的推理和学习能力,实时生成对话和行为,使其看起来更加真实和多样化。随着大模型技术不断进步,它们在游戏中的应用变得越来越广泛和深远。从简单的角色对话到复杂的游戏策略,这些模型正在逐步改变我们对游戏的理解和体验。本文将从技术层面深入探讨大模型如何应用到游戏中。
2024-08-14 06:18:48
3220
原创 书生浦语多模态简述——学习笔记
第一个是浦语灵笔2.0,这也是一个多模态大模型,它是在书生浦语 2.0 的基础上,它是通过图文扩展训练得来的,用了它的强大的语言建模能力和他来其中蕴藏的其他的文本创作的能力,然后使它的文图文理解和创作的能力得到了显著的提升。
2024-07-24 22:54:57
977
原创 DataWhale机器学习——第六章支持向量机学习笔记
核函数用于将低维数据映射到高维空间,使得非线性可分问题在高维空间中变得线性可分。常见核函数有线性核、多项式核和高斯核。软间隔SVM通过引入松弛变量,允许一定的分类错误,提高模型的泛化能力。正则化参数用于平衡分类间隔和分类错误。对偶问题通过拉格朗日乘子法,将原始优化问题转换为对偶问题,使得求解高维空间中的最优超平面变得更为简单。核方法广泛应用于各种机器学习算法中,如核PCA、核LDA等,通过核函数将线性方法扩展到非线性情况。支持向量回归(SVR)用于解决回归问题,通过引入ε不敏感损失函数,控制预测误差范围。
2024-06-27 04:54:17
403
原创 DataWhale机器学习——第五章神经网络学习笔记
深度学习是包含多层网络的神经网络,通过更深层次的网络结构来提高模型的表达能力和泛化性能。感知机是一种简单的二分类模型,由输入层、权重和阈值组成。多层网络(MLP)包含输入层、隐藏层和输出层,可以解决非线性问题。包括卷积神经网络(CNN)、循环神经网络(RNN)和自组织映射(SOM)。神经网络的优化过程中可能陷入局部极小值,常用的解决方法包括初始化权重随机化、使用动量和高级优化算法(如Adam)。神经元是神经网络的基本单位,包括输入、加权、激活函数和输出。常见激活函数有Sigmoid、ReLU和Tanh。
2024-06-27 04:52:08
414
原创 DataWhale机器学习——第四章决策树学习笔记
决策树是一种递归地将数据集分成更小子集的分类和回归模型。多变量决策树使用多个属性的组合进行划分,提高了模型的灵活性和预测性能。剪枝是减少决策树过拟合的一种技术。
2024-06-27 04:51:05
393
原创 DataWhale机器学习——第一章、第二章笔记
机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验来玫善系统自身的性能在计算机系统中,"经验"通常以"数据"形式存在,因此?机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型" (model)的算法,即"学习算法"(learning有了学习算法,我们把经验数据提供给它,它就能基于这些数据产生模型;
2024-06-19 22:10:34
1015
原创 GAMES002图形学研发基础工具课程笔记-2.Windows + CMD + PowerShell
Microsoft Windows概述Microsoft Windows优点。
2024-05-06 18:08:08
649
原创 GAMES002图形学研发基础工具课程笔记-1.Linux+Shell
Linux是一群开源的、基于Linux内核的类Unix操作系统集合。Linux/UNIX系统层次概要。
2024-05-04 23:45:50
700
原创 MMPose姿态估计——3.DEMO实战
用户现在可以选择使用推理器(Inferencer)或 Demo 脚本从摄像头读取的视频中进行姿势估计。我们的脚本同样支持视频作为输入,由 MMDet 完成人体检测后 MMPose 完成 Top-Down 的姿态预估,视频推理时。我们的脚本同样支持视频作为输入,由 MMDet 完成人体检测后 MMPose 完成 Top-Down 的姿态预估。Inferencer 支持保存姿态的检测结果,具体的使用可参考。Inferencer 支持保存姿态的检测结果,具体的使用可参考。
2024-04-21 18:03:09
1733
1
原创 MMPose姿态估计——2.二十分钟上手 MMPOSE
本笔记包含了使用 MMPose 1.0 时开发者会关心的内容:整体代码架构与设计逻辑如何用config文件管理模块如何使用自定义数据集如何添加新的模块(骨干网络、模型头部、损失函数等)
2024-04-21 17:58:57
2641
1
原创 MMPose姿态估计——1.入门及环境配置
MMPose 是一款基于 Pytorch 的姿态估计开源工具箱,是 OpenMMLab 项目的成员之一,包含了丰富的 2D 多人姿态估计、2D 手部姿态估计、2D 人脸关键点检测、133关键点全身人体姿态估计、动物关键点检测、服饰关键点检测等算法以及相关的组件和模块,下面是它的整体框架:MMPose 由个主要部分组成,apis、structures、datasets、codecs、models、engine、evaluation 和 visualization。提供用于。
2024-04-21 01:36:28
1950
3
原创 书生浦语训练营2期-第七节课—OpenCompass大模型评测笔记及作业
客观评测:反映模型在一些性能数据上的指标主观评测:反映模型在与人类对话时的表现数据污染 是指本应用在下游测试任务重的数据出现在了大语言模型 (LLM) 的训练数据中,从而导致在下游任务 (例如,摘要、自然语言推理、文本分类) 上指标虚高,无法反映模型真实泛化能力的现象。由于数据污染的源头是出现在 LLM 所用的训练数据中,因此最直接的检测数据污染的方法就是将测试数据与训练数据进行碰撞,然后汇报两者之间有多少语料是重叠出现的。
2024-04-20 02:23:50
773
原创 书生浦语训练营2期-第六节课—Lagent & AgentLego 智能体应用搭建笔记及作业
在本节中,我们将基于 Lagent 自定义一个工具。Lagent 中关于工具部分的介绍文档位于动作 — Lagent。继承 BaseAction 类实现简单工具的 run 方法;或者实现工具包内每个子工具的功能简单工具的 run 方法可选被 tool_api 装饰;工具包内每个子工具的功能都需要被 tool_api 装饰下面我们将实现一个调用和风天气 API 的工具以完成实时天气查询的功能。
2024-04-20 00:13:54
1256
原创 书生浦语训练营2期-第四节课—XTuner微调LLM:1.8B多模态Agent实践笔记及作业
由在本节中主要就是带领着大家跑通了 XTuner 的一个完整流程,通过了解数据集和模型的使用方法、配置文件的制作和训练以及最后的转换及整合。那在后面假如我们也有想要微调出自己的一个模型,我们也可以尝试使用同样流程和方法进行进一步的实践!
2024-04-19 00:08:08
994
原创 Linux下GPU版本pytorch清华源安装
参考链接:https://blog.youkuaiyun.com/cyy0789/article/details/131137525。首先确保安装了anaconda,在anaconda prompt命令行窗口创建虚拟环境。conda create -n pytorch python==版本。conda activate pytorch==版本。输入conda list检查一下。
2024-04-17 01:34:47
1017
原创 书生浦语训练营2期-第五节课—LMDeploy 量化部署 LLM-VLM 实践笔记及作业
打开InternStudio平台,创建开发机。填写开发机名称;;选择10% A100*1GPU;点击“立即创建”。注意请不要选择的镜像,新版本的lmdeploy会出现兼容性问题。排队等待一小段时间,点击“进入开发机”。点击左上角图标,切换为终端(Terminal)模式。
2024-04-12 22:43:50
1086
1
原创 书生浦语训练营2期-第三节课—茴香豆:搭建你的 RAG 智能助理笔记及作业
RAG(Retrieval Augmented Generation)技术,通过检索与用户输入相关的信息片段,并结合外部知识库来生成更准确、更丰富的回答。解决 LLMs 在处理知识密集型任务时可能遇到的挑战, 如幻觉、知识过时和缺乏透明、可追溯的推理过程等。提供更准确的回答、降低推理成本、实现外部记忆。RAG 能够让基础模型实现非参数知识更新,无需训练就可以掌握新领域的知识。本次课程选用的茴香豆应用,就应用了 RAG 技术,可以快速、高效的搭建自己的知识领域助手。
2024-04-12 22:07:39
1830
1
原创 书生浦语训练营2期-第二节课—书生浦语大模型趣味 Demo笔记及作业
Lagent 是一个轻量级、开源的基于大语言模型的智能体(agent)框架,支持用户快速地将一个大语言模型转变为多种类型的智能体,并提供了一些典型工具为大语言模型赋能。它的整个框架图如下:
2024-04-06 19:13:50
1154
1
原创 书生浦语训练营2期-第一节课—书生浦语大模型全链路的开源体系
那接下来对于我们的一些开源工具体系做一个简单的介绍,那首先是数据方面,首先是去年已经发布了书生万卷 1.0 这样的一个多模态的数据集,它总数据量其实达到了两个TB,并且它都是符合主流的中国价值宏观的一些中文语料,里面包括有文本式数据、有图像文本的数据,有视频数据。他们其实经过了非常精细化的处理,就依赖实验室这边在整个大模型研发过程当中积累的关于数据的一些理解和经验。那在前不久又发布了书生万卷CC,就这样的一个就开源的数据集,它其实包括了从 2013 年到 2023 年的互联网的公开内容。
2024-04-01 15:44:02
805
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人