自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 Ubuntu 安装VS code

【代码】Ubuntu 安装VS code。

2025-10-27 15:29:37 133

原创 渲染模型生成数据集

BlenderProc can be installed via pip (pip install blenderproc) or by cloning the GitHub repository for the latest version. It runs within Blender's Python environment, requiring the command blenderproc run <script> to execute scripts. The tool uses k

2025-10-25 22:45:31 718

原创 复现MegaPose

本文介绍了MegaPose6D代码的复现步骤,包括环境配置、模型下载和推理过程。首先需要克隆代码库并设置环境变量,然后通过conda安装依赖包。接着下载预训练模型和示例数据(烧烤酱瓶子的RGB/深度图像、相机参数和3D网格)。在运行推理时,需注意版本兼容性问题。最后可生成包含物体位姿估计结果的JSON文件,并可视化输出。文章还介绍了不同输入模式(RGB/RGB-D)的模型变体,以及包含100万合成图像的数据集信息。

2025-10-25 00:55:10 669

原创 unity_MCP

一、python配置环境。二、创建unity项目。

2025-08-13 17:41:23 416

原创 CAD model dataset 下载

1、ABC: ABigCADModelDataset For Geometric Deep LearningNews | ABC Dataset

2025-07-17 20:11:50 433

原创 使用unity创建项目,进行动画制作

1. 创建unity项目。

2025-07-04 15:59:54 365

原创 科大讯飞语音转文字STT--unity

1、打开unity2、科大讯飞。

2025-03-27 19:41:04 602

原创 可视化轴包围盒

【代码】可视化轴包围盒。

2025-03-23 19:55:46 176

原创 LLMER(二)

1、在.env中替换成自己的api-key127.0.0.14、Run。

2025-03-12 00:29:04 277

原创 Real-time Animation Generation and Control on Rigged Models via Large Language Models

首先,我们在Unity中嵌入了一个大型语言模型(LLM),以输出结构化的文本,这些文本可以被解析为多样化和逼真的动画。其次,我们说明了LLM的潜力,使现有的动画之间的灵活的状态转换。我们的方法输出结构化的字符串编码的位置和旋转的时间序列,每个关节,这是解析产生的操纵对象上的动画。我们展示了层次结构不同的模型与各种运动,以强调我们的方法的鲁棒性生成的动画。虽然深度学习的最新进展已经彻底改变了计算机图形学的许多方面[5-7,13,3,4,14,2,9],但很少有作品探索了操纵3D模型的直接驱动。

2025-03-09 05:40:47 322

原创 LLMER: Crafting Interactive Extended Reality Worlds with JSONData Generated by Large Language Model

LLMER:利用大型语言模型生成的 JSON 数据构建交互式扩展现实世界图1:我们的系统增强沉浸式用户-XR交互的图示。它(i)处理语言/音频输入,(ii)利用LLM来识别必要的上下文类别,以提取最少的足够的XR上下文信息,并生成与人类用户的交互式对话以及结构化JSON数据-然后可以由各种设计的模块执行以创建虚拟对象和/或动画。这种多阶段方法-由LLM授权的处理,提取,生成和执行-有效地将复杂的生成问题投影到紧凑的子空间中,在子空间中生成上下文相关的结构化JSON数据,然后将结果映射回原始XR空间以驱动交互

2025-03-09 04:57:05 955

原创 ffmpeg、webrtcvad安装

【代码】ffmpeg安装。

2025-03-06 15:34:05 243

原创 A novel mixed reality remote collaboration system with adaptivegeneration of instructions

ABSTRACT 混合现实(MR)远程协作支持共享工作空间和各种非语言通信提示,使远程专家能够在沉浸式虚拟现实(VR)空间中表达想法,并通过创建增强现实(AR)指令(如远程装配/拆卸指导、紧急维护和培训)来指导本地工人完成工业物理任务。然而,由于地理分布导致的信息不对称,远程专家在综合考虑情境信息(例如,与任务相关的对象和伙伴的环境)。环境智能的发展为构建支持自适应指令生成的新型远程协作框架带来了新的思路。在本研究中,我们开发了一个新颖的MR远程协作原型系统,该系统能够基于远程专家简单直观的

2025-03-05 18:36:20 1098

原创 LLMR//https://github.com/microsoft/llmr?locale=zh-cn

此软件包是“用语言创造世界”的原型,它允许通过自然语言实时创建具有视觉、行为和交互元素的对象、工具和场景。我们的框架将基于提示的生成与 Unity 相结合,使用户能够在运行时自发创建,这是 VR 自诞生以来的核心元素。该软件包附带几个演示场景供您尝试:一个空的游乐场,您可以在其中单独创建对象,以及让 Dall-E 和 CLIP 参与其中以查找在视觉和文本上与您的提示相似的 3D 模型的场景。3-场景编辑:您可以在运行时以创造性或有用的方式修改现有场景,例如更改各种物体的颜色以适合色盲人士。

2025-03-02 02:35:08 535

原创 LLMR: Real-time Prompting of Interactive Worldsusing Large Language Models

LLMR-使用大型语言模型的交互式世界实时建模ABSTRACT 我们提出了混合现实的大语言模型(LLMR),一个使用LLM实时创建和修改交互式混合现实体验的框架。LLMR利用新颖的策略来解决理想训练数据稀缺的困难情况,或者设计目标需要综合内部动态、直观分析或高级交互性。我们的框架依赖于文本交互和Unity游戏引擎。通过整合场景理解、任务规划、自调试和内存管理技术,LLMR在平均错误率方面比标准GPT-4超出4倍。我们展示了LLMR的跨平台的互操作性与几个例子的世界,并评估它的各种创建和修改任务

2025-03-01 02:24:18 1214

原创 Azure Speech

需要信用卡,本人没有,所以没有完成注册。

2025-02-28 22:59:14 440

原创 Qanything 代码安装

如果要离线使用QAnything,需要提前在离线机器上部署本地大模型(推荐使用ollama),然后使用以下命令启动服务即可。

2025-02-25 13:59:10 388

原创 Qanything Version 2.0.0

在1.4版本中,解析Excel文档可能会存在一些限制,尤其是对于结构或格式特殊的文档,解析结果可能不太理想,主要只能识别纯文本部分,在处理复杂数据和格式时,可能会出现信息丢失或格式混乱的情况。新版本的解析逻辑可以分析表格的结构,包括行和列的布局,并可以自动识别表格表头,并将其放置在每个被分割的表段的顶部。新版本能够更精准地识别文档中的小标题,并根据这些小标题定位和组织相应的文本块,有助于优化解析效果,使得解析结构更加清晰,信息层次更加分明。优化上传文件逻辑,独立解析文件和问答请求,上传文件不再影响问答。

2025-02-24 16:35:39 1099

原创 Qanything本地问答

Ollama的安装参考。

2025-02-24 14:14:54 434

原创 如何通过手机制作电子签名

1、打开手机备忘录(笔记)

2025-02-15 03:49:00 745

原创 Pycharm WSL 运行代码

重新启动Ubuntu就进入了base。2、Ubuntu安装Anaconda。1、启动Ubuntu。配置terminal。

2025-02-14 21:56:06 575 2

原创 LLM-R: A Framework for Domain-AdaptiveMaintenance Scheme

LLM-R:一种结合层次Agent和RAG的领域自适应维修方案生成框架Abstract随着智能设备的日益广泛使用,维护在生产活动中的重要作用日益凸显。交互式电子技术手册(IETM)是支持智能设备维护的重要工具。然而,传统的IETM面临着从图形用户界面(GUI)向自然语言用户界面(LUI)过渡以及管理复杂的逻辑关系等挑战.此外,它们还必须满足当前对更高智能的需求。提出了一种基于大语言模型的维护方案生成方法(LLM-R)。所提出的方法包括几个关键的创新:我们提出了低秩自适应知识保留(LORA-KR)损失技术,按

2025-02-14 00:34:55 873

原创 Deepseek-r1: Incentivizing reasoning capability in llms via reinforce

为了支持研究社区,我们开源了DeepSeek-R1-Zero,DeepSeek-R1和六个基于Qwen和Llama的DeepSeek-R1蒸馏模型(1.5B,7 B,8B,14 B,32 B,70 B)在MATH-500上,它获得了令人印象深刻的97.3%的分数,与OpenAI-o 1 -1217相当,并明显优于其他模型。值得注意的是,我们的14 B模型的性能大大超过了最先进的开源QwQ-32 B-Preview(Qwen,2024 a),32 B和70 B模型的性能也创下了密集模型推理基准测试的新纪录。

2025-02-10 23:56:14 1104

原创 使用Ollama将Deepseek部署到本地,开发RAG 系统

1、直接cmd打开命令行操作。更改下载模型的默认位置。赋予该文件夹操作权限。

2025-02-10 20:19:48 484

原创 Dev Containers tutorial

本教程将指导您使用 Dev Containers 扩展在 Docker 容器中运行 Visual Studio Code。在 Docker 容器内运行 VS Code 有很多好处,但在本教程中,我们将重点介绍如何使用 Docker 容器设置独立于本地环境的开发环境。如果您查看活动托盘并看到 Docker 鲸鱼图标,您就会知道它正在运行。下载并安装 Docker Desktop,或其他 Docker 选项,例如远程主机上的 Docker 或兼容 Docker 的 CLI。您可以单击图标查看状态。

2025-02-06 00:40:10 373

原创 win11专业版安装docker

win11专业版安装Docker。下载后双击.exe安装。

2025-02-05 21:49:36 535

原创 已在此计算机上禁用 Sudo。若要启用它,请转到 Developer Settings page“设置”应用中的

已在此计算机上禁用 Sudo。若要启用它,请转到 Developer Settings page“设置”应用中的

2025-02-05 20:24:44 27347 1

原创 RAG综述

Retrieval-Augmented Generation for Large Language Models: A Survey摘要:大型语言模型(LLM)展示了令人印象深刻的能力,但也面临着诸如幻觉、过时的知识以及不透明、不可追踪的推理过程等挑战。检索增强生成(RAG)已经成为一个很有前途的解决方案,通过从外部数据库中整合知识。这提高了生成的准确性和可信度,特别是对于知识密集型任务,并允许持续的知识更新和特定领域信息的整合。RAG将LLM的内在知识与外部数据库的巨大动态存储库协同合并。这篇全面的综述论

2025-02-04 00:53:29 832

原创 获取GLM大模型的Api和Token

智谱AI开放平台

2025-01-21 21:50:56 330

原创 Multi-Agent

【代码】Multi-Agent。

2025-01-21 00:20:54 246

原创 LangGraph 入门

快速上手条件边复现LangChain得AgentExector类获取tavily api-key。

2025-01-16 23:06:59 458

原创 Pycharm 操作

3. Ctrl + Z 快捷键取消上一步操作。快捷键可以快速注释和取消注释。

2025-01-15 06:04:47 346

原创 电脑同时登陆多个微信

则可以同时登录两个微信。3、启动微信多开.bat。

2025-01-05 19:59:07 317

原创 Endnote 安装

下载地址:中科院文献情报中心(仅限中科院学生职工)

2025-01-05 17:25:08 1173

原创 windows客户端控制ubuntu服务器端

修改PasswordAuthentication选项。enp4s0/en01 inet后边是电脑的ip。在本机生成 SSH 公钥文件(非必须项)修改PermitRootLogin选项。active表示开启状态。通过连接本地进行测试。

2024-12-23 15:29:06 354

原创 Windows11配置深度学习环境

安装结束后,WIN+R并输入CMD打开命令提示符,在命令提示符里面输入nvcc -V即可以看到安装的Cuda版本。进入python,测试torch.cuda.is_available() 结果为True说明配置成功。WIN+R并输入CMD打开命令提示符,输入nvidia-smi查看驱动支持的。CTRL+SHIFT+ESC打开任务管理器,查看性能。把解压之后的文件夹内的内容放到对应的CUDA文件夹。对比CUDA和驱动的对应版本。检查CUDA是否正确安装。添加用户访问权限之后成功。下载CUDA 12.6。

2024-12-23 09:35:57 1277 1

原创 将PPT图存储为图片(EPS,tiff, svg、jpg、png)

由于将PPT直接截图会使得论文中的图片清晰度不够。

2024-12-22 06:27:53 14073

原创 Xinference本地直接安装、打开、部署、测试模型、api调用

Xorbits Inference (Xinference) 是一个开源平台,用于简化各种 AI 模型的运行和集成。借助 Xinference,您可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理,并创建强大的 AI 应用。1、安装 卸载cmake3.31安装cmake3.21安装Xinferencepip 安装的包默认存储在C盘,后续可以考虑改一下默认的路径修改xinference部署模型的存储路径:2、打开运行 xinference-local --host 127.0

2024-12-21 01:21:59 7371

原创 Dify 配置api key,构建机器人助手

可以修改url为自己想处理图像的地址,和改变query为自己的提问。Postman 可以对请求进行管理和测试。将密钥放在postman api_key处。2、使用dify调用机器人助手api。import 输入 request。点击发布,更新即可完成!dify api 密钥。

2024-12-21 00:04:20 5334

原创 获取qwen api key

点击查看-复制-得到api key。1. 进入阿里云百炼。

2024-12-20 16:05:38 6087

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除