LLM学习及应用
文章平均质量分 95
机智新语
我在AI机器人时代之海边捡贝壳。中国石油大学机械工程硕士,清华出版社签约作者
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
我用Python 实现了一个将word变成向量知识图谱的工具(RAG入门)
本文介绍了一个Python项目,将Word文档转化为向量知识图谱。项目通过提取Word文档文本,进行分块处理和向量化,利用HuggingFace的预训练模型(如BERT)将文本转换为向量表示,再基于向量相似度构建可视化知识图谱。核心功能包括文档解析、语义检索和图谱编辑,技术实现涉及文本向量化、相似度计算(使用余弦相似度)和节点搜索。该项目可帮助用户更好地理解和组织文档内容,建立知识点间的关联关系。原创 2025-06-23 07:00:00 · 1027 阅读 · 0 评论 -
我用Python 实现了一个可以添加多Agent的类似“微信”的聊天桌面程序2-添加了本地tools机制
本文介绍了如何为Python多Agent聊天程序添加本地工具集成功能。通过创建toolbox\localtools文件夹存放工具模块,实现了动态加载工具机制,包括文件查找和打开等实用工具。文章展示了工具选择对话框界面设计,以及工具与Agent结合的具体实现案例,如文件正则搜索和程序调用。这种集成使聊天程序从单纯文本交流升级为具备实际任务执行能力的智能助手。最后展望了未来可扩展的网络查询、参数配置等方向,为Python项目集成实用工具提供了参考方案。原创 2025-06-20 10:05:21 · 1143 阅读 · 0 评论 -
我用Python 实现了一个可以添加多Agent的类似“微信”的聊天桌面程序
大家好!最近我突发奇想:能不能做一个类似微信的桌面聊天程序,但聊天对象不是真人,而是各种AI助手(比如“知识渊博的历史老师”“幽默的段子手”)?说干就!我用Python和PySide6做了界面,结合大语言模型(LLM)实现了多智能体(Agent)聊天功能。今天就和大家分享这个小项目的实现过程~原创 2025-06-10 13:03:11 · 1397 阅读 · 0 评论 -
Google ADK+Qwen3+PowerShell+Anytxt=王炸,一个懒人找 window 文件的 AI Agent 实现 Python
本文介绍了如何利用 Google ADK 和 Qwen3 构建一个智能 AI Agent,帮助用户轻松查找和管理 Windows 系统中的文件。首先,Google ADK 是一个智能体开发工具箱,能够快速创建和定义智能 Agent 的行为与功能。通过设置环境变量,Agent 可以连接到本地或在线服务(如 Qwen3),并利用 PowerShell 工具进行文件搜索。Agent 能够根据用户需求调用不同的工具,如 find_files_with_powershell_regex 进行文件名搜索,或使用 any原创 2025-05-09 09:56:07 · 1168 阅读 · 0 评论 -
多模态模型通义千问 2.5-VL-32B-Instruct尝鲜——做小学数学题
Qwen2.5-VL-32B-Instruct是由阿里巴巴达摩院研发的多模态大模型,于2025年3月正式发布。该模型在Qwen2-VL基础上进行了深度优化,通过动态分辨率训练、时间维度的MRoPE编码等技术创新,实现了视觉理解能力的跨越式提升。模型参数规模达320亿,支持图像、视频、文本多模态输入,可处理长达1小时的视频内容,并具备精准的事件定位能力。核心能力方面,Qwen2.5-VL-32B在视觉分析领域表现突出:不仅能识别常规物体,还可解析图像中的文本、图表、图标及布局结构;原创 2025-03-26 09:02:15 · 1723 阅读 · 0 评论 -
不要太爽!!!不用任何其它杀毒软件工具清理C盘,用AI做一个清理C盘工具
最近,我的电脑C盘空间一直不足,只剩下16.9GB可用空间。这让我感到非常困扰,因为电脑运行速度明显变慢,系统也频繁提示磁盘空间不足。我尝试过各种杀毒软件和系统优化工具,但效果并不理想。于是,我决定自己动手,用一个简单的批处理脚本来清理C盘空间。原创 2025-02-28 19:43:44 · 1035 阅读 · 0 评论 -
超详细笔记——本地部署DeepSeek大模型和 RAG 知识库问答系统实录---Ollama+MaxKB+Python调用
通过以上一系列详细的步骤,我们成功在笔记本本地完成了DeepSeek大模型和RAG知识库问答系统(MaxKB)的部署,并实现了通过Python对其进行调用。这个过程不仅涉及到操作系统的安装与配置、虚拟机的使用、容器化技术(Docker)的应用,还包括大模型的下载与部署、知识库问答系统的搭建以及Python编程实现与系统的交互。希望本文能为对这方面技术感兴趣的读者提供有益的参考和实践指导,帮助大家更好地探索和应用人工智能技术。在实际操作过程中,可能会遇到各种问题,需要大家根据具体情况进行排查和解决。原创 2025-02-27 08:00:00 · 1858 阅读 · 1 评论 -
单 GPU 上把语言模型上下文扩展到 300 万词元?这篇论文做到了!
今天给大家解读一篇超厉害的论文,它提出的 InfiniteHiP 框架,能在单 GPU 上把语言模型的上下文长度扩展到 300 万词元。这意味着啥?以前模型 “看” 不了太长的内容,现在有了这个框架,模型能处理的文本变得超级长,理解和生成的能力也会大大增强。总的来说,InfiniteHiP 框架在扩展语言模型上下文长度上取得了很大的突破,为未来长上下文语言模型的发展提供了很有价值的参考,相信在后续的研究和改进中,它能变得更加完善,给大家带来更强大的语言模型应用。原文链接。原创 2025-02-21 08:16:19 · 873 阅读 · 0 评论 -
Moonshot AI 新突破:MoBA 为大语言模型长文本处理提效论文速读
这种混合方法在监督微调任务中尤为有益,例如当输入中的某些位置在训练目标中被屏蔽时,保留少数上层的全注意力,可使模型保持广泛的上下文覆盖,有助于需要全局视角的任务。而且,MoBA 可与现有的基于 Transformer 的模型无缝协作,它作为一种 “插件” 或替代方案,保持与原模型相同的参数数量,避免架构膨胀,同时保留因果掩码,确保自回归生成的准确性。随着语言应用中的序列长度持续增长,像 MoBA 这样的方法可能会在推动神经语言建模的可扩展性和成本效益方面发挥关键作用,为人工智能的发展注入新的活力。原创 2025-02-20 07:55:35 · 871 阅读 · 0 评论 -
我指导了一个五年级小学生用 DeepSeek 在 3 天内独立完成了《益智版 2048 》游戏开发
这次指导马小明开发《益智版 2048 游戏》的经历让我深刻认识到,在AI的加持下编程变得更加容易,AI编程思维对于小学生来说是完全可行且极具价值的。-----------------本篇完------------------原创 2025-02-10 19:58:53 · 1518 阅读 · 0 评论 -
如何白嫖DeepseekR1满血版API——并询问她关于2025年技术人如何暴富的建议
目前Deepseek除了官方渠道,由于其是开源模型,可商用,本地部署受硬件资源限制普通人只能部署7B的模型。而目前英业达、亚马逊、微软云等已经上线满血版的DeepseekR1模型671B的全量模型。原创 2025-02-03 11:23:14 · 843 阅读 · 0 评论 -
推理大模型的应用——DeepSeek_R1解决机械臂DH模型数学推理的实例
从给出的推理过程,显然已经达到了一个专业级的水平,虽然最终给出的答案有出入,但是已经可以感觉到,推理模型的威力,只要好好调教(有时间再深入研究),应该能够准确解决。或者是下一个R2直接就能做到。原创 2025-01-23 16:26:54 · 1414 阅读 · 0 评论 -
初学者如何利用AI辅助编程快速搭建软件原型
在当今这个快速发展的科技时代,AI辅助编程已成为软件开发领域的一大助力,尤其在搭建软件原型阶段,更是能帮助开发者快速探索众多想法,创造出新事物。吴恩达老师最近分享了关于搭建简单Web应用原型的一些最佳实践,其中重点提到了对软件堆栈要有明确的倾向性。以下是一些基于吴恩达老师观点的学习建议,希望能为初学者提供帮助。原创 2025-01-10 12:44:44 · 712 阅读 · 0 评论 -
《Hands on Large Language Models》(深入浅出大型语言模型)实战书探秘
全书内容详实、结构清晰,分为三大篇章,循序渐进地展开对LLMs的深入剖析。《深入浅出大型语言模型》是一本极具价值的AI语言领域著作,它不仅为读者揭开了LLMs神秘的面纱,更通过丰富的实例和前沿技术的分享,为读者在实际应用中提供了强大的助力。随着人工智能技术的不断进步,LLMs将在更多领域发挥重要作用,而本书无疑将成为众多读者探索这一领域的得力助手。未来,随着技术的进一步发展,期待作者能够持续更新本书内容,涵盖更多新兴技术和应用场景,为读者带来更加精彩的知识盛宴。原创 2025-01-08 15:20:04 · 3184 阅读 · 0 评论
分享