自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

后端研发工程师Marion的博客

后端研发工程师,JAVA/PHP/GO/Python,大数据,人工智能,机器学习,深度学习

  • 博客(722)
  • 收藏
  • 关注

原创 【智能体】MCP技术解析:重塑AI协作新范式

MCP(Model Context Protocol,模型上下文协议) ,2024年11月底,由 Anthropic 推出的一种开放标准,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信协议。MCP 的主要目的在于解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题,MCP 使得 AI 应用能够安全地访问和操作本地及远程数据,为 AI 应用提供了连接万物的接口。

2025-03-13 00:20:36 981

原创 【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析

知识蒸馏是一种模型压缩和加速的方法,旨在将大型、复杂的模型(教师模型)的知识转移到小型、高效的模型(学生模型)中。这一技术的核心思想是利用教师模型的输出(如软标签)来指导学生模型的训练,从而在保持较高性能的同时,显著减少模型的计算资源和存储需求。

2025-02-06 13:53:17 6624 1

原创 【AI编辑器】字节跳动推出AI IDE——Trae,专为中文开发者深度定制

字节跳动推出的Trae不仅是一款强大的AI IDE,更是一场关于编程方式变革的开始。它通过智能化的代码生成、补全、问答和审查功能,大大提高了开发效率和质量。同时,Trae还支持多种语言和主题,更加符合中文开发者的使用习惯。此外,它还提供了丰富的插件和扩展功能,以及高度可定制化的架构设计,使得开发者能够根据自己的需求进行个性化配置。与Cursor和Windsurf相比,Trae在AI代码自动生成、智能问答和多语言支持等方面具有显著优势。

2025-01-22 00:56:49 17821 1

原创 【LLM应用实战】文档问答系统Kotaemon-简介及部署实践

Kotaemon是一个RAG UI页面,主要面向DocQA的终端用户和构建自己RAG pipeline的开发者。本文主要针对开源文档问答系统Kotaemon的介绍,包括主要功能特点,与传统文档RAG的区别,部署教程以及效果体验等。目前Kotaemon针对中文语言支持不友好,但既然可以通过ollama进行部署LLM和Embedding模型,因此支持中文语言也是相对容易开发集成的。

2025-01-21 16:48:26 1259

原创 【Dify】RAG开源框架Dify:技术深度剖析与实践指南

Dify作为一个开源的RAG框架,凭借其强大的数据集管理功能、可视化的Prompt编排、高效的RAG管道、灵活的Agent功能以及多种大型语言模型的支持,为开发者提供了一个快速搭建生产级AI应用的平台。无论是对于技术人员还是非技术人员来说,Dify都大大降低了AI应用开发的复杂度,使得更多人能够参与到AI应用的开发和创新中来。未来,随着技术的不断进步和应用场景的不断拓展,Dify有望在人工智能领域发挥更加重要的作用。例如,通过引入更多的自然语言理解和生成技术,Dify可以进一步提升其问答和文本生成的能力。

2025-01-14 12:06:36 2219

原创 【DB-GPT】开启数据库交互新篇章的技术探索与实践

DB-GPT作为一个开源的AI原生数据应用开发框架,具有广泛的应用前景和发展潜力。通过整合自然语言处理、机器学习、数据库管理等多种先进技术,DB-GPT为开发者提供了一个简洁、高效、可扩展的开发平台。在未来,随着技术的不断发展和应用场景的不断拓展,DB-GPT将会在更多领域发挥重要作用。同时,我们也期待更多的开发者和企业能够加入到DB-GPT的社区中来,共同推动技术的发展和应用的普及。通过不断地探索和创新,我们相信DB-GPT将会为数字化转型和智能化发展注入新的活力和动力。

2025-01-11 13:28:21 1675

原创 【AI程序员】通义灵码 AI 程序员全面上线JAVA使用体验

这款 AI 程序员不仅是一款简单的编码助手,更是一个智能编程伙伴,能够大幅提升开发效率并降低技术门槛。阿里云通义灵码AI程序员已全面上线,成为全球首个同时支持VS Code、JetBrains IDEs开发工具的AI程序员产品。此次上线的AI程序员相比传统AI辅助编程工具,能力更全面,可以让开发者以更高效、更沉浸的方式完成编码任务,。代码是大模型应用最广泛的场景之一,随着大语言模型能力的不断增强,AI代码工具已从辅助编码升级到面向复杂任务的工程级协同编码。目前,

2025-01-09 23:41:07 1290

原创 【AI编辑器】Cursor与DeepSeek模型的集成:提升开发效率的新选择

通过本文的介绍,我们详细了解了如何将Cursor的模型替换为DeepSeek模型。DeepSeek模型以其卓越的性能和低廉的使用成本,为开发者提供了一种更具经济性和灵活性的选择。配置完成后,我们可以利用DeepSeek模型在Cursor中自动生成代码,提高开发效率。未来,随着AI技术的不断发展,相信会有更多优秀的模型涌现出来,为开发者提供更多的选择和便利。让我们一起期待更加智能、高效的编程时代的到来!

2025-01-04 11:34:45 7939

原创 【brew安装失败】DNS 查询 raw.githubusercontent.com 返回的是 0.0.0.0

从你提供的nslookup输出看,DNS 查询返回的是0.0.0.0,这通常意味着无法解析该域名或该域名被某些 DNS 屏蔽了。

2024-12-31 11:05:19 836

原创 【大模型】wiki中文语料的word2vec模型构建

Word2Vec模型由Google的Tomas Mikolov等人在2013年提出,其目标是通过无监督学习方法将词语映射到一个连续的向量空间,使得相似语义的词语在向量空间中的距离较近。:通过上下文预测当前词语,适用于处理较为常见的单词。Skip-gram:通过当前词语预测上下文,适用于处理较为稀有的单词。这两种方法的核心思想是:如果两个词在文本中经常出现在相似的上下文中,那么它们的向量表示应该彼此接近。基于这一思想,Word2Vec可以捕捉到语义上相似词汇的关系。

2024-12-28 16:12:19 840

原创 【实战分享】构建企业级RAG(Retrieval-Augmented Generation)知识库的全面实践

大模型指的是训练参数量极其庞大的深度学习模型,如GPT-3、GPT-4等。这些模型能够通过海量的数据学习,具备强大的语言理解和生成能力。在问答系统中,大模型能够理解用户提出的问题,并生成相关的回答。"""添加文档向量"""pass"""相似度检索"""pass"""获取页面分段"""passMilvus是一个开源的向量数据库,专为高效的向量存储和检索设计。Milvus支持多种索引方式(如IVF、HNSW等),并提供高效的查询和检索功能。索引构建:Milvus通过创建索引加速查询速度。

2024-12-22 11:19:01 2747 2

原创 【Windsurf】Windsurf:重塑编程未来的AI集成开发环境(IDE)深度解析

Windsurf作为一款新兴的AI辅助编程工具,以其革命性的设计理念和前沿的技术实力,在市场中展现出了强大的竞争力。它不仅在核心技术、功能特性、实际应用场景等方面表现出色,还在与市场上其他同类产品的对比分析中展现出了独特的优势。未来,随着AI技术的不断发展,Windsurf有望进一步提升其智能化水平,为开发者提供更加高效、便捷、直观的编程体验。对于开发者而言,选择适合自己的AI编程工具至关重要。无论是Windsurf还是Cursor,都有其独特的优势和适用场景。

2024-12-12 23:21:49 5204

原创 【V0.dev】AI驱动的用户界面代码生成工具深度解析

V0.dev作为一款基于AI技术的用户界面代码生成工具,以其高效、便捷的开发方式和高质量的代码生成能力赢得了广泛的关注和赞誉。通过本文的介绍和分析,我们可以全面了解V0.dev的各个方面,包括其简介、工作原理与功能、使用技巧、使用体验与案例分析、优势与局限、未来展望以及启发思考等。

2024-12-09 22:56:06 3175

原创 【AI工具】强大的AI编辑器Cursor详细使用教程

近日,由四名麻省理工学院(MIT)本科生共同创立的Anysphere公司宣布,其开发的AI代码编辑器Cursor在成立短短两年内,不仅吸引了全球超过2600万开发者的关注,更是在A轮融资中筹集超过6000万美元,公司估值飙升至4亿美元。这一成就不仅彰显了MIT创新创业的强大实力,也预示着AI代码工具或将成为继AI搜索之后的下一个热门领域。

2024-12-04 22:20:47 10797 2

原创 【Docker】Mac安装Docker Desktop导致磁盘剩余空间较少问题如何解决?

MAC电脑是8+256G,磁盘空间比较少,最近老是爆磁盘提示,于是通过Tencent Lemon做磁盘分析,发现Docker的Containers目录占用磁盘空间巨大,因此需要修改Docker Desktop的设置调小磁盘占用量。在 Mac 上安装 Docker Desktop 后出现磁盘空间不足的问题是常见的,尤其是在使用 Docker 容器和镜像时。特别是清理不再使用的镜像和容器,是一种有效的方法来减少 Docker 对磁盘空间的占用。Docker 使用的磁盘空间很大一部分来自未使用的镜像、容器和卷。

2024-11-12 11:31:27 1875

原创 【AIGC】探索超凡记忆:SuperMemory,你的私人智能书签助手!

SuperMemory 通过一个 Chrome 插件来导入推文、保存网站和内容。这个项目被设计成一个类似于 ChatGPT 的工具,但它专注于你的书签和个人知识库。实测收集的效果回答质量并不高,有些网站插件收集UI还有BUG。

2024-09-10 08:08:24 841

原创 【SpringBoot】自定义spring-boot-starter

定义:Spring Boot 中的 Starter 是 Spring Boot 相对于传统的 Spring 的优势原因之一。Starter 相当于模块,它能将模块所需要的依赖进行整合并对模块内部的 Bean 根据环境进行自动配置。使用者在使用 Spring Boot 中的 Starter 的时候,无需进行过多的配置和依赖,Spring Boot 能进行自动扫描并且为对应的模块设置默认值,做到真正的开箱即用。针对于一些没有封装成 Starter 的依赖,往往经常出现的情况是需要使用者自行进行必要的一些配置。

2024-08-23 08:20:27 1110

原创 【DDD】领域驱动设计概念深入探索

领域驱动设计(DDD)是一种深入业务领域的软件设计方法,它要求开发团队与业务专家紧密合作,共同构建准确反映业务逻辑的领域模型。通过深入理解DDD的核心理念、精细执行关键实践以及深入探索细节处理,我们可以构建出高质量、可维护的软件系统。未来,随着业务领域的不断发展和变化,DDD将继续发挥其重要作用,为软件开发带来更多的价值和挑战。同时,我们也需要不断学习和探索新的技术和方法,以完善和优化DDD的应用实践,为软件开发注入更多的创新和活力。实体映射策略。

2024-07-13 22:31:50 1246

原创 【AIGC】GPT-4深度解析:自然语言处理的新纪元

OpenAI为GPT-4开发了一个开源评估框架,旨在为研究人员和开发人员提供一个标准化的方法来测试和比较不同模型的性能。技术细节框架结构:介绍评估框架的组成元素和工作流程。自定义测试:讨论如何利用框架创建自定义测试来评估特定方面的表现。综上所述,GPT-4作为自然语言处理领域的杰出代表,凭借其庞大的模型规模、卓越的语言生成能力、以及多模态的交互潜力,正引领着AI技术的新一轮变革。

2024-07-11 23:44:12 1271 3

原创 【Redis】三大Redis内存分析工具介绍(Redisinsight、RDR、RMA)

定义:RedisInsight是一个直观且高效的Redis GUI(图形用户界面)管理工具。功能:提供对Redis数据的查询、分析以及与Redis数据库的交互功能。开发者:由Redis Labs开发,并作为Redis的官方可视化工具推出。Redis Data Reveal(简称RDR)是一款用于分析和可视化Redis数据库中每个key占用的内存空间的工具。

2024-06-27 22:54:10 6830 1

原创 【Redis】Redis内存使用优化方法

当优化Redis的内存使用时,可以深入考虑以下几个方面,从配置调整到实际操作细节,全面提升Redis的性能和效率。

2024-06-19 15:52:16 1359

原创 【AIGC】MetaGPT原理以及应用

MetaGPT是一种多智能体框架,它结合了元编程技术,通过标准化操作程序(SOPs)来协调基于大语言模型的多智能体系统。目前,MetaGPT在GitHub上已经收获了40K的star,多次获得GitHub Trending的第一名。其技术论文也在ICLR 2024中获得了oral的机会,并在相关工作中总分第一。这些成绩都证明了MetaGPT在技术和应用上的领先地位。

2024-06-15 17:52:30 1889 1

原创 【图片生成】大模型图片生成原理及应用场景汇总

大模型图片生成原理主要基于深度学习和生成式模型,以下是几种主流技术的原理概述。

2024-06-13 08:06:05 3628

原创 【Gitlab】Gitlab MAC M1通过Docker Desktop安装教程

32行# external_url 'http://192.168.1.222' #配置ssh协议所使用的访问地址和端口。66行# gitlab_rails['gitlab_ssh_host'] = '192.168.1.222'650行# gitlab_rails['gitlab_shell_ssh_port'] = 8822。#配置http协议所使用的访问地址,填写宿主机映射端口,不加端口号默认为80;如下,在external_url后面配置gitlab的访问url。点击run,弹出以下界面,配置。

2024-06-09 08:26:18 1671 1

原创 【AIGC】基于大模型+知识库的Code Review实践

基于大模型与知识库的Code Review实践,具体实施细节可以归纳如下:一、选择合适的大模型与知识库二、集成大模型与知识库到Code Review流程三、结合人工审查四、持续优化与改进通过以上具体实施细节,可以确保基于大模型与知识库的Code Review实践能够高效、准确地评估代码的质量和可靠性,提高开发效率。

2024-06-08 16:15:14 5207 10

原创 【大模型】Ollama+open-webui/Anything LLM部署本地大模型构建RAG个人知识库教程(Mac)

如果需要,可以使用AnythingLLM的开发者API进行自定义集成,以满足特定的业务需求。

2024-06-05 09:07:41 17389 8

原创 【前端】Mac安装node14教程

使用Node Version Manager (nvm)安装Node.js。以上命令将会安装Node.js 14.x的最新稳定版本。如果需要特定的14.x版本,可以使用。替换为特定的小版本号。

2024-05-31 23:03:24 1881

原创 【百度地图】通过IP获取地区,百度地图城市代码获取

343,黔西南布依族苗族自治州。84,克孜勒苏柯尔克孜自治州。107,红河哈尼族彝族自治州。116,德宏傣族景颇族自治州。274,湘西土家族苗族自治州。306,黔南布依族苗族自治州。342,黔东南苗族侗族自治州。373,恩施土家族苗族自治州。65,海西蒙古族藏族自治州。109,西双版纳傣族自治州。177,文山壮族苗族自治州。185,阿坝藏族羌族自治州。86,巴音郭楞蒙古自治州。88,博尔塔拉蒙古自治州。113,怒江傈僳族自治州。1642,昌江黎族自治县。1643,陵水黎族自治县。2032,乐东黎族自治县。

2024-04-28 17:33:31 1688

原创 【大数据技术】Hive基本原理以及使用教程

可以编写自定义函数(UDF、UDAF)并在Hive中注册和使用以扩展功能。

2024-03-22 18:51:49 612 1

原创 【Sqoop教程】Sqoop学习教程以相关资料

当使用Sqoop进行数据传输时,以下是更详细的步骤和示例:### 步骤1:安装和配置Sqoop1. 下载Sqoop并解压缩到指定目录。2. 配置`sqoop-env-template.sh`文件,设置JAVA_HOME、HADOOP_COMMON_HOME等环境变量,并另存为`sqoop-env.sh`。3. 配置`sqoop-site-template.xml`文件,设置数据库连接信息等,并另存为`sqoop-site.xml`。### 步骤2:连接到关系型数据库。

2024-03-22 17:50:11 1396 1

原创 【文件处理】Tika获得文件类型以及后缀

可以使用 Apache Tika 来获取文件类型,并使用 `getDefaultMimeTypes()` 方法来获取文件后缀。在这个示例中,我们创建了一个 `File` 对象并指定了文件路径。然后,我们使用 Apache Tika 的 `Tika` 类来检测文件类型,并使用 `detect()` 方法获取文件的正确类型。

2024-02-02 15:27:37 1058

原创 【前端部署】前端Vue部署正式环境部署上线流程

将 Vue 项目部署到线上,通常需要经过以下步骤:1. **本地开发和测试:**- 确保您的本地开发环境已经安装了 Node.js 和 npm。- 在命令行中进入您的 Vue 项目目录,并运行以下命令安装项目依赖:```bash```- 完成依赖安装后,可以使用以下命令在本地启动开发服务器进行测试:```bash```- 打开浏览器并访问 `http://localhost:8080`(默认端口号为8080),确保项目能够正常运行,并进行功能测试和调试。

2023-12-26 11:01:03 3279

原创 【Log4j2】Log4j2最佳实践:Log4j2配置超过7天压缩,超过3个月删除文件的滚动日志,分别定义info文件和error文件,按照每小时存储

如果你想要在控制台输出美化的日志信息,你可以使用Log4j2的ConsoleAppender和AnsiColorConverter来实现。在这个配置中,我们新增了一个Console appender(ConsoleAppender),用于在控制台输出美化的日志信息。使用PatternLayout的`%highlight{}`和AnsiColorConverter可以根据日志级别为日志信息添加颜色。在示例配置中,我们为不同的日志级别设置了不同的颜色。

2023-12-26 00:03:49 5375

原创 【JDK新特性】JDK和Springboot各版本新特性介绍

以下是一些较新版本的JDK的主要新特性介绍:java.timevarjavaswitchteeing()switchswitchswitchrecordnullnullswitchRecordsinstanceof当然,下面是一些较新版本的 Spring Boot 的主要特性介绍:这些是一些主要的 Spring Boot 版本的特性介绍,每个版本都有更多的改进和新增功能。您可以查阅官方文档以获取更详细的信息。

2023-12-25 22:37:56 1616

原创 【大语言模型】Transformer原理以及运行机制

当谈到Transformer模型的原理和运行机制时,以下是更详细的解释:总结:Transformer模型通过自注意力机制和堆叠的多层网络,能够学习到全局依赖关系和上下文信息,从而提高了自然语言处理任务的性能和效果。它具有并行计算的能力,在处理长序列任务时表现出色,并且可以通过调整模型的深度和宽度来适应不同的任务和数据集。

2023-12-24 09:18:30 2076

原创 【Chrome插件】Chrome插件开发流程

请继续阅读以下更详细的Chrome插件开发流程:编写插件代码:调试和测试:打包插件:提交审核和发布:推广和更新:以上是一个更加详细的Chrome插件开发流程。请注意,实际开发中可能会遇到各种挑战和问题,需要根据具体情况进行调整和解决。同时,持续学习和关注Chrome Extension API的更新,及时适配新的特性和功能,也是一个优秀的插件开发者应该具备的能力。

2023-12-23 09:53:24 1355

原创 【Kafka-Eagle】EFAK告警配置与实践

当配置和使用Kafka-Eagle进行告警时,以下是一些更详细的步骤和注意事项:adminadmin需要注意的是,Kafka-Eagle还提供了更多功能,如Topic管理、消费者组管理等。你可以根据具体需求,参考官方文档了解更多详细配置和使用方法。另外,及时更新Kafka-Eagle的版本并遵循最佳实践,有助于获得更好的使用体验和效果。

2023-12-22 12:21:57 2387 1

原创 【AI编程工具】目前市面上常见的AI代码助手(AI Coding Assistant)

阿里云通义AI大模型编码助手:通义灵码,支持VS Code、JetBrains等主流IDE(对标github copilot)-优快云博客9个免费的AI编程工具,智能自动编写和生成代码 | AI工具集导航 iFlyCode使用手册 - 知乎

2023-12-21 00:18:55 1940

原创 【Spring】SpringMVC项目升级成SpringBoot实践

将Spring MVC项目升级为Spring Boot项目需要一系列详细的步骤。web.xml@Service@Component请注意,这只是一个更详细的步骤指南,具体的升级过程可能会因您的项目和使用的库而有所不同。因此,在开始升级之前,最好详细阅读Spring Boot的官方文档和迁移指南,并遵循最佳实践进行升级。

2023-12-18 17:51:18 2283

原创 【AI工具】GitHub Copilot IDEA安装与使用

GitHub Copilot是一款AI编程助手,它可以帮助开发者编写代码,提供代码建议和自动完成功能。以下是GitHub Copilot在IDEA中的安装和使用步骤:总之,GitHub Copilot是一款非常实用的AI编程助手,可以帮助开发者提高编写代码的效率和质量。由于没有绑定银行卡则会报错。

2023-12-16 12:52:11 1724

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除