使用 GPT4All LLM 在 Java 中创建和改进您自己的本地 PC 离线 ChatGPT

原文:towardsdatascience.com/create-and-revamp-your-own-offline-chatgpt-on-local-pc-with-gpt4all-llm-in-java-7c03996f28c8

随着 OpenAI 推出的**ChatGPT的出现,这一技术的采用率和受欢迎程度急剧上升,并继续以指数级增长到今天。由此产生的范式转变已经在我们生活的多个方面得到反映;从我们工作的方式到将我们的默认信息来源切换到回答日常问题的来源。当大众对 ChatGPT 带来的便利赞不绝口时,主流媒体似乎报道不足的另一面——(1)在用户/提供商端发生电力/网络中断或服务器故障时会发生什么?”,(2)如果工作场所没有互联网连接怎么办?”或(3)**“数据隐私会被侵犯吗?](https://www.makeuseof.com/things-you-must-not-share-with-ai-chatbots/)”等等。

将(2)应用于现实世界情境,这一点极为相关,因为众所周知,在医疗保健和军事防御等高安全设置中的工作人员必须在没有或几乎没有网络访问的情况下完成大部分工作。

这仅仅是因为任何不希望的数据泄露(例如患者健康数据)的风险是这些高风险环境中无法承受的风险。反过来,这自然引出了一个问题:“ChatGPT 或其他类似技术是否对这一群体的成员来说是不允许的?

简而言之,答案是,因为幸运的是,开源社区已经创建了具有可比性能的替代方案。更具体地说,在商业和开源竞争对手之间的竞争不断进行的过程中,出现了一个名为**“离线 ChatGPT”**的类别。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/75723d9baf58dd73501d47da37ff8b58.png

作者插画

项目动机

在本地 PC 上离线运行 ChatGPT

增加的可靠性导致更大的潜在责任风险。

除了上述目标受众之外,还值得注意的是,与谷歌地图类似,ChatGPT 的核心是一个由第三方服务提供商(即 OpenAI)提供的 API 端点。因此,它共享常见的单点故障,例如由于缺乏/有限的互联网连接或数据保密性泄露(在交换高度敏感数据时发生)而无法运行,从技术上讲,使所有最终用户都容易受到任何依赖在线 GPT 服务提供商使用的责任的影响。

幸运的是,通过转向“离线 ChatGPT”,其中一些缺点可以得到缓解,这些“离线 ChatGPT”是本地运行的,并且将输入/输出信息保持私密和封装。

本地化 ChatGPT 的选择:GPT4All

有两个关键考虑因素促使我做出这个选择。

  1. 简单设置

官方GPT4All 网站为开发人员和最终用户提供了简洁精确的设置其交互式聊天界面的说明。在“安装说明”部分,有三种可供下载的选择 –

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/03e1a4c43fe2cdd2dcc047cc819f55d4.png

作者截图 | 三个不同的下载分别针对每个操作系统 – Windows、Mac 和 Linux。| 注意:Windows 用户应选择如上所示的最左侧按钮(用黄色突出显示)。

安装完成后,可以从开始菜单启动聊天应用程序界面 –

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/e28fc3c11512c77f04ef47f32fb19649.png

作者截图 | 在 Windows 操作系统上搜索“GPT4All”并选择通过 GPT4All 界面开始与 AI 机器人助手进行对话。

2. 易于定制(针对开发者)

虽然聊天应用程序本身相当用户友好,但其便利性是以牺牲严格的用户体验为代价的。它不是平台无关的,因为它需要为每个操作系统提供不同的安装程序构建。为了提高用户体验,应用程序在源代码级别使用 GPT4All Java 绑定进行配置,从而消除了定制构建的需求。

因此,为了提高用户体验,我开始了这个宠物项目,使用GPT4All Java 绑定(版本 2.4.11)在源代码级别配置应用程序,以消除定制构建的需求并重新打包为便携式和独立工具。

关于 GPT4All 版本的注意事项

只有GPT4All v2.5.0及更高版本支持 GGUF 格式的模型(.gguf)。在撰写本文时,Java 绑定的最新版本是v2.4.11 – 它仅与 GGML 格式的模型兼容。(来源:官方 GPT4All GitHub 仓库)

设置 GPT4All Java 项目的步骤

预先条件

  • 在 PC 上安装了JDK 11JDK 8。安装程序可以从Oracle获取(默认情况下项目运行在 JDK 11 平台上)

  • (可选但推荐)使用 Java IDE,如NetBeansEclipse (注意:在这个演示中应使用 NetBeans)

  • Download a sample model such as ggml-gpt4all-j-v1.3-groovy.bin (~ 3.5GB) to test generated responses

gpt4all/gpt4all-bindings/java at main · nomic-ai/gpt4all

Based on the above GitHub documentation*,* download the Java bindings which are packaged into a single jar file – gpt4all-java-binding-1.1.5.jar and include it in the project classpath:

<dependency>
    <groupId>com.hexadevlabs</groupId>
    <artifactId>gpt4all-java-binding</artifactId>
    <version>1.1.5</version>
</dependency>

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/b850a82f8544a2f6ba4b29a6665a8a44.png

Imagine by Author | Note that within gpt4all-java-binding-1.1.5.jar, the native bindings for each of the respective OS – Linux (Ubuntu), MacOS and Windows are embedded.

需要包含的其他 强制 JAR 依赖项包括:

ASM

  • asm-9.2.jar

  • asm-analysis-9.2.jar

  • asm-commons-9.2.jar

  • asm-tree-9.2.jar

  • asm-util-9.2.jar

jnr/jffi

  • jffi-1.3.0.100-native.jar

  • jffi-1.3.0.jar

  • jnr-a64asm-1.0.0.jar

  • jnr-ffi-2.2.13.jar

  • jnr-x86asm-1.0.2.jar

SLF4J

  • slf4j-api-1.7.36.jar

  • slf4j-simple-1.7.35.jar*

***** JAR 文件的理由 –

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/184b87acdc9b49036d11bb2940801f20.png

Image by Author | slf4j-simple-1.7.35.jar is included to prevent the above warning message from showing up on runtime.

重要。请注意,运行此源代码所使用的 JDK 平台是 JDK 11

示例应用程序代码

The application code to test run its functionalities can be found at the same GPT4All GitHub repo link.

内容概要:本文介绍了ENVI Deep Learning V1.0的操作教程,重点讲解了如何利用ENVI软件进行深度学习模型的训练与应用,以实现遥感图像中特定目标(如集装箱)的自动提取。教程涵盖了从数据准备、标签图像创建、模型初始化与训练,到执行分类及结果优化的完整流程,并介绍了精度评价与通过ENVI Modeler实现一键化建模的方法。系统基于TensorFlow框架,采用ENVINet5(U-Net变体)架构,支持通过点、线、面ROI或分类图生成标签数据,适用于多/高光谱影像的单一类别特征提取。; 适合人群:具备遥感图像处理基础,熟悉ENVI软件操作,从事地理信息、测绘、环境监测等相关领域的技术人员或研究人员,尤其是希望将深度学习技术应用于遥感目标识别的初学者与实践者。; 使用场景及目标:①在遥感影像中自动识别提取特定地物目标(如车辆、建筑、道路、集装箱等);②掌握ENVI环境下深度学习模型的训练流程与关键参数设置(如Patch Size、Epochs、Class Weight等);③通过模型调优与结果反馈提升分类精度,实现高效自动化信息提取。; 阅读建议:建议结合实际遥感项目边学边练,重点关注标签数据制作、模型参数配置与结果后处理环节,充分利用ENVI Modeler进行自动化建模与参数优化,同时注意软硬件环境(特别是NVIDIA GPU)的配置要求以保障训练效率。
内容概要:本文系统阐述了企业新闻发稿在生成式引擎优化(GEO)时代下的全渠道策略与效果评估体系,涵盖当前企业传播面临的预算、资源、内容与效果评估四大挑战,并深入分析2025年新闻发稿行业五大趋势,包括AI驱动的智能化转型、精准化传播、首发内容价值提升、内容资产化及数据可视化。文章重点解析央媒、地方官媒、综合门户自媒体四类媒体资源的特性、传播优势与发稿策略,提出基于内容适配性、时间节奏、话题设计的策略制定方法,并构建涵盖品牌价值、销售转化与GEO优化的多维评估框架。此外,结合“传声港”工具实操指南,提供AI智能投放、效果监测、自媒体管理与舆情应对的全流程解决方案,并针对科技、消费、B2B、区域品牌四大行业推出定制化发稿方案。; 适合人群:企业市场/公关负责人、品牌传播管理者、数字营销从业者及中小企业决策者,具备一定媒体传播经验并希望提升发稿效率与ROI的专业人士。; 使用场景及目标:①制定科学的新闻发稿策略,实现从“流量思维”向“价值思维”转型;②构建央媒定调、门户扩散、自媒体互动的立体化传播矩阵;③利用AI工具实现精准投放与GEO优化,提升品牌在AI搜索中的权威性与可见性;④通过数据驱动评估体系量化品牌影响力与销售转化效果。; 阅读建议:建议结合文中提供的实操清单、案例分析与工具指南进行系统学习,重点关注媒体适配性策略与GEO评估指标,在实际发稿中分阶段试点“AI+全渠道”组合策略,并定期复盘优化,以实现品牌传播的长期复利效应。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值