本本本添哥
奶爸的编程之路,也就一周冷个三天~
专门分享AI大模型/Java微服务/计算机软考/项目管理/个人成长/思维框架/效能工具等相关内容
欢迎关注我的公众号:本本本添哥
展开
-
【人工智能】借助内网穿透工具(Cpolar)将部署在 Windows 本机的 Ollama 服务 API 公开到互联网
要将部署在 Windows 本机的 Ollama 服务 API 公开到互联网,需结合网络配置、安全防护和内网穿透工具。以下是详细步骤及注意事项,通过以下步骤,可安全地将 Ollama 服务 API 公开至互联网,实现远程调用。如需进一步优化,可结合负载均衡或监控工具(如 Prometheus)提升稳定性。原创 2025-02-06 16:09:37 · 1507 阅读 · 0 评论 -
【人工智能】阿里巴巴的WanX(通义万相)模型是其推出的多模态大模型,最新版本为WanX 2.1,专注于从文本或图像生成高质量视频与图像,并在AI视频生成领域实现了多项技术突破。
阿里巴巴的WanX(通义万相)模型是其推出的多模态大模型,最新版本为WanX 2.1,专注于从文本或图像生成高质量视频与图像,并在AI视频生成领域实现了多项技术突破。原创 2025-04-03 11:43:42 · 8 阅读 · 0 评论 -
【异常】SpringAI提示异常ClassNotFoundException: com.github.victools.jsonschema.generator.AnnotationHelper at
通过上述步骤,通常可以解决因依赖缺失或版本问题导致的。这个错误是由于应用程序在运行时无法找到。若使用Java 9及以上版本,需在。在项目的构建文件(如Maven的。)中,确保引入正确版本的。原创 2025-04-01 09:21:17 · 86 阅读 · 0 评论 -
【异常】因开了代理导致了调用大模型提示APIConnectionError: Connection error.
从你给出的错误信息可知,程序在尝试连接目标服务器时被拒绝,最终抛出。表明目标计算机积极拒绝连接。原创 2025-04-01 09:19:33 · 14 阅读 · 0 评论 -
【人工智能】DeepSeek系列模型介绍
DeepSeek系列模型是由深度求索(DeepSeek)公司推出的大语言模型。原创 2025-03-31 10:01:37 · 16 阅读 · 0 评论 -
【异常】Python的Gradio任何代码运行在浏览器显示loading问题解决方法
在内网部署gradio的时候一直提示loading,这时候你F12会看到一些css报错。原创 2025-03-31 09:53:55 · 537 阅读 · 0 评论 -
【项目实战】SpringAI的InMemoryChatMemory 多轮对话为啥不生效??
ChatClient和。这些组件看起来是为了创建一个具有记忆功能的聊天机器人,以便在多轮对话中维持上下文。原创 2025-03-31 09:45:11 · 22 阅读 · 0 评论 -
【人工智能】大模型的对话记忆Memory,旨在通过多种机制实现对话的连贯性、上下文理解及个性化交互,其核心在于有效管理短期和长期记忆,并结合外部存储与检索技术。
大模型对话记忆功能通过多层次的机制(缓存、摘要、结构化存储、外部系统)弥补了模型本身的无状态性,使其能够模拟人类短期与长期记忆,从而在对话中实现更自然、连贯且个性化的交互。开发者可根据具体需求灵活组合这些技术,构建智能化的对话系统。原创 2025-03-31 09:39:25 · 112 阅读 · 0 评论 -
【异常】AbstractMethodError: Receiver class com.alibaba.cloud.ai.dashscope.metadata.DashScopeAiUsage
确认 Alibaba 库是否已适配最新 Spring AI 接口。例如, 的问题可能与多模态模型返回的。有关,但此处更关键的是接口实现缺失。原创 2025-03-31 09:37:04 · 12 阅读 · 0 评论 -
【异常】【人工智能】SpringAI调用百炼大模型提示I/O error on POST request for “https://dashscope.aliyuncs.com/compatible
请求超时,您可尝试再次发起请求,可能是因为输出内容很长导致超时。您可尝试采用流式输出方式发起请求,具体操作请参见流式输出。原创 2025-03-28 17:42:32 · 123 阅读 · 0 评论 -
【人工智能】实现Prompt中的强调功能
要实现Prompt中的强调功能,可以综合以下策略和技巧,通过组合使用位置优化、符号标记、词汇强化和结构化表达,可以系统性提升Prompt中的强调效果。实际应用中建议通过A/B测试(生成结果对比)持续优化。原创 2025-03-28 15:36:19 · 76 阅读 · 0 评论 -
【人工智能】大模型的对话记忆机制是指其在多轮对话中追踪、理解并利用历史上下文的能力,以保持对话的连贯性和上下文相关性。
大模型的对话记忆机制是指其在多轮对话中追踪、理解并利用历史上下文的能力,以保持对话的连贯性和上下文相关性。大模型的对话记忆通过短期上下文窗口与长期存储/摘要机制结合实现,技术工具(如LangChain)进一步简化了开发复杂度。然而,其本质仍是外部驱动的“伪记忆”,未来需在长上下文建模、高效检索算法及自适应记忆策略上持续突破,以支持更自然的持续交互。原创 2025-03-26 04:13:03 · 32 阅读 · 0 评论 -
【项目实战】GPT是由OpenAI开发的一系列基于Transformer架构的自然语言处理模型,通过预训练和微调实现文本生成与理解
GPT(Generative Pre-trained Transformer)是由OpenAI开发的一系列基于Transformer架构的自然语言处理模型,通过预训练和微调实现文本生成与理解。原创 2025-03-21 15:21:58 · 23 阅读 · 0 评论 -
【人工智能】RNN(循环神经网络),是一种专门处理序列数据的神经网络模型,其核心特点是通过循环连接传递历史信息,实现对时间依赖性的建模。
循环神经网络(RNN)是一种专门处理序列数据的神经网络模型,其核心特点是通过循环连接传递历史信息,实现对时间依赖性的建模。RNN通过循环连接实现对序列数据的时序建模,但其梯度消失问题限制了长序列处理能力。LSTM和GRU通过门控机制有效缓解了这一缺陷,成为当前主流的循环模型。未来,结合注意力机制与多模态技术将进一步扩展RNN的应用边界。原创 2025-03-20 14:28:10 · 36 阅读 · 0 评论 -
【人工智能】端到端解决方案、端到端流程、端到端大模型
什么叫端到端解决方案1.在设计领域中,端到端解决方案指从需求发起,到需求满足的全程;2.在机器学习,端到端解决方案指使用者直接输入原始材料,直接得到可用的结果;3.在通信工程中,端到端解决方案指从某个“端”到另一个“端”。如何创造好的用户体验?端到端的解决方案从用户需求发起到被满足的过程,由我们来提供满足客户的方案。原创 2025-03-20 11:26:55 · 33 阅读 · 0 评论 -
【人工智能】Claude是由人工智能公司Anthropic开发的多功能AI助手
值得注意的时间节点包括:2023年6月学术场景功能验证,2024年欧洲市场拓展,以及2025年隐私优先架构升级。这些发展轨迹显示Anthropic持续强化Claude的实用性和安全性,使其成为ChatGPT的重要竞争者。原创 2025-03-20 11:21:54 · 18 阅读 · 0 评论 -
【人工智能】OneAPI,一个开源的API管理和分发系统,旨在统一不同大语言模型的接口调用,简化开发者集成和使用多种AI模型的流程。
通过将不同厂商的API(如讯飞星火、智谱ChatGLM、阿里通义千问等)转换为标准的OpenAI API格式,开发者只需遵循一套协议即可调用所有支持的模型。OneAPI是一个开源的API管理和分发系统,旨在统一不同大语言模型的接口调用,简化开发者集成和使用多种AI模型的流程。其适用于教育研究(模型对比)、企业级AI服务(负载均衡)、个人开发(简化多平台适配)等场景。支持超过30种主流模型,涵盖OpenAI、Anthropic、Google、百度、阿里、讯飞、智谱等厂商,并能根据请求中的。原创 2025-03-19 09:41:56 · 31 阅读 · 0 评论 -
【人工智能】NewAPI,基于One API二次开发的开源项目,主要作为大模型网关和AI资产管理系统
NewAPI是基于One API二次开发的开源项目,主要作为大模型网关和AI资产管理系统,NewAPI通过二次开发扩展了One API的网关功能,并强化了商业化与资产管理能力,适用于需统一管理多模型接口且涉及付费场景的个人或企业用户。原创 2025-03-19 09:40:57 · 27 阅读 · 0 评论 -
【人工智能】CNN(卷积神经网络)
CNN通过模拟观察和结构化处理来理解图像,类似于我们通过看不同部分来理解一个完整画面的方式。原创 2025-03-18 14:18:56 · 22 阅读 · 0 评论 -
【人工智能】机器学习效果评估:欠拟合 (Under-fitting) / 最佳拟合 (Optimal-fitting) / 过拟合 (Over-fitting)
欠拟合 (Under-fitting):模型太简单,不能很好地捕捉数据中的模式。简单例子:用直线拟合“U”形数据。实际例子:房价预测中只用面积一个特征。最佳拟合 (Optimal-fitting):模型恰到好处,既能很好地拟合训练数据,也能对新数据有良好表现。简单例子:用合适的二次曲线拟合“U”形数据。实际例子:房价预测中使用了多个重要特征。过拟合 (Over-fitting):模型太复杂,过度记住了训练数据,无法泛化到新数据。简单例子。原创 2025-03-18 14:18:18 · 35 阅读 · 0 评论 -
【人工智能】传统编程指令 vs 机器学习
传统编程是一种通过明确的指令和规则来告诉计算机如何完成任务的编程方式。程序员需要详细地编写每一步操作的代码,计算机会严格按照这些指令执行。原创 2025-03-18 14:17:06 · 26 阅读 · 0 评论 -
【人工智能】自然语言(NL)= 自然语言处理(NLP)+自然语言理解(NLU)+自然语言生成(NLG)
自然语言处理(Natural Language Processing, NLP)是计算机科学和人工智能的一个子领域,致力于实现计算机对人类语言的理解、解读和生成。NLP涵盖了从文本处理到语音识别的广泛任务。原创 2025-03-18 14:16:37 · 26 阅读 · 0 评论 -
【人工智能】大模型的前后端开发Streamlit,一个开源的 Python 库,专门用于快速构建和部署数据科学、机器学习以及大语言模型(LLM)的交互式 Web 应用。
Streamlit 是一个开源的 Python 库,专门用于快速构建和部署数据科学、机器学习以及大语言模型(LLM)的交互式 Web 应用。Streamlit 凭借其低代码特性、丰富的组件库和便捷的部署能力,成为大模型应用开发的首选工具之一。无论是构建聊天界面、模型解释工具,还是快速部署原型,Streamlit 均能显著降低技术门槛,助力开发者高效展示和推广 AI 能力。原创 2025-03-18 14:15:46 · 30 阅读 · 0 评论 -
【人工智能】Window如何使用CMD或PowerShell运行命令,配置OpenAI API Key到环境变量
建议您把API Key配置到环境变量,从而避免在代码里显式地配置API Key,降低泄漏风险。如果您希望API Key环境变量在当前用户的所有新会话中生效,可以按如下操作。在Windows系统中,您可以使用CMD或PowerShell运行命令。#HK代理环境,不需要科学上网(价格便宜、有安全风险,适合个人开发调试)在新的CMD窗口运行以下命令,检查环境变量是否生效。添加永久性环境变量添加临时性环境变量。在CMD中运行以下命令。打开一个新的CMD窗口。原创 2025-03-18 14:07:54 · 79 阅读 · 0 评论 -
【人工智能】大模型开发过程中的常用框架LangChain,是一个专为大型语言模型(LLM)设计的开源框架,旨在简化基于 LLM 的应用程序开发流程,支持从模型集成到部署的全生命周期管理。
LangChain 是一个专为大型语言模型(LLM)设计的开源框架,旨在简化基于 LLM 的应用程序开发流程,支持从模型集成到部署的全生命周期管理。LangChain 通过模块化设计降低了 LLM 应用的开发门槛,其链式架构和丰富工具链(如 RAG、代理)使其成为构建复杂 AI 系统的理想选择。初学者可从安装和简单链入手,逐步探索高级功能如内存管理和代理决策。“LangChain” 是指一个用于构建基于大语言模型的应用程序的框架。原创 2025-03-18 13:57:45 · 21 阅读 · 0 评论 -
【异常】ResourceAccessException: I/O error on POST request for ““: timeout] with root cause java.net.
不足以等待服务端完成响应。例如,服务端处理生成文本的时间较长,而客户端默认超时时间较短(如几秒),从而触发。)之间的网络不稳定,或存在防火墙、代理等中间设备拦截请求,导致连接无法建立或响应延迟。阿里云DashScope服务端可能因高负载或资源限制,未能及时处理请求,导致响应超时。OkHttp或RestTemplate等HTTP客户端配置的读取超时时间(虽然可能性较低,但若本地DNS无法正确解析。域名,也可能导致连接超时。客户端与目标服务端(若使用Spring的。原创 2025-03-17 09:44:46 · 389 阅读 · 0 评论 -
【人工智能】OpenAI提示{“error“{“message“:“gate way error...“,“type“:“openai_hk_error“,“code“:“gate_way_error
与目标服务通信失败引发。建议优先检查网络连通性和超时配置,其次验证依赖与序列化设置。通过分步调试和增强异常处理,可以更高效地定位问题。表明在与目标服务(例如OpenAI的API网关)通信时出现网络层问题,可能是连接超时、DNS解析失败或防火墙限制。如果是微服务架构(参考),确保服务注册与发现(如Eureka)配置正确,且目标服务(如。对应的服务未启动,或端口被占用,导致连接被拒绝。对象)未正确序列化为JSON,或缺少。这可以避免因网络延迟导致的超时错误。,会导致请求体解析失败。服务)已注册到注册中心。原创 2025-03-16 11:10:06 · 87 阅读 · 0 评论 -
【异常】OpenAI提示内容有误 Invalid prompt: your prompt was flagged as potentially violating our usage policy.
用户需优先调整提示内容,确保符合OpenAI的使用政策。若问题持续,建议结合请求ID和具体代码示例联系官方支持。同时,可参考腾讯云、Microsoft Q&A等平台提供的错误处理实践(如重试机制、日志记录)优化代码健壮性。原创 2025-03-16 10:57:30 · 18 阅读 · 0 评论 -
【人工智能】SpringAI如何查看发给大模型的prompt入参
在SpringAI框架中,查看发送给大模型的prompt入参可以通过以下方式实现,建议结合官方文档()和代码调试工具,根据具体模型实现进行验证。原创 2025-03-16 10:56:44 · 22 阅读 · 0 评论 -
【车联网】芯片算力单位TOPS(Tera Operations Per Second)是衡量芯片计算能力的重要指标,表示每秒可以执行的万亿次操作,主要用于描述处理器或芯片在人工智能领域的计算能力
芯片算力单位TOPS(Tera Operations Per Second)是衡量芯片计算能力的重要指标,表示每秒可以执行的万亿次操作。TOPS主要用于描述处理器或芯片在人工智能领域的计算能力,尤其是在深度学习和神经网络模型推理中的表现。TOPS是衡量芯片计算能力的重要单位,尤其在人工智能领域具有广泛的应用。随着技术的发展,TOPS将继续作为评估芯片性能的关键指标之一。原创 2025-03-10 10:11:13 · 276 阅读 · 0 评论 -
【人工智能】跃问AI是由阶跃星辰(StepFun)开发的多模态智能聊天机器人,基于自研的Step系列千亿参数大模型(包括Step-1语言模型和Step-1V多模态模型)
跃问AI是由阶跃星辰(StepFun)开发的多模态智能聊天机器人,基于自研的Step系列千亿参数大模型(包括Step-1语言模型和Step-1V多模态模型),在信息处理、多模态交互和专业领域应用中表现出色。跃问AI凭借强大的多模态处理能力和垂直场景适配,已成为个人学习、企业服务的智能助手,未来随着技术迭代和生态合作扩展,其应用潜力将进一步释放。原创 2025-03-10 09:40:59 · 222 阅读 · 0 评论 -
【人工智能】NVIDIA GeForce RTX 4090芯片,凭借顶尖性能成为AI与高性能计算的关键硬件,但受地缘政治影响,其市场供应与价格波动显著。
听说大模型对GPU要求高,一般是A100才能满足要求,我想知道我们这边是直接用预训练好的大模型对吧?然后做了模型为微调的对吗?我们是否需要去考虑GPU的成本问题?4090,因此A100、H100买不到了;一般直接用预训练模型,有特殊需求可以微调;不清楚,RTX 4090凭借顶尖性能成为AI与高性能计算的关键硬件,但受地缘政治影响,其市场供应与价格波动显著。未来需关注替代方案(如4090 D)及国产芯片的发展。原创 2025-03-10 09:39:10 · 322 阅读 · 0 评论 -
【人工智能】Maas(模型即服务)(Model as a Service)是一种基于云计算的商业模式,通过API将预训练的人工智能模型作为服务提供给用户,使其无需自行管理底层基础设施即可调用AI能力。
Model as a Service(模型即服务,MaaS)是一种基于云计算的商业模式,通过API将预训练的人工智能模型作为服务提供给用户,使其无需自行管理底层基础设施即可调用AI能力。MaaS通过云原生架构和标准化服务,正在重塑AI技术的开发和消费方式,推动人工智能从“技术专有”向“普惠工具”转变。原创 2025-03-10 09:39:00 · 43 阅读 · 0 评论 -
【人工智能】要提高DeepSeek R1的输出速度,可以从硬件配置、模型优化、部署策略及使用技巧等多方面入手
要提高DeepSeek R1的输出速度,可以从硬件配置、模型优化、部署策略及使用技巧等多方面入手,通过如下方法,可显著提升DeepSeek R1的输出速度。例如,结合高性能GPU、量化推理和动态批处理,本地部署的吞吐量可提升30%以上;云端API调用则能绕过硬件限制,实现接近20~22 tps的平均输出速率。实际优化时需根据任务类型(如代码生成需更高计算资源)和部署环境灵活调整策略。原创 2025-03-10 09:37:22 · 43 阅读 · 0 评论 -
【人工智能】GPT-4V(多模态版本)是OpenAI推出的视觉增强型多模态大模型,基于GPT-4架构扩展了图像、语音等多模态处理能力。
GPT-4V(多模态版本)是OpenAI推出的视觉增强型多模态大模型,基于GPT-4架构扩展了图像、语音等多模态处理能力。以下是其核心特点和应用分析,GPT-4V标志着多模态通用智能的重要突破,但其大规模应用仍需解决技术可靠性、伦理规范及跨模态数据融合等挑战。原创 2025-03-09 10:46:26 · 34 阅读 · 0 评论 -
【人工智能】OpenAI对其API的JSON支持主要通过结构化输出(Structured Outputs)功能实现,确保模型生成的JSON响应完全符合开发者预定义的Schema,准确率高达100%
截至2025年3月,OpenAI对其API的JSON支持主要通过功能实现,该功能确保模型生成的JSON响应完全符合开发者预定义的Schema,准确率高达100%。OpenAI的JSON支持通过结构化输出功能实现了工业级的精准度,显著提升了开发效率和数据可靠性。开发者可通过官方SDK或API参数轻松集成,适用于从数据分析到自动化系统的广泛场景。建议参考获取最新实现细节。原创 2025-03-09 10:36:49 · 27 阅读 · 0 评论 -
【人工智能】Spring AI项目在定义 `response_format` 的 Invalid schema for response_format ‘custom_schema‘
确保。原创 2025-03-09 10:08:34 · 16 阅读 · 0 评论 -
【人工智能】Manus是由中国团队Monica.im研发的全球首款通用型AI智能体(Agent),其核心功能是**独立执行复杂任务并直接交付成果**,而非仅提供建议。
Manus是由中国团队Monica.im研发的全球首款通用型AI智能体(Agent),其核心功能是,而非仅提供建议。原创 2025-03-09 10:06:13 · 74 阅读 · 0 评论 -
【人工智能】跃问AI是由阶跃星辰(StepFun)开发的多模态智能聊天机器人,基于自研的Step系列千亿参数大模型(包括Step-1语言模型和Step-1V多模态模型)。
跃问AI是由阶跃星辰(StepFun)开发的多模态智能聊天机器人,基于自研的Step系列千亿参数大模型(包括Step-1语言模型和Step-1V多模态模型),在信息处理、多模态交互和专业领域应用中表现出色。跃问AI凭借强大的多模态处理能力和垂直场景适配,已成为个人学习、企业服务的智能助手,未来随着技术迭代和生态合作扩展,其应用潜力将进一步释放。原创 2025-03-09 10:05:50 · 102 阅读 · 0 评论 -
【人工智能】在代码改写任务中,推荐以下大模型及其技术特点(按优先级排序)
以上推荐基于模型性能、应用场景和生态支持综合评估,实际选择需结合具体需求(如语言、算力、合规性)。原创 2025-03-09 10:04:34 · 23 阅读 · 0 评论