自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 前端安全攻防:XSS, CSRF 等常见威胁的防范与检测指南

原理: 服务器在用户登录时,在 Set-Cookie 响应头中发送一个 CSRF Token(可以与同步 Token 模式的 Token 相同),这个 Token 不保存在 Session 中(或与 Session Token 无关,但仍需动态生成、不可预测)。原理: 服务器生成一个唯一的、一次性的、与用户会话绑定的 Token,并通过表单中的隐藏字段 <input type="hidden" name="csrf_token" value="..."> 或在 AJAX 请求的响应头中发送给客户端。

2025-09-09 16:55:30 817

原创 WebAssembly:开启高性能 Web 应用的新篇章

在互联网技术飞速发展的浪潮中,Web应用的性能一直是一个重要的优化目标。Emscripten: 一个C/C++到WebAssembly的编译工具链,可以将C/C++代码编译成Wasm,并生成JavaScript胶水代码(glue code),使Wasm模块能够与JavaScript互操作。Rustc + wasm-pack: Rust语言官方支持WebAssembly,通过rustc编译器可以生成Wasm目标,wasm-pack工具则可以打包Rust生成的Wasm模块,并生成JavaScript绑定。

2025-09-08 16:58:15 855

原创 Nginx 高性能调优指南:从配置到原理

(指定 DNS 解析器)

2025-09-05 17:48:55 944

原创 Spring Boot 源码深度解析:揭秘自动化配置的魔法

这正是“按需配置”的体现。例如,引入spring-boot-starter-web,classpath 中会有 javax.servlet.Servlet、org.springframework.web.servlet.DispatcherServlet 等类,WebMvcAutoConfiguration 就会被加载。

2025-09-05 17:48:00 567

原创 Agent Prompt工程:如何让智能体更“听话”?(实践指南)

随着大型语言模型(LLMs)能力的飞速发展,它们不再仅仅是简单的文本生成器,而是可以被赋予“智能体”(Agent)的能力,具备规划、工具调用、记忆、自主学习等复杂行为。* **Vector Databases:** 将重要的信息(如关键决策、用户偏好、知识片段)嵌入(Embed)后存入向量数据库,通过相似性搜索检索相关信息,再加入Prompt。示例: "请以JSON格式输出,包含"thought", "action", "action_input", "observation" 字段。

2025-09-04 18:27:46 576

原创 大模型工程化:解决实际部署中遇到的挑战与解决方案(含代码)

这其中涉及的挑战远不止模型本身的性能,还包括部署效率、资源利用、成本控制、稳定性、可维护性以及可扩展性等一系列复杂问题。大模型工程化是一个系统工程,需要将模型、推理引擎、API服务、容器化、基础设施、监控报警和安全能力融为一体。FastAPI作为代理(可选): 如果需要在vLLM API之上添加额外的逻辑(如身份验证、限流、日志更丰富),可以在FastAPI中写一个简单的代理,转发请求到vLLM的8000端口。我们将深入探讨模型优化、高效推理服务、弹性伸缩、版本管理、监控与日志以及安全性等关键工程实践。

2025-09-04 18:27:05 907

原创 AI+法律:用ERNIE-Bot解析合同条款,识别风险点

近年来,人工智能(AI)在法律领域的应用逐渐成为热点,尤其是大型语言模型(LLMs)在文本理解和信息提取方面的强大能力,为合同审查带来了新的可能性。本文将探讨如何利用ERNIE-Bot来解析合同条款,识别其中的风险点,并提供相关的代码示例,展示AI在法律领域的实际应用潜力。随着技术的不断进步,我们有理由相信,AI将在未来的法律实践中扮演越来越重要的角色。对法律的“理解”是统计性的: LLM并非真正的法律专家,它的理解基于训练数据中的模式,而非深刻的法律逻辑推理。但若逾期超过三十日,甲方有权解除合同。

2025-09-03 17:26:51 406

原创 RAG实战:解锁企业知识,用LangChain + Pinecone 构建智能问答系统

RAG 的核心思想是:在 LLM 生成答案之前,先从知识库中检索出与用户问题最相关的上下文信息,然后将这些信息与用户问题一起作为 Prompt 输入给 LLM,从而确保 LLM 的回答基于可靠的、最新的企业内部知识。这些向量在多维空间中捕捉文本的语义信息,相似的文本具有相近的向量。Pinecone: 作为一家领先的托管式向量数据库服务商,Pinecone 提供了高性能、高可用、可大规模扩展的解决方案,能够高效地存储和检索海量企业知识的向量表示,非常适合满足企业级应用对性能、易用性和管理的需求。

2025-09-03 17:26:14 716

原创 AI代码生成神器终极对决:CodeLlama vs StarCoder vs Codex,谁才是开发者的「最佳拍档」?

微调友好:提供「StarCoder Base」模型(未针对特定任务优化,适合微调)和「StarCoder Plus」(已优化代码生成),Hugging Face的 peft 库支持低秩自适应(LoRA)微调,用消费级GPU(如RTX 3090)即可微调13B模型,适配团队代码风格(如强制变量命名为 snake_case、要求函数必须有文档字符串);CodeLlama和StarCoder是「纯代码专精模型」,而Codex(及后续GPT-4代码能力)更像「通用智能的代码分支」,底层设计差异直接影响编码表现。

2025-09-02 17:53:23 1100

原创 AI 代码生成神器对比:CodeLlama vs StarCoder vs Codex,谁更懂开发者?

无论是追求与特定生态的契合,还是看重开源灵活性,亦或是依赖便捷的 API 调用,都能在这三款神器中找到适合自己的工具,借助 AI 代码生成技术,开启高效编程的新篇章。假设存在一个复杂的项目代码,其中包含多个函数之间的嵌套调用和复杂的数据结构操作,StarCoder 能够从整体上理解代码的功能,从而生成连贯且符合逻辑的代码片段。无论是在日常的代码编写中,还是在复杂项目的开发过程中,AI 代码生成工具都将成为开发者的得力助手,让编程变得更加轻松、高效,开启软件开发的新纪元。

2025-09-02 17:52:33 725

原创 ChatGLM-6B全流程部署:环境搭建→模型加载→API调用(附避坑指南)

在动辄需要数百GB显存的大语言模型时代,ChatGLM-6B如同一股清流——这个由清华大学开源的对话模型,仅需13GB显存(INT4量化后仅需6GB)即可运行,让普通开发者和研究者都能在消费级显卡上体验大语言模型的魅力。本文将带你完成从零开始的ChatGLM-6B全流程部署,无论你是想搭建企业内部问答系统,还是希望学习大模型部署技术,这篇指南都能为你提供清晰的路径和实用的解决方案。max_length = gr.Slider(128, 2048, value=1024, label="生成长度")

2025-09-01 16:53:10 756

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除