自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 N-Gram Index使用技巧:如何选gram_size和bloom_size?

N-Gram Index 是一种基于字符串切分的倒排索引结构,主要用于模糊匹配、全文检索以及自动补全等场景。这项技术常应用于类似 Elasticsearch 这样的文本搜索引擎,或 AI 数据检索场景中。其基本原理是将字符串按照长度为 n 的滑动窗口进行切分,得到多个子串,其中 n 被称为 gram。举个例子,比如对字符串 "hello" 进行切分(假设 n=2),则会得到 "he"、"el"、"ll" 和 "lo" 这几个子串。N-Gram 的基本使用流程是:在插入数据时,将目标列按 n 进行切分;

2025-06-23 04:13:51 756

原创 实战教程:在NGINX中配置OpenTelemetry进行链路追踪!

本文提供了分步指南,介绍了如何在 NGINX Plus 中配置 OpenTelemetry,以及如何使用 Jaeger 工具收集和可视化链路追踪数据。OpenTelemetry 是一套功能强大的工具,可提供有关请求路径的全面视图,包括延迟、请求详细信息及响应数据等有价值的信息。这对优化性能和发现潜在问题很有帮助。为了简单起见,我们将 OpenTelemetry 模块、应用及 Jaeger 部署在一个实例中,如下图所示。图 1:NGINX OpenTelemetry 架构概览。

2025-06-23 04:12:32 1141

原创 MySQL主从复制报错13146,如何快速定位与修复?

需要将数据反向同步到源端,在使用。

2025-06-23 04:07:27 620

原创 GPU INSTANCING在草渲染中的应用与优化!

本文主要讲的是程序化生成无限大的地图,并在上面长满草的故事。老规矩,Demo 先行:如果是电脑用户,可以使用 WSAD 或者方向键来控制小鸟移动,按住鼠标左键并移动来控制视角方向。如果使用的是移动设备,可以点击屏幕并滑动来进行操作。本文接下来会从三部分进行说明。

2025-06-23 04:05:59 933

原创 SpreadJS实现分权限管理:核心API与技巧!

SpreadJS 是一款类 Excel 的前端表格控件,它的操作及功能与 Excel 高度类似,但又完全脱离对 Office 的依赖。将 SpreadJS 集成到前端项目并部署发布后,用户只需在 PC 上安装满足 H5 标准的浏览器(如 Chrome、Firefox、Edge 等),即可在浏览器端打开使用,这为前端开发提供了极大的便利。

2025-06-23 04:03:31 586

原创 深度剖析:Lustre和JuiceFS文件分布机制有何不同?

在 AI 模型训练、高性能计算等对 I/O 敏感的场景中,底层文件系统的架构和性能将直接影响训练效率、资源利用率与整体成本。Lustre 作为传统高性能文件系统,以极致性能著称;而 JuiceFS 则以云原生设计和对象存储集成为核心,提供更高的部署灵活性与经济性。为了帮助用户深入理解这两类系统在架构实现、性能优化和运维复杂度上的差异,我们撰写了这篇对比文章,供技术选型时参考。

2025-06-23 04:01:07 882

原创 网易云信未来规划:Doris还有哪些应用潜力?

导读:网易云信引入 Apache Doris 统一了原有 Elasticsearch、InfluxDB 和 Hive 多技术栈系统。凭借其高性能和易扩展的特点,提供一站式的数据存储和分析服务。实现机器成本降低 70%、实时场景查询提速 11 倍、离线任务耗时缩短 80% 的显著收益。网易云信是网易旗下 ToB 的通信与视频云服务品牌,依托网易 20 多年的技术沉淀,为企业和开发者提供稳定、安全、高效的通信与视频云服务,包含 IM 即时通讯、视频云、短信、轻舟微服务、中间件 PaaS 等。

2025-06-23 03:58:40 860

原创 优化Spring Boot启动耗时,这些关键点不可忽视!

随着业务的发展,笔者项目对应的 Spring Boot 工程的依赖越来越多。随着依赖数量的增长,Spring 容器需要加载更多组件、解析复杂依赖并执行自动装配,导致项目启动时间显著增长。在日常开发或测试过程中,一旦因为配置变更或者其他热部署不生效的变更时,项目重启就需要等待很长的时间影响代码的交付。加快 Spring 项目的启动可以更好的投入项目中,提升开发效率。整体环境介绍:Spring 版本:4.3.22Spring Boot 版本:1.5.19内存:24GB优化前启动耗时:280 秒。

2025-06-23 03:54:59 2141

原创 频繁覆盖写日志文件会带来哪些隐患?如何改进?

观察系统的运行状态,排查疑难问题,日志作为一种历史悠久的可观测手段,始终扮演着不可替代的角色。科学的本地日志管理策略,不仅能在本地保留更完整历史记录,最小化性能开销,并且能为日志采集和后续分析提供便利。然而在实际运维中,我们时常遇到反例,这类管理缺陷带来的采集现在对于主流采集工具(LoongCollector(原 iLogtail)、Filebeat、Fluentbit、Vector、OpenTelemetry Collector)均无法完美解决,唯有从源头解决才是最佳实践。

2025-06-23 03:53:24 2082

原创 禅道BI怎样唤醒沉睡数据,驱动项目管理升级?

在当今数字化浪潮中,BI 工具逐渐走进企业的视野,但关于它的误解却屡见不鲜。有人将它视为 “花瓶”,认为只是个看起来高大上的数字化大屏,花里胡哨却无实际用途,老板不看,员工也走形式;还有人把它当作 “报表生成器”,仅能从数据仓库生成明细报表。然而,BI 真正的价值远不止表面的炫酷展示和简单报表生成,它是一种将企业各类数据转化为有价值信息和决策依据的战略工具。今天,我们就通过禅道的 BI 功能,挖掘它在项目管理中的独特魅力。

2025-06-23 03:52:15 952 1

原创 优化多模态RAG效果:有哪些实用技巧与策略?

这样的多模态大模型,图片中的关键信息(标题、数据、趋势等)可被自动提取,并生成相关问题与答案,帮助系统理解图像内容、补足文档信息。比如看图秒懂论文结论,不再靠猜。:以 OFA、VL-T5、Flamingo 等为代表,强调跨模态生成,如图像描述、视觉问答等。:将非文本模态的向量,对齐到文本 embedding 的语义空间,解决 “语义壁垒” 问题。用于对不同模态的数据(文本、图像、音频等)进行编码,以便统一表示并用于检索和生成。:将不同模态的数据(如图像、音频、视频、文本)转为向量表示(embedding)

2025-06-23 03:50:30 1007

原创 Fraudar算法在电商刷单检测中有哪些突出优势?

在风控反作弊的业务中,我们落地了 LPA、Fraudar、GCN 等算法并取得了良好的效果,未来我们希望做的更多。1. 多模态数据融合:从单一图谱到全域关联未来风控需整合图数据、时序数据(如交易频率)、文本数据(如聊天记录)等多模态信息。例如,通过图嵌入技术将设备、IP、地理位置等实体统一表征,构建全域风险画像。2. 动态图实时计算:应对黑产快速演化当前黑产通过 “少边构造”(刻意断开部分关联)绕过静态图检测,需引入动态图算法(如时序 GNN)实时捕捉行为演变,并结合增量计算优化性能。

2025-06-23 03:47:40 1060

原创 云上部署FC MCP Server挑战多?这些改造方案助你突破!

系列文章已详细介绍了 MCP 协议的基本概念及其在函数计算(FC)托管 MCP Server 场景下的应用。相信读者已经对 MCP 协议的原理和应用场景有了初步了解。但对于 AI 应用开发者来说,如何开发一个高效的 MCP Server?有哪些最佳实践?本文将结合实际案例,深入剖析 FC MCP Server 的设计与实现。

2025-06-23 03:46:13 774

原创 GraphRAG-Bench基准能否真正衡量模型推理新高度?

图检索增强生成(Graph Retrieval-Augmented Generation, GraphRAG)因其在结构化组织领域特定语料库并提升复杂推理能力的潜力,正日益受到认可。然而,当前 GraphRAG 模型的评估主要依赖传统的问答数据集。这些数据集在问题广度和评估指标上存在局限性,无法全面衡量 GraphRAG 模型所带来的推理能力提升。为弥补这一不足,我们提出了 GraphRAG-Bench,这是一个为严格评估 GraphRAG 模型而设计的大规模、领域特定基准。

2025-06-23 03:43:52 2039

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除