预研
文章平均质量分 90
技术预研
THS_Allen
技术引领业务创新
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Chiplet技术(存储与计算集成)介绍
Chiplet技术通过模块化设计打破"内存墙"瓶颈,实现存储与计算的高效集成。其核心原理是利用2.5D/3D先进封装技术将计算单元和存储单元紧密集成,通过硅中介层或垂直堆叠缩短数据传输距离,同时增加互连带宽。相比传统架构,Chiplet技术能提供数十倍的带宽提升,显著降低延迟和功耗。目前该技术已应用于高端GPU与HBM内存的集成,但面临设计复杂度高、散热困难等挑战。未来随着3D堆叠和异构集成技术的发展,Chiplet有望成为突破算力瓶颈的关键技术,为AI、高性能计算等领域提供强大硬件支持原创 2025-10-02 13:32:13 · 1271 阅读 · 0 评论 -
繁体字转换技术方案(THS)
本文档概述了系统简繁体转换方案,涵盖前端到后端的全面转换策略。主要内容包括:1)转换目标为全系统文本(静态/动态/交互数据)准确转换为台湾繁体,确保性能稳定;2)采用opencc-js(前端)和OpenCC4j(后端)实现转换,建立统一转换规则和缓存机制;3)制定详细测试计划(功能/性能/兼容性测试)及风险应对措施(错误词汇表、性能优化);4)实施步骤分环境配置、功能开发、多轮测试及客户验收阶段。重点保证转换准确性、系统性能及跨平台兼容性,特别针对金融专业术语建立专项处理机制。原创 2025-08-14 09:33:48 · 1419 阅读 · 0 评论 -
EdgeOne Pages MCP Server:从自然语言到线上页面的秒级闭环
腾讯云EdgeOne Pages MCP Server通过自然语言驱动和边缘计算协同,实现从自然语言到线上页面的秒级闭环。核心功能包括自然语言理解层解析用户指令为结构化任务,边缘计算调度层动态分配资源,以及自动化部署层实现HTML内容秒级分发。该系统支持多模态输入、流式响应和动态负载均衡,具备高性能和安全性优势。实测数据显示,从指令输入到公网可访问平均仅需58秒,相比传统方案具有显著优势。应用场景涵盖原型验证、教育演示和企业级应用,推动Web开发进入"意图编译"时代,使非技术人员也能快速原创 2025-08-06 12:45:51 · 1011 阅读 · 0 评论 -
腾讯云EdgeOnePages推出MCP Server:一句话生成并部署HTML页面
腾讯云推出EdgeOnePages前端开发平台及配套MCPServer服务,支持快速部署静态站点和无服务器应用。该平台具备全球加速、简化部署和边缘Serverless三大优势,支持Next.js、React等主流框架,通过GitHub集成实现自动化部署。MCPServer创新性地允许开发者用自然语言指令生成并部署页面,无需离开代码编辑器。该服务采用无服务器架构,结合KV存储实现秒级页面发布,显著降低技术门槛,现已突破本地环境限制,通过标准化接口服务更广泛的用户群体。原创 2025-08-06 12:42:12 · 875 阅读 · 0 评论 -
“可视化即服务(VaaS)”深度技术分析
摘要(150字): 本文深度解析可视化即服务(VaaS)的核心技术架构与行业应用。提出事件驱动的微服务架构,采用Delta State协议实现增量同步,网络负载降低92%。通过WASM渲染集群与分布式流水线设计,性能提升3倍。创新四层缓存体系实现毫秒级响应,GPU预处理使1亿数据点编码耗时降至0.8s。行业融合方面,工业场景优化时序数据库实现毫秒级写入,金融风控构建15ms低延迟闭环,医疗影像实现浏览器端3.2秒CT渲染。关键技术突破包括量子安全通信(仅0.3ms延迟损耗)和AI编译器(能耗降70%),证明原创 2025-08-04 18:29:39 · 1343 阅读 · 0 评论 -
DataFlow-启动libtiff和libjpeg符号版本不兼容的问题
摘要 该错误报告描述了PyMuPDF依赖库libtiff与libjpeg的版本冲突问题。错误表现为libtiff.so.6需要jpeg12_write_raw_data函数,但当前libjpeg.so.8中缺少该符号。文章分析了根本原因,包括符号版本冲突和依赖链问题,并提供了四种解决方案:强制安装兼容版本、使用conda统一管理依赖、重建链接和使用Docker容器。此外还给出了验证方法、备选源码编译方案以及关键预防措施,特别建议在Linux环境中优先考虑Docker方案。原创 2025-07-25 09:44:28 · 893 阅读 · 0 评论 -
精度压缩技术(如 FP16 → INT4)
深度学习模型的精度压缩技术(如FP16→INT4)通过降低参数和激活值的比特宽度,显著减少存储与计算资源消耗。主流方法包括训练后量化(PTQ)和量化感知训练(QAT),工具如TensorRT、GPTQ和AWQ实现高效压缩。INT4量化可节省87.5%显存并加速4-6倍,但不同任务精度损失差异较大(分类任务2-5%,生成任务5-15%)。实践需根据硬件选择方案(如A100支持INT4,边缘设备用INT8),并保护敏感层。前沿技术如1.58-bit的BitNet和2-bit的QLoRA进一步突破极限,但需平衡精原创 2025-07-15 12:26:27 · 1326 阅读 · 0 评论 -
量子语义框架(DisCoCat++)介绍
DisCoCat++是融合量子力学与语言学的语义计算框架,通过量子态编码词汇语义(如"银行"=金融态+河流态),利用张量积和幺正算子实现动态组合。其核心技术包括语境感知坍缩、非经典关联矩阵和硬件优化,解决了传统NLP的多义词消歧、长文本建模等痛点。实测显示在搜索引擎、工业诊断等场景性能提升显著,如广告转化率提高41%。该框架实现了语义理解的量子范式转变,从静态词向量升级为动态交互式认知模型。开发者可通过Python工具包快速接入,需注意用户数据隐私保护。原创 2025-07-15 12:24:00 · 708 阅读 · 0 评论 -
量子语义学
量子语义学原创 2025-07-15 12:21:49 · 887 阅读 · 0 评论 -
KenLM 高效 n-gram 语言模型库介绍及使用
KenLM 是一个高效开源 n-gram 语言模型库,提供 Python 接口 kenlm,广泛应用于 NLP 任务。支持源码编译(需 Boost 库)和 Python 安装,可加载二进制或文本模型。核心功能包括整句评分、细粒度得分分析和状态流评分,适用于文本纠错、语言模型训练等场景。通过比较候选句子的概率分数实现智能纠错(如 a/an 替换),并支持高阶 N-gram 和状态复用优化性能。最佳实践建议使用二进制模型加速加载,英文 2-gram、中文 3-gram 以上效果更佳。KenLM 以高效评分和灵活原创 2025-07-11 12:39:15 · 1222 阅读 · 0 评论 -
钉钉通过机器人发送卡片消息
本文介绍了钉钉企业机器人的创建与互动卡片应用开发流程:首先在开放平台创建应用并添加机器人能力,随后搭建互动卡片模板;接着详细说明了通过API推送互动卡片到群组或个人的方法,包括获取accessToken、创建群组等关键步骤;最后阐述了机器人消息监听机制,区分了单聊和群聊场景下的消息收发限制,并提及了医疗场景下的实际应用案例。整个过程涵盖了从创建到应用的企业机器人开发全流程。原创 2025-05-30 11:06:15 · 12862 阅读 · 0 评论 -
钉钉机器人发送卡片消息
钉钉开放平台提供了机器人发送互动卡片的API接口,开发者可通过获取企业accessToken后调用相关接口实现功能。关键注意事项包括:使用新参数时需生成新的outTrackId以确保更改生效,该ID作为卡片幂等标识可用于更新或群发同一卡片。同一cardBizId重复发送时将保持与原卡片数据一致。参考文档和demo代码可帮助开发者快速集成该功能。原创 2025-05-30 11:04:54 · 11897 阅读 · 0 评论 -
数据预处理组件、标注技术选型
开源数据预处理与标注工具对比分析 本文对比分析了两种数据预处理方案:基于Langflow的方案具有易用性优势,但存在任务调度、并发执行和资源管理不足的问题;Apache Airflow则提供了专业的工作流编排能力,适合技术人员使用。同时介绍了Label Studio标注工具及其与LangChain的集成方案。两种方案各具特点:Langflow适合快速开发,Airflow适合复杂流程管理。标注环节可采用Label Studio实现,并与LangChain生态结合。整体呈现了从数据预处理到标注的完整技术选型思路原创 2025-05-30 09:28:17 · 8999 阅读 · 0 评论 -
移动直播技术秒开优化
移动直播技术面临诸多挑战,包括音视频采集、编码、推流、分发等环节,以及网络不稳定、设备差异等问题。直播性能指标如延迟、卡顿和首屏耗时直接影响用户体验。为优化移动直播,需考虑不同芯片平台的编码差异、低端设备的性能限制、弱网环境下的推流稳定性等。此外,美颜滤镜处理、播放秒开和持续流畅播放也是关键技术点。通过优化播放器逻辑、提前DNS解析、动态调整码率等措施,可以提升直播质量和用户体验。移动直播技术的深入理解和应用,对于提供高质量直播服务至关重要。原创 2025-05-15 16:32:33 · 4683 阅读 · 0 评论 -
gh-ost ddl在线变更
gh-ost 作为一个伪装的备库,可以从主库/备库上拉取 binlog,过滤之后重新应用到主库上去,相当于主库上的增量操作通过 binlog 又应用回主库本身,不过是应用在幽灵表上。原创 2025-04-22 10:11:57 · 3255 阅读 · 0 评论 -
GraalVM新一代通用多语言高性能虚拟机
GraalVM是 Oracle 开源的一款通用虚拟机产品,官方称之为 Universal GraalVM,是新一代的通用多语言高性能虚拟机。原创 2025-04-22 10:07:16 · 3908 阅读 · 0 评论 -
WePush-消息批量推送
WePush-消息批量推送原创 2025-04-22 09:49:04 · 3037 阅读 · 0 评论 -
ModelEngine产品介绍
ModelEngine提供从数据处理、知识生成,到模型微调和部署,以及RAG(Retrieval Augmented Generation)应用开发的AI训推全流程工具链原创 2025-04-22 09:12:56 · 1186 阅读 · 0 评论 -
MCP详细介绍
1. MCP 架构设计剖析2. AI Agent 现状与架构3. AI 应用架构设计新范式4. MCP协议官网5. 开源mcp服务器实现的仓库6. 需要掌握的知识7. 通信机制原创 2025-04-22 09:11:01 · 1999 阅读 · 0 评论 -
DataEase
DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。原创 2025-04-18 10:06:29 · 5302 阅读 · 0 评论 -
Davinci
Davinci 是一个 DVaaS(Data Visualization as a Service)平台解决方案,面向业务人员/数据工程师/数据分析师/数据科学家,致力于提供一站式数据可视化解决方案。既可作为公有云/私有云独立部署使用,也可作为可视化插件集成到三方系统。用户只需在可视化 UI 上简单配置即可服务多种数据可视化应用,并支持高级交互/行业分析/模式探索/社交智能等可视化功能。原创 2025-04-18 10:03:19 · 5425 阅读 · 0 评论 -
Istio入门,原理,实战
微服务架构可谓是当前软件开发领域的技术热点,它在各种博客、社交媒体和会议演讲上的出镜率非常之高,无论是做基础架构还是做业务系统的工程师,对微服务都相当关注,而这个现象与热度到目前为止,已经持续了近 5 年之久。尤其是近些年来,微服务架构逐渐发展成熟,从最初的星星之火到现在的大规模的落地与实践,几乎已经成为分布式环境下的首选架构。微服务成为时下技术热点,大量互联网公司都在做微服务架构的落地和推广。同时,也有很多传统企业基于微服务和容器,在做互联网技术转型。翻译 2025-04-18 09:52:10 · 4630 阅读 · 0 评论 -
辅助诊疗产品及技术简介
各知名厂商辅助诊疗技术简介原创 2025-04-18 09:33:24 · 5256 阅读 · 0 评论 -
语音识别合成框架
语音识别:funasr,语音合成:微软Edge-TTS、FastSpeech2介绍原创 2025-04-18 09:17:53 · 5542 阅读 · 0 评论 -
ModelEngine介绍及使用场景
ModelEngine 是华为 DCS(Data Center Stack)全栈的 AI 训推全流程工具链。原创 2025-04-17 15:36:59 · 6860 阅读 · 0 评论 -
开源数字人方案
3D 虚拟人方案,支持语音驱动口型同步、面部表情控制。原创 2025-04-17 13:39:35 · 6887 阅读 · 0 评论 -
AI掘金-Python访问网页并获取标题
使用 Python 实现批量获取网页标题的代码,包含超时处理和异常捕获原创 2025-04-17 09:45:43 · 6916 阅读 · 0 评论 -
Sa-Token 一个轻量级 java 权限认证框架
Sa-Token是一个轻量级Java权限认证框架,主要解决:登录认证、权限认证、Session会话、单点登录、OAuth2.0、微服务网关鉴权 等一系列权限相关问题原创 2025-04-16 09:40:24 · 116665 阅读 · 0 评论 -
BM25算法
BM25(Best Matching 25)是一种用于信息检索的排名算法,广泛应用于搜索引擎和全文检索系统中。它是基于概率检索模型(Probabilistic Retrieval Model)的改进版本,能够有效地对文档与查询的相关性进行评分。原创 2025-04-16 09:20:29 · 115020 阅读 · 0 评论 -
鸿蒙开发详细指南
鸿蒙开发详细指南原创 2025-04-15 09:34:47 · 2928 阅读 · 0 评论 -
MyFlash-MySQL闪回恢复工具
MyFlash是由美团点评公司技术工程部开发维护的一个回滚DML操作的工具。该工具通过解析v4版本的binlog,完成回滚操作。相对已有的回滚工具,其增加了更多的过滤选项,让回滚更加容易。该工具已经在美团点评内部使用。原创 2025-04-15 09:15:18 · 81907 阅读 · 0 评论 -
MySQL跨实例进行数据查询
本篇文章介绍FEDERATED引擎的开启和使用。原创 2025-04-14 14:33:22 · 82243 阅读 · 0 评论 -
GBase 8s 产品功能与应用场景
GBase 8s 是一款支持共享存储集群、两地三中心部署的、成熟稳定的、具有TB数据支撑能力的国产事务型案例数据库。原创 2025-04-14 14:30:42 · 80966 阅读 · 0 评论 -
中文文本纠错
当然,针对不同业务场景,这些问题并不一定全部存在,比如拼音输入法、语音识别校对关注音似错误;五笔输入法、OCR校对关注形似错误, 搜索引擎/问答query纠错关注所有错误类型。依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。3.可以考虑在query改写的时候把纠错给做了。glm4 ds-r1(Q2)只需运行一次,后续会从本地缓存读取,不用重复下载。使用的天津A100环境,GPU显存80G。4.资源(下周)用在线不考虑资源。在加载模型的一瞬间会。原创 2025-04-09 10:41:26 · 80686 阅读 · 0 评论 -
JAP-登录中间件
JAP 针对用户、应用等业务数据,只提供标准的业务接口,不提供数据库层面的支持。JAP 要做的是为广大开发者提供一套技术标准,既然是标准,那就不能依赖于任何和具体业务相关的逻辑。JAP 对外提供标准接口,业务端只需要按需实现 JAP 的接口即可,这种设计能在最大程度上增加它的灵活性,使它不受限于某一具体的数据库实现方案。,基于模块化设计,并且与业务高度解耦,使用起来非常灵活,开发者可以毫不费力地将 JAP 集成到任何 web 应用程序中,就像集成 JA 一样,简单方便。原创 2025-04-09 10:44:46 · 80038 阅读 · 0 评论 -
大模型消息转发对接方案实现及压力测试
是一个专为Java开发者设计的开源库,旨在简化将大型语言模型(LLM)集成到Java应用程序中的过程。它于2023年初开发,灵感来源于Python和JavaScript的LLM库,特别是为了填补Java领域在这一方面的空白。在pom.xml/*** AI 助手接口*/声明成 Spring Bean, 注入模型@Bean.build();DeepSeek Java SDK - 简单易用的 DeepSeek API Java 客户端。原创 2025-04-09 09:59:48 · 80225 阅读 · 0 评论 -
RAGFlow + GraphRAG+ 知识图谱 + QwQ32B探索实践
RagFlow 是一款开源的 RAG(Retrieval-Augmented Generation)引擎,专注于深度文档理解,能够助力企业及个人构建高效的 RAG 工作流程。借助大语言模型(LLM),它可以精准处理各种复杂格式的数据,为用户提供可靠的问答服务,并附上详实的引用依据。原创 2025-04-09 09:53:46 · 80575 阅读 · 0 评论 -
DoKit-APP研发助手一站式解决方案
1、DoraemonKit 能够快速让你的业务测试代码能够在这里统一管理,统一收口;2、DoraemonKit 内置很多常用的工具,避免重复实现,一次接入,你将会拥有强大的工具集合;3、搭配dokit平台,借助接口Mock、健康体检、文件同步助手让你方便和他人协同,极大的提升研发过程中的效率。原创 2025-04-08 10:05:38 · 78928 阅读 · 0 评论 -
graph选型
图数据库选型原创 2025-04-03 09:11:07 · 78908 阅读 · 0 评论 -
模型上下文协议 (MCP)
模型上下文协议 (Model Context Protocol, MCP) 是一项由 Anthropic 于 2024 年底开源的新标准 。其主要目标在于标准化人工智能 (AI) 助手与实际存储数据的系统(包括内容存储库、业务工具和开发环境)之间的连接方式 。转载 2025-04-02 10:54:59 · 78576 阅读 · 0 评论
分享