
AI技术专栏
文章平均质量分 94
深入探讨人工智能、机器学习、深度学习等AI领域知识与技术,涵盖计算机视觉、自然语言处理(NLP)及大模型等多种任务。致力于为读者呈现一个多维度、全方位的人工智能知识技术专栏。
TechLead KrisChang
复旦博士,分享AI领域与云服务领域全维度开发技术。拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕博,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人
展开
-
如何构建大模型代理 LLM Agent?
LLM Agent是一个程序,其执行逻辑由底层模型控制。与少样本提示(few-shot prompting)或固定工作流等方法相比,LLM Agent的特别之处在于它能够定义并适应执行用户查询所需的步骤。借助一组工具(如代码执行或网络搜索)的支持,代理可以决定使用哪个工具、如何使用该工具,并根据输出结果进行迭代。这种适应性使得系统能够以最小的配置处理多种使用场景。原创 2025-01-20 16:56:08 · 999 阅读 · 4 评论 -
LLM2Vec: 解锁大语言模型的隐藏能力
一种名为 ** LLM2Vec ** 的新方法正在改变我们对大语言模型(LLMs)在自然语言处理(NLP)中的使用方式。研究人员提出了一种创新方法,将通常仅用于生成文本的大型语言模型转化为更强大的文本理解和组织工具。这项技术有可能颠覆我们处理各种与文本相关任务的方式,并减少对诸如BERT等旧有模型的依赖。原创 2025-01-02 10:14:29 · 947 阅读 · 10 评论 -
LightRAG - 更快更便宜的GraphRAG
LightRAG 的增量更新机制通过简单的 **联合操作(union operation)**,将新的图节点和边直接添加到现有图谱中。这种方式避免了重复构建图谱的高昂开销,同时确保知识库实时更新,适应动态数据需求。原创 2024-11-27 14:53:24 · 1205 阅读 · 16 评论 -
LlamaCoder:一款基于Llama 3.1 405B的全新开源AI编程助手
在过去的几个月中,AI驱动的编程助手领域发生了一些令人难以置信的发展。诸如Claude Artifacts、Claude Dev 和 Cursor AI 等工具,帮助数千名开发者甚至非开发者在几分钟内构建网络应用,无需编写一行代码。原创 2024-10-21 15:41:17 · 2347 阅读 · 18 评论 -
【论文速读】字节跳动音乐生成模型 Seed-Music
论文速读:https://arxiv.org/pdf/2409.09214 Seed-Music: A Unified Framework for High Quality and Controlled Music Generation原创 2024-10-15 10:54:55 · 891 阅读 · 18 评论 -
重磅发布:OpenAI o1全新推理模型系列
2024年9月12日,OpenAI正式推出全新的推理模型系列——OpenAI o1。这款全新AI模型系列专为解决复杂问题而设计,能够在响应前花费更多时间进行思考,并通过深入推理应对比以往模型更具挑战性的科学、编程和数学问题。原创 2024-09-20 17:40:25 · 1205 阅读 · 13 评论 -
为大模型提供服务需要多少 GPU 显存?
为大模型提供服务需要多少 GPU 显存?原创 2024-09-19 16:21:14 · 1143 阅读 · 12 评论 -
OpenAI o1模型揭秘:通过LLMs学习推理能力
OpenAI推出了o1,这是一种通过强化学习训练的大型语言模型,专门用于进行复杂的推理任务。原创 2024-09-18 08:42:09 · 830 阅读 · 14 评论 -
详解Diffusion扩散模型:理论、架构与实现
本文深入探讨了Diffusion扩散模型的概念、架构设计与算法实现,详细解析了模型的前向与逆向过程、编码器与解码器的设计、网络结构与训练过程,结合PyTorch代码示例,提供全面的技术指导。原创 2024-09-13 20:22:55 · 1456 阅读 · 19 评论 -
RAG技术架构与实现原理
本文详细解析了RAG技术,包括其定义、作用、技术架构和检索模块的实现与优化,全面展示了RAG在自然语言处理中的重要性和广泛应用前景。原创 2024-09-04 15:47:44 · 1771 阅读 · 19 评论 -
复旦大学王龑团队发布《静态与动态情感的面部表情识别》综述
复旦大学,王龑博士后领衔,发布《静态与动态情感的面部表情识别》(A Survey on Facial Expression Recognition of Static and Dynamic Emotions)综述,对基于图像的静态面部表情识别(SFER)和基于视频的动态面部表情识别(DFER)方法进行了全面综述,从模型导向的发展到挑战聚焦的分类进行了系统分析。原创 2024-09-03 10:21:28 · 1787 阅读 · 19 评论 -
为什么说RAG是AI 2.0时代的“杀手级”应用?
随着 AI 2.0 时代的来临,我们正站在一个技术革新和行业变革的交汇点。大语言模型虽然在多个领域取得了突破,但在特定领域的应用仍面临挑战。而 RAG 技术以其独特的能力,通过整合外部知识库与文档,显著提升了模型的专业性能和回答精度,成为大模型应用的重要技术方向。原创 2024-09-02 08:42:28 · 1169 阅读 · 17 评论 -
CUDA常见驱动程序兼容性问题一览
CUDA常见驱动程序兼容性问题一览原创 2024-08-12 10:17:06 · 1431 阅读 · 23 评论 -
CUDA常见编译器配置问题一览
CUDA常见编译器配置问题一览原创 2024-08-06 16:04:40 · 1041 阅读 · 24 评论 -
文档解析效果全维度测评标准
TextIn文档解析测评工具,全面评测文档解析产品能力原创 2024-07-23 10:03:59 · 1445 阅读 · 23 评论 -
半监督学习概念与算法精讲
本文详细介绍常见的半监督学习算法及其实现,包括图形半监督学习、自训练、一致性正则化和生成对抗网络(GANs),并通过代码实战展示其具体应用。原创 2024-07-17 10:04:54 · 1875 阅读 · 29 评论 -
强化学习详解:理论基础与核心算法解析
本文详细介绍了强化学习的基础知识和基本算法,包括动态规划、蒙特卡洛方法和时序差分学习,解析了其核心概念、算法步骤及实现细节。原创 2024-06-27 10:08:22 · 1941 阅读 · 25 评论 -
无监督学习:从理论到实践的全面指南
本文深入讲解了无监督学习中的K-means、层次聚类、密度聚类、PCA、t-SNE和自编码器算法,涵盖其原理、数学基础、实现步骤及应用实例,并提供了详细的代码示例。原创 2024-06-19 14:36:40 · 1724 阅读 · 22 评论 -
机器学习-监督学习6大核心算法技术精讲与代码实战
监督学习线性回归、逻辑回归、决策树、支持向量机、K近邻、朴素贝叶斯算法精讲,模型评估精讲原创 2024-06-12 09:30:00 · 1881 阅读 · 39 评论 -
全面盘点多模态融合算法及应用场景
多模态融合技术通过结合不同模态的数据提升信息处理能力。本文详细介绍了数据层、特征层和决策层融合方法,盘点了各类多模态融合算法及其应用场景。原创 2024-05-29 10:24:39 · 5306 阅读 · 18 评论 -
生成式AI核心技术详解与实战:从GANs到Transformers
本文深入探讨生成式AI的核心技术,包括GANs、VAEs、自回归模型和Transformers,详细描述其原理、实现方法及实际应用,结合代码示例和现实案例,展示最新技术进展和应用场景。原创 2024-05-21 09:30:00 · 2517 阅读 · 20 评论 -
大模型必备 - 中文最佳向量模型 acge_text_embedding
近期,上海合合信息科技股份有限公司发布的文本向量化模型 acge_text_embedding 在中文文本向量化领域取得了重大突破,荣获 Massive Text Embedding Benchmark (MTEB) 中文榜单(C-MTEB)第一名的成绩。这一成就标志着该模型将在大模型领域的应用中发挥更加迅速和广泛的影响。原创 2024-04-25 10:41:59 · 2090 阅读 · 45 评论 -
学生党狂欢,好用免费在线OCR识别工具TextIn Tools助你遥遥领先!
既好用又免费的在线OCR识别网站tools.textin.com,它不仅仅具有文字和表格识别工具,还包含PDF转文件等工具,一站式服务为你解决所有问题。原创 2024-04-19 16:26:59 · 1139 阅读 · 8 评论 -
国内首家!百度智能云宣布支持Llama3全系列训练推理
继18日Llama3的8B、70B大模型发布后,百度智能云千帆大模型平台19日宣布在国内首家推出针对Llama3全系列版本的训练推理方案,便于开发者进行再训练,搭建专属大模型,现已开放邀约测试。目前,百度智能云千帆大模型平台中各种尺寸模型定制工具ModelBuilder已预置了最全面最丰富的大模型,支持国内外第三方主流模型,总数量达到79个,是国内拥有大模型数量最多的开发平台。原创 2024-04-19 14:25:59 · 364 阅读 · 1 评论 -
【Textin.com】智能文档处理系列 - 电子文档解析技术全格式解析
电子文档解析技术的核心目的是从各种格式的电子文档中提取结构化数据和有意义的信息。这一过程涉及到理解文档的格式、内容、结构和语义,是连接文档内容与应用程序、数据库和其他信息系统的桥梁。原创 2024-04-16 15:16:38 · 1575 阅读 · 35 评论 -
实体抽取全解析:技术与实战
深入探讨实体抽取技术的各个方面,从基于规则的方法到先进的基于神经网络的深度学习方法,提供了一系列详细的技术介绍和实战案例。原创 2024-04-12 09:56:28 · 4970 阅读 · 33 评论 -
知识推理技术解析与实战
本文提供深入的知识推理技术解析,从基础理论、核心技术到高级应用等方面进行全面覆盖。通过结合理论讨论和实践代码示例,本文不仅回顾了知识推理的发展历程,还深入探讨了当前的技术挑战和未来的发展方向。原创 2024-04-08 10:15:27 · 1801 阅读 · 39 评论 -
知识融合:知识图谱构建的关键技术
本文全面探讨了知识图谱中的知识融合技术,包括基础理论、核心问题、以及基于规则、机器学习和深度学习的融合方法。通过详细的技术分析和代码示例,为专业研究人员提供了深入的技术见解和实践指南。原创 2024-04-03 12:06:02 · 4031 阅读 · 44 评论 -
知识图谱构建三要素:实体、关系与属性技术与实战全解析
本文全面深入探讨了知识图谱中的核心要素——实体、关系和属性。通过详细阐释每个要素的理论基础、技术实现及实际应用案例,文章揭示了它们在构建高质量知识图谱中的关键作用和技术价值。原创 2024-03-29 14:34:01 · 10556 阅读 · 42 评论 -
智能文档处理技术综述
智能文档处理(IntelligentDocumentProcessing,IDP)是利用人工智能(AI)、机器学习(ML)、计算机视觉(CV)、自然语言处理(NLP)等技术自动化地捕获、理解、处理和分析文档内容的过程。不同于传统的文档管理系统,IDP能够处理结构化、半结构化和非结构化的文档,从而提取有用信息并将其转换为可操作的数据。原创 2024-03-27 14:20:39 · 1840 阅读 · 31 评论 -
编织人工智能:机器学习发展历史与关键技术全解析
关注TechLead,分享AI领域与云服务领域全维度开发技术。本文全面回顾了机器学习的发展历史,从早期的基本算法到当代的深度学习模型,再到未来的可解释AI和伦理考虑。文章深入探讨了各个时期的关键技术和理念,揭示了机器学习在不同领域的广泛应用和潜力。原创 2023-08-07 08:39:55 · 4683 阅读 · 87 评论 -
计算机视觉五大核心研究任务全解:分类识别、检测分割、人体分析、三维视觉、视频分析
本篇文章深入探讨了计算视觉的定义和主要任务。内容涵盖了图像分类与识别、物体检测与分割、人体分析、三维计算机视觉、视频理解与分析等技术,最后展示了无监督学习与自监督学习在计算机视觉中的应用。原创 2023-08-16 17:16:54 · 7028 阅读 · 106 评论 -
一文详解自然语言处理两大任务与代码实战:NLU与NLG
自然语言处理(NLP)涵盖了从基础理论到实际应用的广泛领域,本文深入探讨了NLP的关键概念,包括词向量、文本预处理、自然语言理解与生成、统计与规则驱动方法等,为读者提供了全面而深入的视角。原创 2023-08-11 10:00:08 · 1276 阅读 · 68 评论 -
为什么Python是数据科学家的首选语言
这篇文章全面探讨了Python作为数据科学领域首选语言的原因。从Python的历史、特性,到在数据科学中的应用实例,再到与其他数据科学语言的比较,以及在实际企业中的应用,我们深入剖析了Python的优势与挑战,最后对Python的未来进行了展望。原创 2023-07-25 17:46:53 · 160 阅读 · 3 评论 -
OpenCV实战:从图像处理到深度学习的全面指南
本文深入浅出地探讨了OpenCV库在图像处理和深度学习中的应用。从基本概念和操作,到复杂的图像变换和深度学习模型的使用,文章以详尽的代码和解释,带领大家步入OpenCV的实战世界。原创 2023-08-02 10:20:08 · 3556 阅读 · 172 评论 -
Pytorch 最全入门介绍,Pytorch入门看这一篇就够了
本文通过详细且实践性的方式介绍了 PyTorch 的使用,包括环境安装、基础知识、张量操作、自动求导机制、神经网络创建、数据处理、模型训练、测试以及模型的保存和加载。原创 2023-07-31 11:48:03 · 2181 阅读 · 78 评论 -
scikit-learn全解:掌握Python最强大的机器学习库
本篇博客详细介绍了Python机器学习库Scikit-learn的使用方法和主要特性。内容涵盖了如何安装和配置Scikit-learn,Scikit-learn的主要特性,如何进行数据预处理,如何使用监督学习和无监督学习算法,以及如何评估模型和进行参数调优。本文旨在帮助读者深入理解Scikit-learn,并有效地应用在实际的机器学习任务中。原创 2023-07-27 14:29:51 · 1285 阅读 · 2 评论 -
Python和PyTorch深入实现线性回归模型:一篇文章全面掌握基础机器学习技术
在本文中,我们将深入探讨线性回归模型的原理,并使用Python和PyTorch进行详细实现。我们从理解线性回归的基本概念开始,然后创建并训练模型,最后评估模型的性能并应用模型进行预测。本文的目标是为读者提供一个全面的、易于理解的线性回归模型的实践指南。原创 2023-07-28 15:39:06 · 1594 阅读 · 23 评论 -
Selenium+2Captcha 自动化+验证码识别实战
Selenium是一个自动化测试工具,主要用于Web应用程序的功能和性能测试。它可以直接运行在浏览器上,支持多种操作系统、浏览器和编程语言。除了测试,Selenium也经常被用在Web爬虫中,用于模拟和自动化浏览器操作。上面的Python代码展示了一个简单的Selenium脚本,它启动了一个Firefox浏览器,然后访问Python官方网站并检查页面标题中是否包含"Python"这个词。最后,关闭浏览器。WebDriver是Selenium的核心部分,它是一个接口,定义了操作浏览器的一系列方法。原创 2023-07-21 14:55:29 · 1495 阅读 · 3 评论 -
验证码识别全流程实战,突破史上最难AI验证码!
验证码大突破!本文将介绍验证码的历史与发展、验证码识别的历史与发展,验证码识别全流程实战,突破史上最难AI验证码!原创 2023-07-27 17:04:47 · 2607 阅读 · 10 评论