自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

不想宅的冷同学

势在必行 试着起飞 怎样都归作成长

  • 博客(635)
  • 资源 (1)
  • 收藏
  • 关注

原创 IS论文分享Background Music Recommendation on Short Video Sharing Platforms

短视频分享平台(如TikTok、Douyin等)的兴起极大地改变了用户生成内容(UGC)的创作和分享方式。这些平台上,用户在上传视频时通常会选择背景音乐来增强视频的吸引力。选择合适的背景音乐不仅能提升视频的质量,还能增强观众的参与度,最终促进平台的发展。然而,面对平台上大量的音乐片段,用户需要一个高效的推荐系统来帮助他们快速找到合适的背景音乐。论文指出,现有的背景音乐推荐系统主要基于音乐和视频之间的匹配,而忽略了用户的个人偏好。此外,现有的推荐系统在处理新视频(无历史互动数据)时也面临挑战。

2025-04-10 13:30:00 1176

原创 基于 Python 的自然语言处理系列文章 (76):CLIP 模型原理与实现

CLIP(Contrastive Language–Image Pre-training)由 OpenAI 提出,通过对比学习方式,将自然语言监督引入视觉模型中训练。与传统视觉分类模型不同,CLIP 使用完整的自然语言描述作为监督信号,使模型可以理解“语言–图像”的语义对齐能力。CLIP 模型由两个主要部分组成:图像编码器(如 ResNet)文本编码器(如 BERT 或 DistilBERT)其训练目标是最大化图像与其匹配文本之间的相似度,并最小化与不匹配文本的相似度。

2025-04-10 08:00:00 1081

原创 【KWDB 创作者计划】_技术解读(1):KWDB 存储引擎原理与实现全解析

在数据库系统中,存储引擎是最核心的底层组件,决定了一款数据库的性能上限与应用边界。KWDB 作为一款为 AIoT 场景量身定制的国产开源数据库,其存储引擎设计兼顾了“高并发写入、时序压缩、高效检索和分布式扩展”等多重需求。本篇将带你从技术视角出发,深入剖析 KWDB 存储引擎的设计思想与源码实现,并结合 KWDB 2.2.0 实际代码,展示其强大之处。

2025-04-09 14:00:00 868

原创 基于 Python 的自然语言处理系列文章 (75):BEiT (图像片段的揭码器预训练)

BEiT(BERT Pre-Training of Image Transformers)是一种借鉴 BERT 预训练范式的视觉模型,它将图像切分为若干 Patch,并在这些 Patch 上进行遮盖和预测任务(类似于 MLM)以进行表征学习。BEiT 主要用于图像分类、分割等下游任务,在 ImageNet 等多个数据集上表现优异。BEiT 的核心是使用 ViT 架构,将图像转化为 Patch 的 Token 序列,再使用 BERT 风格的 Masked Patch Prediction 进行预训练。

2025-04-09 08:45:00 749

原创 【KWDB 创作者计划】_从底层技术到应用实战:KWDB 系列文章总览

这是一个“多模时代”的数据库开源实践窗口。在性能、可用性与可运维性之间,KWDB 展示了极强的工程思维和平衡能力。如果你正在考虑构建新一代物联网平台、边缘智能平台或数据资产中台,KWDB 是一款值得深度了解并尝试落地的国产数据库。欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-04-08 20:04:19 472

原创 基于 Python 的自然语言处理系列(74):Vision Transformer(ViT)原理与实现

Vision Transformer(ViT)是 Google Research 于 2020 年提出的一个开创性模型,其核心思想是:将图像划分为小 patch,每个 patch 类似于一个“词”,然后将这些 patch 输入到标准的 Transformer 中进行建模。这种方法打破了传统基于卷积神经网络(CNN)的视觉模型架构,开启了计算机视觉领域的新篇章。

2025-04-08 07:15:00 614

原创 IS论文分享A Smart Ad Display System

这篇论文《A Smart Ad Display System》由Li Xiao、D. J. Wu和Min Ding撰写,发表在《Information Systems Research》2024年第35卷第4期。论文提出了一种智能广告展示系统,通过分析消费者观看广告时的面部表情和眼神注视数据,实现个性化视频广告的推送。

2025-04-07 14:00:00 2509

原创 基于 Python 的自然语言处理系列(73):RAG-Agent-Tools

本篇文章介绍了如何基于 Python 和 LangChain 实现一个支持多种工具(搜索、检索、计算、数据库查询等)的智能代理。该代理基于 LLM 进行推理,并动态决定执行哪些工具,以满足用户的查询需求。欢迎在实际项目中尝试扩展更多工具,并优化 LLM 代理的能力!欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-04-07 07:15:00 557

原创 破解 Multisim 疑难杂症:高效解决常见问题指南

然而,在使用过程中,不少人都会遇到各种棘手的问题,如仿真失败、器件异常、分析错误等。本文针对 Multisim 使用中的常见难点和痛点,提供详细的解决方案,助你轻松应对各种挑战。:检查元件引脚定义,确保与 Multisim 中的引脚配置匹配,否则可能导致错误连接。:过多的元件和 SPICE 模型可能占用大量计算资源,建议拆分电路、使用子电路模块。:使用“虚拟仪表”中的“电流表”检查是否有异常大电流,可能是短路导致仿真失败。:模拟电路中,某些元件需要直流偏置,检查是否配置了合适的偏置电路。

2025-04-06 12:30:00 1383

原创 基于 Python 的自然语言处理系列(72):RAG-Chatbot

在本篇文章中,我们将探讨如何使用 LangChain 实现检索增强生成(Retrieval-augmented generation, RAG)。RAG 结合了信息检索和文本生成,使得生成的文本能够基于检索到的外部知识,提高回答的准确性和可解释性。 在 RAG 任务中,我们首先需要准备数据,并将其存储在一个可查询的向量数据库中。1.2 文本分割1.3 计算文本向量1.4 存储向量到 FAISS 数据库1.5 载入向量数据库并创建检索器2. 构建 R

2025-04-06 06:30:00 284

原创 C++ STL 高性能优化指南:从入门到进阶

STL 是 C++ 开发的利器,但默认实现并非总是最优的。在性能要求较高的应用中,我们需要根据实际情况,对 STL 进行针对性优化。合理选择容器、减少拷贝、优化内存管理,以及利用并行化手段,都能有效提高 STL 在项目中的执行效率。欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-04-05 12:45:00 415

原创 基于 Python 的自然语言处理系列(71):LangChain 记忆与多重检索

在本篇文章中,我们探讨了 LangChain 提供的记忆机制,包括和,并演示了它们的使用场景。同时,我们介绍了,展示了如何结合多个检索器提升问答系统的性能。LangChain 的这些特性为 NLP 应用提供了更强大的能力,能够处理更复杂的对话和问答任务。在下一篇文章中,我们将继续深入探讨 LangChain 的高级功能,敬请期待!欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-04-05 07:45:00 300

原创 基于 Python 的自然语言处理系列(70):检索增强生成(RAG)

在许多大模型(LLM)应用场景中,我们需要使用特定的用户数据,而这些数据并未包含在模型的训练集中。检索增强生成(Retrieval Augmented Generation,RAG)是一种有效的解决方案,它通过从外部数据源检索相关数据,并在生成回答时将其传递给 LLM,以提高回答的准确性和相关性。文档加载(Document loaders):从 HTML、PDF、代码等多种格式的数据源加载文档。文档转换(Document transformers):将大文档拆分为更小的、相关的片段,以提升检索效果。

2025-04-04 14:44:22 924

原创 蓝桥杯算法实战:高频赛点深度解析,助你斩获高分!

蓝桥杯作为国内知名的编程竞赛,涵盖了多种经典算法题型,既考察基本编程能力,也锻炼选手的算法思维。本文将带你深入解析蓝桥杯的经典算法题型,帮助你掌握高效的解题技巧,在比赛中取得更好的成绩。蓝桥杯是一场锻炼算法能力的绝佳赛事,希望本文的内容能帮助你掌握高频考点,提高解题能力。只要坚持练习,你也能在比赛中大放异彩,斩获高分!祝大家备赛顺利,取得好成绩!欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-04-04 10:00:00 221

原创 IS论文分享Managerial Response to Online Positive Reviews:Helpful or Harmful?

本文通过理论框架和实证研究,深入探讨了管理者对在线正面评论的回应策略及其对用户行为的影响。研究结果为管理者提供了具体的行动指南,帮助他们在在线评论平台上更有效地与客户互动,同时也为未来的研究提供了新的方向和方法。欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-04-03 13:30:00 625

原创 基于 Python 的自然语言处理系列(69):RAG-prompt

LangChain 是一个用于开发基于语言模型(LM)的应用程序的框架。:连接语言模型(LM)到上下文数据源(如提示指令、少样本示例、相关内容等)。:依靠 LM 进行推理(根据提供的上下文决定如何回答、采取何种行动等)。

2025-04-03 09:15:00 786

原创 基于 Python 的自然语言处理系列(68):LangChain 与 OpenAI 进行 PDF 文档处理

在本篇文章中,我们将介绍如何使用 LangChain 结合 OpenAI 进行 PDF 文档的向量化与查询。通过本教程,你将学会如何利用 LangChain 提供的工具,将 PDF 文档加载为向量,并使用 OpenAI 模型进行查询。

2025-04-02 13:45:00 328

原创 JavaScript性能优化实战 —— 深入探讨性能瓶颈与优化技巧

JavaScript的性能优化需要从多个方面入手,包括减少阻塞、优化DOM操作、减少事件监听的开销,以及合理使用数据结构和异步编程。以下是本文核心优化要点:✅减少主线程阻塞,避免长时间同步执行✅优化DOM操作,使用批量更新技术✅使用防抖/节流优化高频事件✅避免不必要的闭包,减少作用域链查询✅使用优化动画✅懒加载和按需加载,提高页面初始加载速度掌握这些优化技巧,可以帮助你编写更高效、更流畅的JavaScript代码,提高Web应用的性能和用户体验。如果本文对你有所帮助,欢迎。

2025-04-02 08:00:00 582

原创 VMware安装Ubuntu实战分享

通过本文的实战分享,相信你已经能够顺利在VMware Workstation上安装Ubuntu,并完成基本的优化配置。安装完成后,可以进一步探索Ubuntu的各种功能,比如开发环境搭建、服务器配置等。希望这篇文章对你有所帮助,欢迎在评论区交流经验!欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-04-01 20:15:00 549

原创 基于 Python 的自然语言处理系列(67):使用 OpenAI Functions 进行结构化输出

在本篇文章中,我们探讨了如何利用 OpenAI Function Calling API 结合 LangChain 进行结构化数据提取。主要内容包括:使用 Pydantic 及 JSON Schema 强制 LLM 返回结构化数据。处理多种数据类型,例如“人”和“狗”的信息提取。结合 Python 自定义函数,让 OpenAI 自动选择适合的函数进行执行。这一技术适用于聊天机器人、智能问答系统、信息提取等多个 NLP 任务场景。希望本文能对你的实际应用有所帮助!

2025-04-01 15:15:00 420

原创 IS论文分享Content Length Limit: How Does It Matter for aConsumer-to-Consumer Media Platform?

这篇论文《Content Length Limit: How Does It Matter for a Consumer-to-Consumer Media Platform?》由 Zheyin (Jane) Gu 和 Xuying Zhao 撰写,发表于《Information Systems Research》2024年第35卷第4期。

2025-03-31 13:00:00 2383

原创 C 盘爆满?教你 5 招高效清理,释放超多存储空间!

掌握这 5 个技巧,C 盘至少能腾出。

2025-03-31 08:15:00 330

原创 基于 Python 的自然语言处理系列(66)—— 标签标注(Tagging)与实体记忆(Entity Memory)

在 NLP 任务中,Tagging 指的是为文本添加结构化的标签信息。例如,我们可以标注文本的情感倾向(积极/消极)、攻击性等级(1-5)以及语言类型(英语、西班牙语等)。在对话系统中,通常需要记住对话中的实体信息。Chaky & Gun 正在开发一个 NLP 课程。这听起来是个不错的项目!他们在做什么类型的 NLP 研究?当用户后续询问“Chaky 是谁?时,系统应该能记住之前的对话内容,而不是忘记所有上下文。Tagging:利用LangChain进行文本标签标注,包括情感分析、语言识别、攻击性检测等。

2025-03-30 13:45:00 862

原创 创意 Python 爱心代码

Python 不仅可以用来处理数据、开发应用,还能用来创造美丽的艺术。希望这些爱心代码能激发你的编程灵感,尝试用 Python 设计属于自己的创意作品!如果你有更有趣的 Python 代码创意,欢迎在评论区分享!😊欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-03-30 08:00:00 178

原创 基于 Python 的自然语言处理系列(65):合成数据生成

在生成合成数据之前,需要定义数据的结构。

2025-03-29 14:15:00 369

原创 DeepSeek:提升工作效率的AI助手

DeepSeek 作为一款智能 AI 助手,能够在多个行业领域发挥重要作用,帮助从业者节省时间,提高工作效率。如果你希望在工作中更好地利用人工智能,不妨尝试 DeepSeek,让 AI 赋能你的职业发展!欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-03-29 08:00:00 411

原创 AI 与 IT 从业者:共舞还是取代?

在当今数字化浪潮的汹涌冲击下,AI 的出现犹如一颗划破夜空的璀璨星辰,照亮了科技发展的新方向,也引发了无数关于未来职业走向的讨论。尤其是对于 IT 从业者而言,仿佛站在了一个十字路口,前方是机遇与挑战交织的未知旅程,而那个令人揪心的问题始终盘旋在心头——AI 会成为“职业终结者”吗?

2025-03-28 15:45:00 1343

原创 IS论文分享Do “Likes” in a Brand Community Always Make YouBuy More?

这篇论文《Do “Likes” in a Brand Community Always Make You Buy More?》由Chen Liang、Ji Wu和Xinxin Li撰写,发表于2024年的《Information Systems Research》杂志第35卷第4期。

2025-03-28 09:45:00 1213

原创 基于Python的自然语言处理系列(64):Step-Back Prompting 问答技术

在复杂问题的问答任务中,一种名为(回退提示)的方法能够提高回答的准确性。该技术的核心思想是。这一方法可以与检索增强问答(Retrieval-Augmented Question Answering,RAG)结合,以提升信息检索的质量。在本教程中,我们将复现 Step-Back Prompting 的实现,并调整提示词使其更适用于聊天模型。

2025-03-27 16:00:00 399

原创 基于Python的自然语言处理系列(63):使用LangChain进行SQL查询

Structured Query Language (SQL) 是用于管理和查询数据库的标准语言。借助LangChain,可以使用自然语言生成SQL查询,实现如下功能:生成基于自然语言问题的SQL查询创建可以基于数据库数据回答问题的聊天机器人构建基于用户分析需求的自定义仪表盘。

2025-03-27 09:30:00 288

原创 IS论文分享Crowdworking: Nurturing Expert-Centric AbsorptiveCapacity

吸收能力是指组织从环境中获取有价值机会和知识的能力。它可以被视为组织资源(组织在特定时间点所拥有的相关知识存量)或组织能力(吸收知识的能力)。在与外部专家合作的背景下,持续吸收知识的能力更为重要。吸收能力可以是单维度的,也可以是多维度的。本文将吸收能力视为多维度的,重点关注其三个维度:识别(identification)、同化(assimilation)和利用(exploitation)外部知识。这种多维度的划分有助于明确各个维度背后的流程及其相互关系。

2025-03-26 16:00:00 1578

原创 基于 Python 的自然语言处理系列(62):Rewrite-Retrieve-Read

(重写-检索-阅读) 是一种改进 RAG(Retrieve-and-Read)流程的方法,最早由论文提出。在现实世界中,用户的原始查询往往并不适合直接用于检索,尤其是在 LLM 任务中。为了解决这个问题,该方法首先利用 LLM 重写查询,使其更加适合检索,进而提升最终回答的准确性。本篇文章将展示如何使用来实现。

2025-03-26 10:30:00 421

原创 基于 Python 的自然语言处理系列(61):RAG Fusion介绍

该检索链的执行流程如下:生成多个查询。使用检索器查询每个子查询。使用互惠排序融合 (RRF)对结果重新排名。注意:此过程不会执行最终的生成步骤,仅进行检索和融合。# 假设检索结果已按相关性排序# 执行查询。

2025-03-25 09:29:39 482

原创 基于Python的自然语言处理系列(60):使用 LangChain 构建 Multi-Vector Retriever 进行文档检索

在 NLP 和 AI 领域,基于嵌入(Embeddings)进行文档检索已成为一种高效的解决方案。本文介绍如何使用构建 Multi-Vector Retriever,实现对长文档的分块索引和高效检索。

2025-03-25 09:25:17 556

原创 IS论文分享Longitudinal Impact of Preference Biases on Recommender Systems’ Performance

文章通过模拟方法研究了偏好偏差对推荐系统性能的纵向影响,探讨了偏好偏差的大小对系统预测性能以及用户消费结果的影响,并提出了减少偏好偏差的方法。进一步分析发现,偏差用户和无偏差用户之间存在溢出效应,偏差用户的反馈会影响无偏差用户的推荐,反之亦然。高偏差导致消费项目的评分膨胀加速,这些膨胀的评分被添加到系统训练数据中,削弱系统学习用户真实偏好的能力。推荐平台可通过获取用户暴露于推荐信息的记录和估计用户群体的偏差水平,采用全局或个体去偏差方法处理用户提交的评分,从而提高系统的预测准确性和用户的消费体验。

2025-03-11 10:47:17 901

原创 IS论文分享How human–AI feedback loops alter human perceptual, emotional and social judgements

这篇文章发表在《Nature Human Behaviour》2025年2月刊,题为《How human–AI feedback loops alter human perceptual, emotional and social judgements》,作者是Moshe Glickman和Tali Sharot。文章探讨了人类与人工智能(AI)之间的交互如何通过反馈循环改变人类的感知、情感和社会判断,并放大人类的偏见。

2025-02-26 23:04:47 946

原创 DeepSeek:情智机器人的“情感引擎”与未来变革者

DeepSeek正以其强大的情感计算能力和多模态交互技术,成为情智机器人发展的关键推动力。它不仅为情智机器人提供了强大的“情感引擎”,还通过开源策略加速了行业的发展。未来,随着技术的不断进步,情智机器人将在更多领域展现其价值,成为人类生活中不可或缺的温暖伙伴。然而,我们也必须面对技术发展带来的伦理挑战,确保情智机器人能够真正服务于人类的情感需求。在这个充满机遇和挑战的时代,DeepSeek正引领情智机器人走向一个更加智能、更加温暖的未来。

2025-02-18 13:49:15 669

原创 国内情智机器人:从“通情达理”到温暖陪伴的跨越

国内情智机器人的研究和应用正在快速推进,从情感计算技术的突破到人形机器人的高度仿真设计,都展现出巨大的发展潜力。虽然仍面临多模态感知和个性化交互等挑战,但随着技术的不断优化和应用场景的拓展,情智机器人将成为未来智能生活的重要组成部分。让我们期待它们为人类带来更多温暖和便利。

2025-02-16 23:22:18 479

原创 国内情智机器人:从“通情达理”到温暖陪伴的跨越

国内情智机器人的研究和应用正在快速推进,从情感计算技术的突破到人形机器人的高度仿真设计,都展现出巨大的发展潜力。虽然仍面临多模态感知和个性化交互等挑战,但随着技术的不断优化和应用场景的拓展,情智机器人将成为未来智能生活的重要组成部分。让我们期待它们为人类带来更多温暖和便利。

2025-02-16 23:17:19 569

原创 情智机器人:未来已来,温暖的智能伙伴正向我们走来

情智机器人的未来充满希望。它们不仅代表着人工智能技术的前沿方向,更承载着人类对温暖、情感化陪伴的渴望。从多模态情感识别到情感生成与交互,从医疗护理到教育服务,情智机器人正逐步走进我们的生活。或许在不久的将来,我们每个人都能拥有一位真正“通情达理”的智能伙伴。欢迎关注我的后续博文,我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

2025-02-15 17:17:42 650

2016-2023年主要城市居民国庆月消费价格指数

指标:城市居民消费价格指数(上年同月=100)(%) 我国CPI每五年进行一次基期轮换。每次基期轮换后,调查分类目录、代表规格品和调查网点均有调整,分类权数也有变化,以反映居民消费结构的最新变动。 2016年1月-2020年12月编制和发布的是以2015年为基期的CPI。“食品”、“烟酒”合并为“食品烟酒”,“医疗保健和个人用品”拆分至“生活用品及服务”、“医疗保健”和“其他用品和服务”中,“娱乐教育文化用品及服务”拆分至“教育文化和娱乐”、“其他用品和服务”中,“家庭设备用品及维修服务”拆分至“生活用品及服务”和“其他用品及服务”中。 2021年1月开始编制和发布以2020年为基期的CPI。本轮基期仍分为食品烟酒、衣着、居住、生活用品及服务、交通通信、教育文化娱乐、医疗保健、其他用品及服务8个大类,基本分类增加至268个。 主要城市: 北京 天津 石家庄 太原 呼和浩特 沈阳 大连 长春 哈尔滨 上海 南京 杭州 宁波 合肥 福州 厦门 南昌 济南 青岛 郑州 武汉 长沙 广州 深圳 南宁 海口 重庆 成都 贵阳 昆明 拉萨 西安 兰州 西宁 银川 乌鲁木齐

2024-09-09

生命科学siRNA药物药效预测数据集

train_data.csv train_data.csv的每行为一条训练记录,包含数据记录的id、siRNA裸序列、相应的siRNA修饰序列、目标mRNA序列、siRNA浓度、细胞系、转染方法等实验室条件以及对应的实验室测量的mRNA Remaining值等总计19个字段。其中mRNA Remaining值为我们模型的训练目标,其余18个字段的全部或部分可以作为模型的输入特征。Remaining值代表了经过siRNA的沉默之后,mRNA的剩余百分比(相对于对照组)。Remaining值越低,siRNA的沉默效率越好,药效就越好。Remaining值一般位于0-100的区间内,100表示完全没有沉默效果,0表示该mRNA被彻底沉默,但是由于实验室测量的误差,可能存在少量训练记录的mRNA Remaining值在这个范围之外,这是正常的数据。

2024-09-04

论文MWEC支撑数据.zip

数据分析与知识发现期刊论文MWEC:一种基于多语义词向量的中文新词发现方法,论文支撑数据,包括: [1] 张乐,冷基栋,袁梦龙. Newworddiscovery_data.zip. 新浪产经、搜狐体育、马蜂窝旅游和网易云音乐网络文本数据121.9M [2] 张乐,冷基栋,袁梦龙. Random2000.zip. 新浪产经、搜狐体育、马蜂窝旅游和网易云音乐四个领域分别随机选取的2000条网络文本数据 [3] 张乐,冷基栋,袁梦龙. annotations.zip. 新浪产经、搜狐体育、马蜂窝旅游和网易云音乐四个领域分别随机选取的2000条网络文本数据的人工标注结果

2021-09-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除