- 博客(103)
- 收藏
- 关注
原创 Lbael Studio关系标注
LabelStudio是一款开源数据标记工具,在一个平台上支持多个项目、用户和数据类型。它允许您执行以下操作:使用多种数据格式执行不同类型的标记。将LabelStudio与机器学习模型集成,为标签(预标签)提供预测,或执行持续主动学习。
2025-01-18 18:35:37
805
1
原创 运动健康中的实体和关系
体育健康领域的常用实体和关系种类繁多,涉及个人的健康状况、运动习惯、训练计划、营养、疾病管理等多个方面。通过理解这些实体及其关系,可以帮助制定个性化的健康管理计划,提升运动效果,甚至预防疾病。在构建相关系统时,实体的分类和关系的建模非常重要,能有效地支持数据分析、健康监控和个性化推荐等应用。
2024-12-24 19:46:44
1028
原创 Sora尝鲜:OpenAI的视频创作的文本生成平台
近年来,人工智能在各个领域的应用正在发生深刻变革,其中最引人注目的之一便是文本生成视频技术。2024年12月,OpenAI推出了其最新的AI工具——Sora,一个基于文本描述生成短视频的强大平台。Sora不仅能为创作者提供全新的创作工具,还为内容生产带来了更高的效率和创意空间。今天,我们将深入探讨Sora的功能、应用场景以及它如何改变视频创作行业。Sora是OpenAI推出的文本到视频(Text-to-Video)模型,可以根据用户输入的文本描述生成对应的短视频。这项技术的发布标志着AI在视频内容生成方面的
2024-12-10 17:24:24
1041
原创 新系统如何进行模型环境配置
在机器学习和深度学习中,一个良好的开发环境能够显著提高工作效率。本篇博客将详细介绍如何在新的Linux系统(以Ubuntu为例)上进行模型环境的配置,包括基础系统设置、Python虚拟环境搭建、常用库的安装以及GPU驱动和CUDA的安装等。
2024-11-08 20:59:06
635
原创 自然语言处理(NLP)论文数量的十年趋势:2014-2024
近年来,自然语言处理(NLP)已成为人工智能(AI)和数据科学领域中的关键技术之一。随着数据规模的不断扩大和计算能力的提升,NLP技术从学术研究走向了广泛的实际应用。通过观察过去十年(2014-2024年)NLP领域的论文数量增长趋势,我们可以看到一个从稳步发展到爆发式增长的过程。这一趋势反映了NLP领域的技术进步以及其在众多行业中的应用价值。
2024-10-11 16:49:44
1447
原创 信息抽取数据集处理——RAMS
RAMS数据集(RAMS:Richly Annotated Multilingual Schema-guided Event Structure)由约翰斯·霍普金斯大学于2020年发布,是一个以新闻为基础的事件抽取数据集。它标注了9,124个事件,涵盖了139种不同的事件类型和65种元素角色类型。这个数据集非常适合用于事件抽取、自然语言处理任务,特别是对事件结构、事件角色的识别和分类。
2024-10-11 16:19:26
1967
原创 LaTEX常用基本模板:中文
在学术和技术写作中,LaTeX 是一款非常流行且强大的文档排版工具。它特别适合处理包含复杂数学公式、图表、表格以及其他精确排版需求的文档。本文将通过一个完整的 LaTeX 模板,介绍如何编写包含多种基本样式的 LaTeX 文档。
2024-10-09 11:46:52
5170
原创 TTM-RE: Memory-Augmented Document-Level Relation Extraction(内存增强的文档级关系提取)
文档级关系提取旨在对文档中任意两个实体之间的关联进行分类。以往的文档级关系提取方法在充分利用不同噪声水平的大量训练数据的潜力方面是无效的。例如,在ReDocRED基准数据集中,在大规模、低质量、远距离监督的训练数据上训练的最先进的方法通常不会比那些仅在较小、高质量、人工注释的训练数据上训练的方法表现得更好。为了充分释放大规模噪声训练数据在文档级关系提取方面的潜力,我们提出了TTM-RE,一种新的方法,集成了可训练内存模块,称为令牌图灵机,与噪声鲁棒损失函数来解释正未标记设置。在用于文档级关系提取的基准数据集
2024-10-09 11:32:59
1012
原创 A Two-Stream AMR-enhanced Model for Document-levelEvent Argument Extraction(TSAR)
以往的大多数研究都是从单个句子中提取事件,而文档级事件提取仍未得到充分探索。在本文中,我们着重于从整个文档中提取事件参数,这主要面临两个关键问题: a)触发器和句子参数之间的长距离依赖关系;b)对文档中事件的分散上下文。为了解决这些问题,文章提出了一个双流抽象意义表示增强提取模型(TSAR)。通过双流编码模块从不同的角度对文档进行编码,利用局部和全局信息,降低分散上下文的影响。此外,还引入了一个由AMR引导的交互模块,基于局部和全局构建的AMR语义图,同时捕获句子内和句子间的特征。
2024-10-06 16:53:32
804
原创 事件抽取(Event Extraction, EE)
事件抽取(Event Extraction, EE)是信息抽取领域中的一个重要任务,旨在从非结构化文本中识别和抽取事件相关的信息。事件抽取通常包括识别事件触发词、事件类型以及事件中的参与者、时间、地点等元素,最终将这些信息结构化地表示出来。事件抽取是自然语言处理(NLP)中的一个挑战性问题,广泛应用于新闻分析、舆情监控、情报分析等场景。
2024-10-05 17:05:05
3242
原创 优雅的回文数判断:Python
回文数是一种特殊的数字,它从左到右和从右到左读起来都是一样的。这种特性使得回文数在数学和编程中都非常有趣。回文数的概念不仅限于整数,也可以扩展到字符串和其他数据类型。编写优雅的代码不仅仅是为了美观,它还能提高代码的可读性和可维护性。通过使用 Python 的强大特性,如类型注解和切片操作,我们可以创建简洁而功能强大的函数。回文数判断函数是一个展示 Python 编程优雅性的优秀例子。希望这个函数能激发你在编程中追求简洁和效率的灵感。
2024-08-22 14:18:01
339
2
原创 Gemma Chat【所有人都能本地部署的对话AI】
Gemma Chat 项目是对现代通讯需求的直接回应,它通过利用前沿技术和开源社区的力量,提供了一个稳定、可扩展的聊天解决方案。无论你是寻找一个企业级聊天系统还是简单的社交应用,Gemma Chat 都是一个值得考虑的选择。访问Docker Hub页面和GitHub仓库来了解更多信息和下载源代码。
2024-08-19 11:53:51
1220
原创 Nginx+React在Docker中实现项目部署
Nginx 是一个高性能的 HTTP 和反向代理服务器,也能够处理 IMAP/POP3/SMTP 服务,由 Igor Sysoev 开发并在 2004 年首次公开发布。它以处理静态内容、提供反向代理服务以及其高稳定性、低资源消耗而广受欢迎。Nginx 能够通过非阻塞方式处理多个连接,使其成为管理高并发请求的理想选择。此外,Nginx 还支持负载均衡和邮件代理,以及通过模块扩展更多功能,如 WebSockets 和流媒体支持。
2024-02-08 15:14:58
1770
原创 【报错处理】ModuleNotFoundError: No module named ‘paddle.fluid‘
在使用 UIE(统一信息提取)模型时,您可能会遇到错误消息 "ModuleNotFoundError: No module named 'paddle.fluid'"。这个错误可能让人沮丧,但通常很容易解决。在本博客文章中,我将为您介绍解决此问题。
2024-01-27 18:06:59
11378
原创 Linux网络管理工具tc
是用来管理和配置队列规则的命令。在 Linux 的网络堆栈中,每个网络接口都可以有自己的队列规则,这些规则决定了数据包如何在网络接口上排队、被处理和发送。通过不同的 qdisc 类型和参数,管理员可以精细地控制网络流量,例如限制带宽、控制延迟、优先处理特定类型的流量等。上添加一个新的队列规则(qdisc, queueing discipline)。是一个非常强大的工具,用于控制网络设备上的数据包队列处理。在 Linux 系统中使用。这个命令的作用是在网络接口。网络接口上的根队列规则。这个命令的作用是删除。
2024-01-18 20:56:16
956
原创 Hugging Face怎么通过国内镜像去进行模型下载(hf-mirror.com)
Hugging Face 是一家专注于自然语言处理(NLP)技术的公司,以其开源贡献和先进的机器学习模型而闻名。该公司最著名的产品是 Transformers 库,这是一个广泛使用的 Python 库,它提供了大量预训练模型,如 BERT、GPT-2、T5 和其他模型,这些模型可以用于各种 NLP 任务,如文本分类、情感分析、文本生成等。Hugging Face 还提供一个在线平台,允许社区成员共享和协作他们的模型。
2024-01-18 20:49:58
17706
8
原创 snmp协议配置
SNMP 使用一套定义了不同类型的消息(如 Get、Set、Trap 等)和数据结构(如 OID、MIB 等)的规范,在网络管理中起到重要的作用。它可以用于获取设备的配置信息、监视设备的性能指标、远程配置设备参数、诊断问题和发送警报等。SNMP(Simple Network Management Protocol)是一种网络管理协议,用于管理和监控网络设备、操作系统和应用程序。总之,SNMP 是一种用于网络管理的协议,它提供了一种标准化的方法,使管理员能够监控和管理网络设备、操作系统和应用程序。
2024-01-12 19:49:18
1326
原创 git新建分支并提交
这些步骤将帮助你在Git中成功创建一个新的分支并提交你的更改。记得在进行更改时经常提交,这样可以更好地跟踪和管理更改的历史记录。使用git branch命令创建一个新的分支。使用git commit命令提交你的更改。你应该提供一个描述性的提交信息,说明你所做的更改。暂存更改:使用git add命令暂存你的更改。在你的项目中做出所需的更改。如果你的分支是与他人共享或与远程仓库同步的,你需要使用。使用git checkout命令切换到你的新分支。使用‘cd’命令进入Git项目目录。命令将更改推送到远程仓库。
2024-01-10 21:08:07
1115
原创 GoLang:sql.Exec()报错
Sorry, can not exec into mysql: Error 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near ...
2024-01-10 20:56:08
958
原创 NVIDIA Container Toolkit(NVIDIA Docker)
Nvidia Docker该项目已被取代。此存储库提供的工具已被弃用,并且该存储库已存档。不再支持包装器,并且 NVIDIA Container Toolkit 已进行扩展,允许用户配置 Docker 以使用 NVIDIA Container Runtime。NVIDIA 容器工具包允许用户构建和运行 GPU 加速容器。该工具包包括一个容器运行时和实用程序,用于自动配置容器以利用 NVIDIA GPU。
2024-01-09 14:40:41
2161
1
原创 rrd数据库高并发下的劣势
RRD(Round-Robin Database)数据库是一种用于处理时间序列数据(如网络带宽、温度、股票市场数据等)的专用数据库系统,由 Tobi Oetiker 创建。它的主要特点是固定大小存储,意味着新数据会覆盖最旧的数据,实现高效的数据存取。RRD 专为存储和处理按固定间隔收集的数据而设计,支持多种数据源类型和数据聚合功能,可以生成时间序列图表,广泛应用于系统监控和容量规划等领域。然而,在处理大规模数据时,RRD 有一些劣势。
2024-01-08 15:22:45
551
原创 Docker Compose 安装
Docker Compose 是一个用于定义和运行多容器 Docker 应用程序的工具,允许用户通过一个 YAML 格式的文件来配置应用程序所需的所有服务。它主要用于简化多容器环境的管理,使得用户可以用一个命令同时启动、停止和重建应用程序中的所有服务。这个工具自动处理服务间的网络配置,使它们可以轻松相互通信,并支持卷挂载来实现数据持久化。
2024-01-08 10:13:53
4773
原创 精确管理Python项目依赖:自动生成requirements.txt的智能方法
requirements.txt这个文件通常用于列出项目所需的所有依赖包及其版本,使其他人或系统可以轻松地重现相同的环境。如果你已经在使用像Poetry这样的现代工具,那么利用这些工具的内置功能是有意义的。如果你使用的是Poetry或类似的现代Python包管理工具,它们通常会自己维护依赖文件(如。选择哪种方法取决于你的项目需求和你的工作流程。命令将会列出当前Python环境中安装的所有包及其版本。文件,而不是列出环境中安装的所有包。这将创建一个包含所有当前环境中安装的库的。
2024-01-08 09:25:49
2292
原创 MySQL忘记密码,如何重置密码(Windows)
打开“服务”管理工具(可以在开始菜单搜索“服务”或运行找到你的MySQL服务,可能叫别的,但是应该都是mysql开头的。鼠标右键停止运行它。
2024-01-07 18:30:34
4635
5
原创 GoLang:gRPC协议的介绍以及详细教程,从Protocol开始
gRPC(Google Remote Procedure Call)是一个由Google开发的高性能、开源RPC(远程过程调用)框架。它基于HTTP/2进行数据传输,使用ProtoBuf(Protocol Buffers)作为接口描述语言,支持多种编程语言,如Java、Go、C#等,适用于不同语言环境。gRPC的显著特点包括其高效的通信性能,支持双向流、多路复用和二进制传输,以及集成的安全机制,如SSL/TLS。这些特性使gRPC特别适合用于构建高性能的分布式系统和微服务架构中的服务间通信,尤其在需要处理大
2024-01-06 12:58:29
2512
原创 Gin:GoLang语言Web应用快速入门
通过以上步骤,你就成功使用Go的Gin框架创建了一个基本的Hello World程序。这个程序创建了一个web服务器,监听8080端口,并且对根路径()的GET请求响应“Hello World”。Gin是一个非常强大且易用的web框架,非常适合用于构建RESTful API和web应用程序。
2024-01-04 20:54:28
1666
1
原创 go语言多线程操作
多线程是一种编程概念,它允许操作系统同时处理多个任务。在多线程环境中,每个线程都代表了一个任务的执行流程。这些线程可以同时运行,使得程序能够更有效地利用计算资源,特别是在多核处理器的系统中。
2024-01-04 20:38:43
2635
原创 php composer安装
Composer 是 PHP 中的依赖管理工具。它允许您声明您的项目所依赖的库,并且它将为您管理(安装/更新)它们。
2024-01-03 21:25:58
778
原创 构建 PHP 开发环境:使用 Docker 和阿里云镜像加速器
Dockerfile:这是一个文本文件,包含了一系列的指令,用于定义如何构建 Docker 镜像。例如,它可以包含从基础镜像开始、安装软件包、复制文件和设置环境变量的指令。镜像(Image):Docker 镜像是一个轻量级、独立、可执行的软件包,包含运行应用所需的一切:代码、运行时、库、环境变量和配置文件。容器(Container):当 Docker 镜像运行时,它在 Docker 引擎上运行的实例就是一个容器。容器是应用程序及其运行环境的封装。仓库(Registry)
2024-01-03 21:18:57
1459
原创 PHP下载安装以及基本配置
和客户端的 JavaScript 不同的是,PHP 代码是运行在服务端的。如果在服务器上建立了如上例类似的代码,则在运行该脚本后,客户端就能接收到其结果,但他们无法得知其背后的代码是如何运作的。使用 PHP 的最大的好处是它对于初学者来说极其简单,同时也给专业的程序员提供了各种高级的特性。",超文本预处理器的字母缩写)是一种被广泛应用的开放源代码的多用途脚本语言,它可嵌入到 HTML中,尤其适合 web 开发。如果有像我这样的输出,就说明安装成功啦!打开新的命令行窗口,不在安装路径下,输入。
2023-12-22 21:33:56
7769
2
原创 golang:Excel写入mysql数据库
结构体中的数据库连接信息,并根据实际情况修改插入操作的SQL语句和字段映射。上述示例假设Excel文件中的每一行数据对应MySQL表中的字段,这可能需要根据实际情况进行调整。要将读取的每个Sheet中的数据分别写入不同的MySQL数据库,你需要使用Go语言的MySQL数据库驱动,以及合适的数据库连接和插入逻辑。等库来处理MySQL数据库连接和操作。
2023-12-21 20:40:09
732
原创 2023年9个常用前端开发框架,你最喜欢哪个?
2023年国内外前端框架优劣势对比,国内:Vue>React>Angular国外:React>Angular>Vue。
2023-12-20 17:37:45
2803
原创 KNN:原理+Python实现
K最近邻算法(K-Nearest Neighbors,简称KNN)是一种基于实例的学习算法,用于分类和回归问题。KNN的基本思想是,如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,那么该样本也属于这个类别,并且具有这个类别上样本的特性。
2023-12-19 21:38:09
474
原创 程序员代码书写规范
这些规范可以根据团队的具体需求进行调整,但保持一致性和可读性是最为重要的。使用工具如linters和代码审查可以帮助确保代码符合规范。程序员代码书写规范对于团队协作、代码可维护性和最终软件质量都至关重要。
2023-12-19 21:27:57
554
原创 LibreNMS:从docker出发
LibreNMS 是一个免费开源的网络监控和自动化工具,用于监视网络设备、服务器和应用程序的性能和状态。它提供了一个集中的管理平台,帮助管理员实时监控和管理整个网络基础设施。
2023-12-18 14:21:38
2766
4
原创 Mini-Batch梯度下降
Mini-batch梯度下降是梯度下降法的一种改进版本,它通过每次迭代使用数据集的一个小批量(mini-batch)样本来更新模型参数,从而在训练过程中更加高效。相比于批量梯度下降,mini-batch梯度下降在大型数据集上的训练速度更快,并且相对于随机梯度下降,其收敛过程更为稳定。
2023-12-17 21:27:44
683
RAMS-1.0 数据集
2024-10-11
UFM用户手册(nvidia-ufm-enterprise-user-manual-v6-15-1)
2024-01-10
为什么现在的文本处理只需要标注少量的数据
2023-11-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人