- 博客(1506)
- 资源 (6487)
- 收藏
- 关注
原创 基于属性图的社区搜索模式及其分类体系
当前在属性图中的社区搜索方法较多、类型繁杂,没有系统的分类方式,约束了社区搜索的应用。为明确属性图社区搜索的类别,对属性图社区搜索分类方法进行研究。首先,首次提出属性图社区搜索模式的概念,深入分析属性图社区搜索模式之间存在的联系,提出属性图社区搜索模式的等价、从属、交叉、全异4种关系;
2025-01-14 18:29:14
57
原创 多机器人系统感知能力和控制体系结构综述
为了促进多机器人系统(multi robot system, MRS)的智能化、无人化发展,并提升MRS在不同工作环境中的探测能力和系统的灵活性,本文从MRS的感知能力及其控制系统架构的角度出发,深度调研并分析了MRS相关的研究与工作,重点探讨了空中、地面、水面、水下4种应用环境下的MRS感知能力与控制系统架构,并对未来的研究方向进行展望。本文的结果可对于后续MRS在感知方法和控制系统的选用上提供参考。
2025-01-14 18:25:45
88
原创 基于随机森林回归的船舶特涂维修的日能耗预测
摘要特殊涂装(简称特涂)维修是修船工作的核心内容,能耗的预测是船舶智能能效优化中的一项重要任务。使用随机森林回归(RFR)模型对船舶特涂维修日能耗进行分析,去除异常值、随机化和标准化数据集,然后使用RFR模型对船舶日能耗历史数据进行训练拟和,利用带交叉验证的网格搜索优化RFR模型,使用优化后的RFR模型对船舶特涂维修日能耗数据进行分析,并与其他模型进行对比实验。结果表明,优化后的RFR模型预测效果优于多种其他模型,R2值达93.25%,均方误差明显更低。关键词: 能耗预测 ; 随机森林
2024-09-08 13:21:43
755
原创 小样本数据下特种材料基因工程的数据扩充方法
而SMOTE算法生成的合成样本过于聚集在原始样本的区域,不能很好地表示数据的多样性和复杂性,难以提升模型的性能表现。可知,本文扩充算法可以实现数据扩充且对数据具有一定的平衡作用,如原始数据集中面心立方晶格(FCC)数据最少(仅占总样本的21.2%),体心立方晶格(BCC)数据最多(占总样本的43.7%),扩充后的数据集中FCC相数据相对增加(占总样本的28.2%),BCC相数据有一定程度的减少(占总样本的22.9%),由此可知本文算法能够捕捉到原始数据中的样本不平衡现象,并进行一定程度的修正。
2024-09-08 13:20:08
573
原创 企业数据资产化实践案例研究:基于数据要素形态演化视角
摘要数据资产化和数据要素优质供给,对赋能实体经济有放大、叠加和倍增效应。当前研究专注于对数据资产的理论框架和核心环节的深入研究,在实践应用方面缺乏系统性思维和体系化指导。提出了面向企业经营性数据资产的实践探索框架,即“五段六维”数据资产化过程模型,旨在探究“企业如何有效配置和优化不同维度的使能因素,以有序推进数据资产化过程”这一科学问题。通过调研上海市典型行业内企业的数据产品,凝练了企业数据要素的优质供给策略,并在实践中探索并验证该模型在企业数据资产化进程的适用性,为企业数据资产化提供了实践依据。模型的提出
2024-09-08 13:18:14
1450
原创 企业数据资产运营平台建设实践
摘要数据是企业的核心战略资产,这已然成为社会共识。在数字化转型浪潮下,各企业通过数据资源化推动业务数据化,以数据资产化推动数据业务化,最终充分释放数据资产价值。研究了从数据的业务供给端出发,如何通过数据资产运营构建全面有效、切合实际的数据资产管理体系,从而提升数据质量,保障数据安全;从业务的数据需求端出发,如何通过数据资产运营拉通企业内部和外部数据,推动数据与业务深度融合,丰富数据资产应用场景。数据资产运营平台是数据资产运营体系的技术支撑,支持资产运营闭环流程的线上化、标准化及配置化,满足运营操作的自动化、
2024-09-08 13:16:11
922
原创 数据资产增值减值因素分析
摘要资产价值增减变动的判断评估是资产管理和会计的一项重要工作。在当下数据资产入表的进程中,数据资产价值增减变动的计算方法是必须解决的问题。数据资产不同于传统资产,其价值增减变动也会有所不同,为此首先要弄清楚有哪些因素造成了数据资产的增值或减值。从数据资产与传统资产的差异性入手,分析提出了数据资产减值的4个因素:时效性数据因素、时效性使用因素、管理成本因素、授权临期因素;分析提出了数据资产增值的3个因素——数据完整性提升因素、数据新用途发现因素、技术进步带来成本下降因素,为数据资产减值、增值的计算方法设计提供
2024-09-08 13:15:17
674
原创 数据产品的资产性分析
摘要当前各地纷纷建设数据交易场所,挂牌数据产品屡创新高,但场内数据交易仍不够活跃。综合分析当前主要数据交易场所挂牌的数据产品,发现数据产品的资产性不足是导致当前“挂牌多、交易少”的主要原因。基于此,研究了数据产品资产性需具备的3个条件,提出数据产品资产化方法,包括价值实现路径、“资产才挂牌”的挂牌原则、“合规-权属清晰-预期有经济利益流入”的资产性核验框架、“开发-利用-流通-交易”的基础设施保障、“挂牌即资产”的运营交易逻辑以及常态化评价、审查和警示机制,为数据产品交易提供参考,为数据要素市场建设助力。关
2024-09-08 13:13:34
511
原创 基于数据质量的公平数据定价
中的例子展示了数据质量对用户的影响。值得注意的是,在数据市场定价的过程中,影响数据价格的因素有很多,本文着眼于数据质量对数据定价的影响,即保证在数据质量背景下的数据市场定价的公平性。数据清洗过程通常耗时而昂贵,巨大数据集合上的清洗费用常常在个人用户的负担范围之外,同时,数据清洗产生的数据质量的提升可以在多用户之间共享,因此笔者在多用户合作的设定下,设计数据市场上面向独立用户的数据清洗服务。为了保证数据市场的公平性,首先,不同的买家对数据质量的要求不同,需要根据数据质量要求制定合适的数据定价策略。
2024-09-08 13:11:49
424
原创 国有企业数据资产特征及合规管理改进
摘要随着国有企业数字化转型与智能化改造推进,传统的企业产权转让和企业增资交易中,逐渐出现了数据资产附随转让的情况,发生了多样的风险事件。首先,分析了国有企业数据资产交易合规管理存在的不足;然后对数据资产与国有企业传统资产交易之间的差异进行了详细阐述,包括技术进步衍生新的权利、新的权利带来两级交易风险;之后总结了国有企业数据资产的新特征:公益性与福利性、敏感性与博弈性;最后提出,应尽快在企业党委领导下,探索建立数据资产交易专项的合法合规性审查机制。关键词: 企业合规 ; 国企法治 ; 数据资产 ; 资产交易随
2024-09-08 13:10:43
698
原创 基于多模态融合提升的文本分类方法
摘要尽管基于多模态的文本分类技术在应用到具体场景中具有潜力,但仍存在局限性。现有多模态融合模型要求输入数据模态对齐,因此大量不完整的多模态数据被直接浪费,从而限制了推理时可用数据的规模和灵活性。为了解决这个问题,提出了一种基于多模态融合提升的文本分类模型和不充分多模态资源训练方法。与传统方法相比,提出的模型在标准数据集上的性能平均提高了约4.25%。此外,在除文本输入模态外的其他模态缺失率为50%的情况下,不充分多模态资源训练方法的性能比传统多路由策略提高了约4%。这表明所提出的模型和训练方法具有明显的优势
2024-09-08 13:10:02
582
原创 面向算力网络的跨域数据管理方法
摘要跨域算力网络希望整合多个算力中心的计算和数据资源,但现有的方案对跨域文件和数据管理关注不够。提出了一种轻量级的跨域算力网络数据管理方案:通过文件系统协议转换,接入远程算力中心的并行文件系统存储资源;算力中心内部的存储资源作为一种补充,应对高IOPS应用;通过容器绑定技术,将远程存储挂载并绑定到指定目录。基于该方案的原型系统已经在高校校级计算平台部署运行。实测数据和用户体验显示,该方案能够满足常见高性能计算应用需求。关键词: 算力网络 ; 并行文件系统 ; 数据管理 ; 异构存储资源近年来,高性能计算应用
2024-09-08 13:07:40
961
原创 基于因果图分析的可解释司法判决预测方法研究
摘要随着人工智能技术的发展和海量司法数据的公开,面向“智慧司法”服务的司法判决预测(legal judgment prediction,LJP)任务受到了学术界和工业界的广泛关注,该任务旨在根据有限的案件事实描述文本来预测案件的罪名、法条和刑期。然而,现有工作缺乏对易混淆司法案件的智能决策的研究,且相关模型通常缺乏可解释性,这会导致模型预测严重依赖领域专家,阻碍LJP在不同法律体系中的应用。为此,提出了一种基于因果图分析的司法判决预测(prediction of legal judgment based o
2024-09-08 13:05:28
393
原创 一种高效鲁棒的元宇宙环境下的多场景智能医疗模型研究
摘要现今医疗行业普遍存在医疗资源和教育资源不均衡、医疗体系智能化水平低、手术操作依赖个体经验等问题,拥有沉浸、互动特点的元宇宙为以上问题提供了解决方案。但现有的解决方案多基于虚拟现实或人工智能中的一种技术,针对特定的手术或疾病诊断问题进行探索,少有针对多功能、多场景应用的医疗元宇宙进行的系统研究。基于此,提出了元宇宙环境下的多场景智能医疗模型框架(MetaMed),从接入层、数据层、技术层、应用层自底向上阐述了模型的框架设计。该框架在智能手术、线上会诊、医疗培训、机器人手术和门诊挂号5种应用场景中给出了数学
2024-09-08 13:01:54
2845
原创 决策驱动型省级政务大数据治理技术架构及实现
针对时序政务数据,可利用概念漂移技术捕捉数据中的分布变化,利用多层次时序结构捕捉数据中时序层次结构,利用因果结构学习技术推断数据中属性的因果结构,实现对数据中动态特性的刻画;该模型可归纳为“三一二五”治理架构,即以支撑和服务政府宏观区域态势、中观行业监管、微观行政对象审批三方面决策场景为核心驱动力,在明确一个待决策目标任务的基础上,通过建立基础资源管理机制和行业动态知识管理两项基础工作,经过决策量化、表示学习、在线任务管理、检验分析、质量评估五大核心环节,共同构成了面向省级政务大数据治理的总体技术架构。
2024-09-08 13:00:13
684
1
原创 政府旅游数据开放的评价指标体系构建与组态分析:基于21个省级行政区的数据
摘要在信息时代和智慧旅游背景下,政府主动对外开放内部的旅游数据,有利于充分释放旅游数据资源的商业价值与社会价值。使用变异系数法与熵权法进行组合赋权,构建了政府旅游数据开放评价指标体系,计算21个省级行政区的具体得分,并采用模糊集定性比较方法进行高评价值与低评价值条件组态分析。结果表明:指标体系包含4项一级指标、17项二级指标与51项三级指标,可以对当前省级行政区的旅游数据开放绩效进行有效评价;利用层、数据层是权重较高的一级指标,法律政策效率与内容、平台关系等是权重较高的二级指标;高评价值组态为综合发展型、数
2024-09-08 12:58:24
1839
原创 基于图模型的电力系统碳流计算优化研究
摘要首先介绍了图数据模型、图数据库和图计算的基本原理,包括图数据库的数据模型、查询语言以及常见图计算方法等。然后详细阐述了电力系统的图数据模型构建方法,将系统组件表示为节点,组件间关系表示为边。最后设计了碳流计算的图算法流程,利用AtlasGraph图数据库及图计算组件进行碳流传递迭代计算。该方法充分利用图数据库和图算法的优势,实现了对电力系统碳流的精确高效计算。该研究为电力系统碳排放的监测、分析和优化提供了有力支持,对于推动电力系统绿色低碳发展具有重要意义。关键词: 图数据库 ; 图计算引擎 ; 电力系统
2024-09-08 12:54:48
1014
原创 “东数西算”战略与问题的分析研究
摘要2021年3月,“十四五”规划正式发布,加快数字化发展、建设数字中国是未来数字经济发展模式的目标。作为数字经济的基础,国家发布了多项规定来统筹规划、促进大数据中心一体化和算力枢纽节点(即“东数西算”)的整体建设,服务于数字经济的发展。本刊的“东数西算”专题中,根据对八大节点的实地调研情况,详细分析各地特点及面临的一系列问题。同时,基于调研结果和研究成果从地方建设和就业收益平衡、网络基础建设、政府指导和市场化并举、大数据自主软硬件评价体系、涉外数据交流和监管、人才队伍培养6 个方面提出了发现的问题和相应的
2024-09-07 22:09:57
833
原创 “东数西算”工程建设的现状、问题与对策
摘要“东数西算”工程是构建我国国土空间领域内算力资源东西平衡、按需调度的重大战略工程。自我国全面启动“东数西算”工程建设以来,供需端、能源端、技术端、机制端等暴露出诸多问题,迫切需要从理论层面对“东数西算”工程的内在逻辑进行重新分析与定义。从经济形态、技术趋势、科技竞争、成本收益等不同视角分析了“东数西算”的内在逻辑,即算力基础设施化,并提出打造全国算力一张网的新型基础设施,以及从政策布局、网络直连、技术支持、机制创新等方面构建国家算力网的对策建议。关键词: 东数西算 ; 枢纽节点 ; 基础设施 ; 国家算
2024-09-07 22:09:04
945
原创 “东数西算”成渝枢纽战略分析和示范落地
摘要数字经济时代,算力已成为衡量国家经济发展程度的重要指标。通过对“东数西算”和“成渝地区双城经济圈建设”两大国家战略进行剖析,并结合“东数西算”成渝枢纽节点建设情况,提出成渝枢纽节点之所以被布局为东部枢纽节点之一,主要得益于算力战略区位优势、数据融通体系保障、算力基础设施夯实、算力应用场景成熟四方面原因。进一步,以西部(重庆)科学城先进数据中心为例,剖析了“东数西算”在成渝地区的示范落地,并提出为更好地发挥成渝枢纽节点的作用,一方面成渝枢纽内天府、重庆数据中心集群可从网络、数据、算力、产业、算法、能源六方
2024-09-07 22:04:06
1074
原创 “东数西算”背景下数据中心碳减排效益分析
摘要作为算力承接地,西部地区拥有丰厚的自然资源禀赋,需充分发挥其在能源、气候等方面的优势。“东数西算”背景下,数据中心急需对算力转移过程的碳减排效益进行量化分析。在考虑可再生能源、气候因素和传输过程3个影响因素的情况下,构建了数据中心工作负载转移的碳排放量核算模型,以“东数西算”八大节点为例进行算例分析。结果发现,相较于可再生能源和气候因素所减少的碳排放量,传输过程造成的额外碳排放量微乎其微,在仅考虑前两者的情况下,每转移1 kW·h的工作负载,碳排放量可减少0.053~0.344 kg。为提高负载转移带来
2024-09-07 22:03:12
577
原创 长三角国家算力枢纽节点赋能制造业数字化转型的机理与路径
摘要长三角作为先进制造业最集聚、发展基础最雄厚、创新型经济最活跃和最具潜力的国家级创新策源地,“东数西算”工程中国家算力枢纽节点的建设,对加快推动长三角先进制造业实现升级转型具有重要意义。因此,结合当前制造业数字化转型过程中遇到的困境与问题,探寻长三角国家算力枢纽节点赋能制造业数字化转型的逻辑机理、现实挑战和实现路径,以期推动制造业转型升级和长三角区域一体化绿色高质量发展。关键词: 东数西算 ; 算力网络 ; 数据中心 ; 制造业转型升级 ; 数字化转型2022年2月7日,国家发展改革委等部门正式同意在长三
2024-09-07 21:37:38
1009
原创 “东数西算”粤港澳大湾区(广东)枢纽的国际化发展及保障机制
摘要数字经济已成为国家经济发展的重点,广东与港澳合作探索数字化发展,在数字中国建设中起着重要作用。算力中心是数字经济发展的基石,粤港澳大湾区的协同发展为算力中心的建设提供了机遇。从澳港大湾区的起源、经济状况、数字经济规划、创新制度等角度出发,探讨了大湾区的基础情况和算力发展情况,进而从算力支撑、CDO角色职责等角度提出发展建议。关键词: 数字经济 ; 粤港澳大湾区 ; 算力中心 ; CDO职责2023年2月27日,国务院发布了《数字中国建设整体布局规划》(以下简称《规划》),其为以数据要素为核心的数字中国建
2024-09-07 21:36:36
726
原创 “东数西算”宁夏节点数字经济产业发展研究
摘要基于宁夏大数据产业的发展现状,利用PESTEL模型对大数据产业的发展环境进行评估,并采用SWOT分析法,将宁夏大数据产业与宁夏的传统产业和其他地区的大数据产业进行多方面对比分析。基于分析结果,分别从完善大数据发展环境、优化大数据产业结构、绿色发展等角度提出发展建议。关键词: 数字经济 ; PESTEL环境模型 ; SWOT分析 ; 绿色发展随着信息技术和人类生产生活交汇融合,互联网快速普及,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会治理、国家管理、人民生活都产生了重大影响。世界各国都把推进经
2024-09-03 22:56:48
921
原创 “东数西算”甘肃枢纽庆阳集群:现状与前景
摘要旨在分析“东数西算”甘肃枢纽庆阳集群的发展现状、查找存在问题、展望发展前景、加快甘肃枢纽庆阳集群建设步伐。采用文献调研及实地调研方法对庆阳集群的特色优势、取得的成绩、面临的挑战、存在的问题进行了调研和分析,并对庆阳集群建设前景进行了展望。建议从国家、省级、集群3个层面部署,通过实施产业创新发展期、产业生态提升期、产业高地铸造期三步走战略,完成“七大战略”任务,重点发展“东数西算”核心、衍生、赋能“三大产业”,形成智算、智能、智产“三大体系”,建成“绿色化、科技型、安全式”智慧园区。关键词: “东数西算”
2024-09-03 22:55:30
1846
原创 京津冀国家算力枢纽节点赋能全球数字经济标杆城市建设
数字经济发展需要产业链和供应链的逐渐完善和协同发展,但是北京市的土地资源、能源供给均较为有限,生产成本和人力成本均高于周边地区,产业链和供应链中的短板难以依托自身解决,通过京津冀国家算力枢纽建设,可以有效实现相关产业的疏解,补全产业链和供应链的短板,促进区域产业协同发展。北京市作为京津冀地区的领头羊,数字经济发展最迅速,对算力的需求快速攀升,但受限于土地、电力资源紧缺,以及能耗限额的严格要求,北京市的数据中心建设仅靠技术改造和绿色升级已经无法满足快速增长的算力需求,必须依靠环京地区进行承接。
2024-09-03 22:54:05
935
原创 基于多方安全计算的公共数据融合创新模式研究及应用
摘要多方安全计算技术已广泛应用于金融、互联网等领域,用于解决“数据孤岛”难题,然而其在公共数据领域的应用尚不成熟。针对公共数据领域提出了基于多方安全计算的公共数据融合创新模式,开发设计了在保护数据安全前提下利用各主体公共数据联合计算的技术架构。该模式通过技术创新突破制度制约,实现数据价值提升和保障数据安全的兼顾。主要分析了模式中多方安全计算核心系统的3个子层:联合计算子结构层、安全关系代数层和多方安全计算基础算子层。此外,还给出了实现公共数据融合创新模式的通用流程,并对公共数据融合创新模式的应用实例进行了阐
2024-09-03 22:42:43
499
原创 支持互联互通的隐私计算网关设计与实现
在隐私计算平台的实际应用中,数据提供机构常根据已有平台或正在研发中的隐私计算系统,为其数据应用的机构客户配置隐私计算平台。鉴于此,隐私计算厂商开始探索隐私计算平台的高级互联互通,这一阶段旨在通过制定不同厂商之间的互通规范或方法,明确相互间的通信协议、报文封装以及加密算法等内容,从更高层面实现不同厂商隐私计算平台之间的互通。所谓隐私计算互联互通,即在不同系统架构下,通过统一规范的接口和交互协议,实现跨隐私计算平台的数据、算法和算力的互动与协同,为用户共同完成同一隐私计算任务提供技术支持。
2024-09-03 22:40:22
301
原创 基于区块链的感知数据交易隐私保护方案
在收集数据时,使用随机应答机制模型下的差分隐私对用户的数据进行加噪,可根据不同的数据特性选择相应的处理算法,不需要可信的第三方就可以获得接近CDP的隐私保护效果。因此,用户不需要信任服务器。其中,Pr[y|v]表示依赖于v的真实值形成的分布, Uni([k])是均匀随机分布,并且Pr[Uni([k])=y]=1/k,n个用户中,除第n个用户外,其余n-1个用户的输出可以看作包含一些均匀噪声,这些噪声使输出具有不确定性,v∈[k]噪声服从Bni(n−1,γ/k),即服从 Bni(n−1,1eεl+k−1)。
2024-09-03 22:38:02
837
原创 表现性语音合成综述
摘要语音合成是语音、语言和机器学习领域的一个热门研究课题,旨在合成给定文本的可理解和自然的语音,在工业中有广泛的应用。语音合成的目标之一是合成自然的语音,而目前的语音合成在情感、韵律等方面还有很大的改进空间。对表现性语音合成进行了全面的调查,旨在更好地了解当前的研究现状和未来的趋势。对近年来基于情感及韵律的表现性语音合成进行了全面的总结、比较和分析。首先介绍了普通语音合成的传统实现方式及瓶颈;然后引入表现性语音合成并描述表现性语音合成在情感、韵律等方面为语音合成自然化带来的增益;最后对表现性语音合成进行了展
2024-09-03 22:00:18
362
原创 融合光谱度量标记迁移和Tri-training的高光谱遥感图像半监督分类算法
基于此,本文充分利用光谱相似性、光谱信息量的差异性以及高光谱遥感影像的空间特征,通过集成Tri-training算法,提出了融合光谱度量标记迁移和Tri-training的高光谱遥感图像半监督分类算法,通过定义光谱度量来刻画样本之间的相似性,将基于光谱度量的标记迁移和Tri-training的基分类器相结合,减少错分样本进入训练集的风险。该算法充分利用高光谱遥感图像的光谱和空间特征,通过光谱度量标记迁移修正Tri-training算法来扩充样本的类标记,降低扩充样本的错分率,进而提高半监督分类算法的精度。
2024-09-03 21:57:37
349
原创 基于用户交互体验的品牌数字化传播评估模型
消费者对产品品牌的情感关系到产品品牌传播的效果,本文总结为品牌情感;本文在现有的产品视角研究基础之上,引入用户中心化的交互情感因素,兼顾产品和用户两个维度,综合考量品牌信息测度、品牌情感与用户意愿,基于交互情感视角进行品牌传播评估模型的建立,弥补了现有研究在用户情感视角方面的不足。基于交互情感的品牌数字化传播效果的研究,从产品和用户两个维度发掘当前品牌传播中存在的问题与缺陷,指导构建地标产品在客户侧的价值认同,有利于帮助地标品牌取长补短,更加精准地进行品牌建设投入,使品牌更加深入人心,促进商品的销售。
2024-09-03 21:54:38
241
原创 数据要素价值化发展路径与对策研究
要更好地发挥数据要素价值,需通过技术手段及市场机制对数据要素进行“化学”反应,即通过成熟的隐私计算、区块链、大数据等技术手段,对数据要素(包括政府数据、行业数据、企业数据、个人数据等)进行深度的价值挖掘和处理,有价值的数据通过数据交易中心/数据商城实现规范化确权和资产化交易等,进而实现数据要素的经济价值、社会价值、政治价值和人文价值等,为实现我国数字经济高质量发展提供动力。目前,数据要素市场已经开始了数据资本化的创新试点探索,总结起来主要包括以下4种模式:数据证券化、数据质押融资、数据银行和数据信托。
2024-09-03 21:53:05
422
原创 城市疫情态势发展与动态调控可视分析
情感词典包括SnowNLP库和自定义情感库。设此时有A、B、C、D 4个方舱,为患者S1规划距其最近而负载量不大的方舱D,患者S2虽距方舱A较近,但由于A负载量较大,系统为其规划路线送往方舱B,方舱B虽比方舱C负载量更小,但由于患者S3患病程度权重较大,系统为其规划距离较近的方舱C。对于单个患者的路径规划,假设G=(V,E)表示一个方舱医院位置分布图,其中V表示节点集合(包括患者所在位置),E表示患者所在位置与方舱医院形成的边集合,其中 (u,v)∈E,每条边的权重应有多种度量参数,不只是单一的距离问题。
2024-09-03 21:49:53
443
原创 基于深度学习的施工安全隐患整改智能推荐系统
摘要水利工程施工安全隐患治理正向信息化与智能化转型,为了高效地从大量非结构化的施工安全隐患数据中挖掘出有价值的潜在信息,提出了基于深度学习的施工安全隐患整改智能推荐系统。该算法基于词频逆向文档频率算法,提取施工安全隐患的特征词,构建安全隐患关联桑基图,展示施工标段、隐患特征、隐患类型之间的信息流动特征;基于FP-Growth算法挖掘历史数据中的关联规则;结合序列相似度匹配(sequence similarity matching,SSM)算法和Doc2Vec模型,优化案例检索推荐的过程。该算法利用珠江三角洲
2024-09-03 21:46:39
507
原创 数据中台框架与实践
摘要数据中台将一个机构(企业、事业或政府部门)的数据作为战略资产进行管理,是从数据收集到处理应用的一套管理机制,以期提高数据质量,实现广泛的数据共享,最终实现数据价值最大化。给出数据中台的定义,提出数据中台参考技术框架,并分别对物理管理、逻辑管理、数据资产管理、数据服务和信息安全管理的组成和技术进行了展开讨论。最后以华谱系统建设为例,介绍面向家谱大数据、结合HAO智能模型的数据中台实现——华谱数据中台。关键词: 数据中台 ; 数据资产 ; 数据治理 ; 数字化转型随着移动互联网、物联网、云计算等信息技术的快
2024-09-03 21:37:31
1167
原创 长短期记忆网络在虚拟电厂数据中心的应用
摘要可再生能源发电具有间歇性、随机性和不可控性,为绿色能源的充分利用带来了挑战。虚拟电厂数据中心具有高能耗特性,因此成为可再生能源中间歇性(非调度性)电力的高效吸纳与调控手段。基于此,提出了一种通过时间嵌词编码的长短期记忆(long short-term memory,LSTM)网络对虚拟电厂“源荷”双侧状态进行预测的方法。该方法可实现15分钟级的“电力短缺”主动预警,为容器的暂停和备份创造充分的缓冲时间窗口,结合容器技术实现数据中心的动态能耗管理,从而提升了虚拟电厂数据中心应对电力供需失衡的鲁棒性。这对稳
2024-09-03 21:34:24
544
原创 基于图论的产业网络知识图谱挖掘与构建
本文利用“图”这种基本且通用的“语言”和“高保真”的方式构建产业网络图谱,非常直观、自然、直接、高效地描述了产业节点、企业间的纷繁复杂的关系,有效地解决了产业数据量大、散、乱,关系复杂等难题,降低了用户产业链研究的学习成本和时间成本,并可进行产业优化升级与模拟仿真,针对性地保护产业网络弱势节点、优化冗余产业结构,并制定保护性、预防性政策,以保证产业链供应链正常运行。我国是全球产业规模最大、产业覆盖最全的国家,但受多种因素的影响,发现产业链的堵点断点、识别卡点、寻找代替通路、全面优化产业链势在必行。
2024-09-03 21:28:14
366
原创 基于概率分布差异的医学命名实体识别方法
然而医学领域的样本标注成本很高,严重限制了模型性能的提升。该算法通过比较已标注样本与待标注样本的实体类别分布差异度来量化样本的标注价值,将标注聚焦在低召回率的样本上,并通过循环迭代训练来不断增强模型的性能。假设样本类别数据服从高斯分布,通过现有的n条已标注的数据集L的标注结果,获取每条样本的不同类别的数量[xic,xib] ,i 表示样本的标号,xib是第i条样本中出现检查部位类别实体的数量,xic是第i条样本中出现检查方法类别实体的数量,分别统计检查部位和检查方法两类医学实体在每条样本中出现的次数X。
2024-08-25 19:19:47
95
原创 PARIS原则:开放协作环境下科学数据的可用性
但应注意到,FAIR、TRUST等原则更多关注的是科学数据的开放与共享,实现了科学数据的“不可见→可见→可用”,但仍无法有效解决科学数据及其服务目前普遍存在着的分布式、孤岛化、差异化、权益约束等问题,无法实现科学数据的“可用→可协作”,无法有效满足“第四范式”“融合科学”等新型科研范式提出的“跨边界、端到端、动态性和协作化”的科学数据利用需求。随着FAIR、TRUST原则的推出,科学数据的开放共享得到了较大的进展,作为科学数据汇聚、存储、服务的主体,科学数据中心日益发挥出更重要的作用。
2024-08-25 19:17:34
158
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人