自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1313)
  • 收藏
  • 关注

转载 面向教育场景的视觉大模型优化与应用

许跃蓬1,2 徐柴迪3 郭晋军1 姜云桥4 王仕嘉1 刘垚1,2,5(1. 华东师范大学数据科学与工程学院,上海 200062;2. 先进计算与智能工程国家级重点实验室,江苏 无锡 214000;3. 上海孔棣科技有限公司,上海 201204;4. 摩尔线程智能科技(成都)有限公司,四川 成都 610031;5. 软硬件协同设计技术与应用教育部工程研究中心(华东师范大学),上海 200062)摘 要 随着人工智能技术的迅速发展,大语言模型在许多领域取得了显著成功,但在教育领域的应用仍面临多模态数据处理困难、

2025-12-15 16:17:05 28

转载 CrownCom2025 Call for papers

大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。认知无线电与工业互联网、情感计算、定位技术交叉领域的相关标准与倡议;

2025-12-12 16:16:46 7

转载 《大数据》创刊十周年纪念座谈会暨第三届编委会第四次会议顺利召开

大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。十载奋进,春华秋实。,对《大数据》十年来取得的成绩表示了肯定和赞扬,

2025-12-03 16:16:54 25

转载 基于知识增强大语言模型的历史学科试题生成系统

随着大语言模型的问世,其凭借强大的语言能力和推理能力能够模仿教师的题目设计方法,对出题材料进行分析并生成相应题目,并通过自我检查保证生成题目的质量。随着大语言模型的兴起,研究者们逐渐采用更加灵活的方式,将知识图谱的信息通过提示词(prompt)的形式输入大语言模型,从而增强其知识基础,缓解模型生成时的“幻觉”现象,并提升模型在特定领域,尤其是教育领域中的应用效果。知识图谱检索模块利用知识图谱中的丰富历史关系信息对大语言模型进行增强,补齐大语言模型的专业知识并使生成的题目更加多样,满足教师的使用需求。

2025-12-02 16:16:29 47

转载 首发!支撑教育数字化转型的平台:现状与愿景

余理娜1,2 高明2,3 董启文2,3 周傲英2,3(1. 贵州睿秀科技有限公司,贵州 贵阳 550025;2. 贵州筑文华东师大数据动力研究院,贵州 贵阳 550025;3. 华东师范大学数据科学与工程学院,上海 200062)摘 要 教育数字化转型是一场深刻的自我革命,本质上是从以教师教学管理为中心的信息化转变为以学习者体验为中心的数字化,是从关注技术本身到关注数据价值的思维转变。本文通过对国内外主流数字教育平台的功能进行对比分析,揭示了当前平台在技术、应用和理念方面的局限性。在此基础上对当前在线教育进

2025-11-27 14:44:03 201

转载 首发!关于数据要素学科建设的深度思考

周傲英(华东师范大学数据科学与工程学院,上海 200062)摘 要 数据作为第五生产要素是重大的理论突破。数据生产要素与土地、资本等传统生产要素相比,数据具有非稀缺性,数据越用越多、越用越有价值。当前的人工智能是数据智能,是联结主义的胜利,本质上是数据驱动的智能的自动化。数据智能热意味着整体论作为科学研究方法论的复兴,新的科学发现将不仅仅局限于还原论范式。数据是互联网的底层逻辑,党管互联网落实在操作层面就是党管数据。国家数据局成立两年来,在数据基础制度和数据基础设施等方面开展了全面的探索,迫切需要学术界和科

2025-11-24 11:13:48 37

转载 编委风采 | 祝贺《大数据》编委吴枫当选中国工程院院士

新当选的中国工程院院士中,机械与运载工程学部11人,信息与电子工程学部9人,化工、冶金与材料工程学部10人,能源与矿业工程学部12人,土木、水利与建筑工程学部7人,环境与轻纺工程学部6人,农业学部8人,医药卫生学部8人。新当选的中国科学院院士中,数学物理学部14人,化学部11人,生命科学和医学学部13人,地学部9人,信息技术科学部11人,技术科学部15人。本次增选后,中国科学院共有院士908位。中国科学院、中国工程院21日公布2025年院士增选结果,分别选举产生中国科学院院士73人,中国工程院院士71人。

2025-11-21 10:57:49 41

转载 基于对比学习的数学应用题求解方法研究

通过分类器来监督生成的表达式与问题文本之间的一致性,确保模型生成的表达式更加精准。此外,本文引入对比学习方法,通过对比损失函数优化编码器的问题表示,即在最大化原型方程相同MWP表示间相似度的同时,最小化不同类型MWP表示间的相似度,增强编码器对原型方程相同MWP表示间相似性和不同类型AWP表示间差异性的感知能力,从而提高模型对多种类型MWP的求解效果。此外,当前的求解模型还会忽略自然语言中蕴含的深层数学逻辑,无法处理题目描述相似的MWP之间的细微差别,从而无法推导出正确的求解表达式,影响求解的准确性。

2025-11-20 16:16:48 44

转载 杉杉:面向高吞吐低延迟服务的计算机公共课问答系统

杨贇 刘天扬 王硕 苏斌 蒲鹏 陆雪松(华东师范大学数据科学与工程学院,上海 200062)摘 要 基于大语言模型的自然语言处理能力在智能问答场景展现出了广泛的应用潜力。为了给高校学生提供个性化的计算机学习支持,构建了一种基于代码大语言模型的计算机公共课问答系统“杉杉”。该系统采用前后端分离的结构设计,通过消息队列向大语言模型发送用户指令并监听模型返回结果;利用大语言模型的语言理解和生成能力,自动解答学生提出的计算机相关问题,并采用连续批处理和检索增强生成技术进行优化。性能评估实验表明,该系统在并发性能、响

2025-11-17 16:16:20 74

转载 基于重排序和后检索反思的教育大模型问答增强方法

在此基础上,提出基于重排序和后检索反思的教育大模型问答增强方法。本文提出的基于重排序和后检索反思的教育大模型问答增强方法在CS-Bench数据集的实验中取得了良好的结果,在使用多个不同生成模型时均使大模型回答正确率提升了5%左右,缓解了“幻觉”问题,并使大模型在计算机问答中更准确。其原因为外置知识库补充了大模型的知识细节,重排序对知识库信息进行了精细过滤,减少了无关材料对模型生成的干扰,后检索反思根据知识库提供的辅助材料,修正了生成过程中出现的部分“幻觉”,从而提升了大模型回答的准确性。

2025-11-13 16:38:54 26

转载 建设数据市场监管体系,推进数据统一大市场繁荣发展

叶雅珍,女,博士,复旦大学计算与智能创新学院教师,上海市数据科学重点实验室数据资产研究室主任,复旦大学数据产业研究中心主任助理,上海数据研究院特聘研究员,浙江省数据知识产权研究基地智库专家。数据产品生产再生产时,除了需要数据要素来源合法合规外,还需要生产制造商在生产数据产品时严格遵守国家的各类法律法规和标准要求,具备数据合规、质量控制、数据安全等技术能力,取得相应的数据产品生产资质,特别是一些涉及国家安全、市场秩序、个人隐私等特定行业领域的数据,更需要专门获得相关部门的数据生产制造授权许可。

2025-11-10 16:16:41 39

转载 基于数据知识产权体系的数据要素流通交易模式研究与实践

同时,本文对数据知识产权登记和数据要素流通交易的现状进行了分析和阐述,数据经济的全面健康发展需要依托于数据知识产权的确权和交易,但当前阶段仍存在平台分散、客体不统一、数据要素跨地域流通困难等问题,亟须整合现有分散的登记交易系统,构建全国统一的数据知识产权登记交易平台,制定统一的登记标准,提供从数据评估、登记、交易到结算的全链条服务,破除阻碍数据要素流通的确权难、交易难、互信难、监管难等问题,提高数据交易的效率和安全性。数据产品阶段,基于数据集合的加工使用权,数据处理者对数据产品享有独立的所有权。

2025-11-03 16:16:57 42

转载 数据知识产权改革实践——以浙江省为例

黄灿1,2 范理3 樊梅妍1,2(1. 浙江大学管理学院知识产权管理研究所,浙江 杭州 310058;2. 浙江省数据知识产权研究基地,浙江 杭州 310058;3. 浙江省知识产权研究与服务中心,浙江 杭州 311121)摘 要 为加快推进数据知识产权制度建设,对相关理论研究进行了回顾、评析,并以浙江省为例对数据知识产权改革经验进行提炼。理论层面上,学术界对数据的概念、数据权确认及其分配与解置形式进行了深入探讨,并强调了当前数据知识产权登记制度应当关注的问题。实践层面上,作为国家首批数据知识产权试点地方,

2025-10-31 16:17:07 30

转载 【专题征文】《大数据》专题“全国一体化数据市场”征文(截稿时间:2026年1月31日)

大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。3、投稿时,请注明作者联系方式(电子邮件、电话、邮寄地址)及“‘

2025-10-30 16:16:26 24

转载 数据知识产权登记制度的形成逻辑、实践问题与改进路径研究

数据被视为“信息时石油”。2022年12月19日,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)提到,要“建立保障权益、合规使用”的数据产权制度,将数据产权“三权分置”,划分为数据资源持有权、数据加工使用权、数据产品经营权。认为,可以借鉴自物权-他物权和著作权-邻接权的权利分割模式,在数据权利体系设计上,根据不同主体对数据形成的贡献来源和程度的不同,设定数据原发者拥有数据所有权与数据处理者拥有数据用益权的二元权利结构,以实现用户与企业之间数据财产权益的均衡配置。

2025-10-27 16:16:36 43

转载 数据知识产权保护的规则设计

范理(浙江省知识产权研究与服务中心,浙江 杭州 311100)摘 要 通过知识产权部门法的比较研究,从知识产权一般原理和规则出发,论证数据知识产权概念的适格性,厘清数据知识产权与数据产权、数据产品、数据知识产权构建方案等概念的区别。分析了数据知识产权与数据“三权分置”的关系,从鼓励数据流转使用角度分析数据知识产权制度的适用性,梳理数据知识产权持有者的权益。结合知识产权制度发展和案例,提出对“依法依规获取、经过一定规则处理、具有实用价值、智力成果属性、数据集合”要件的理解,数据知识产权登记的指导原则、登记审查

2025-10-20 16:16:30 59

转载 数据生产的创造性劳动的几种可能类型

叶雅珍1,2 朱扬勇1,2,3(1. 复旦大学计算与智能创新学院,上海 200438;2. 上海市数据科学重点实验室,上海 200438;3. 上海数据研究院,上海 200011)摘 要 近年来,数据知识产权实践快速发展,但在理论界还存在较多争论,其中之一便是数据生产过程中是否包含创造性劳动,这是判断一个数据集能否被赋予知识产权的关键因素之一。针对原始数据生产和数据再生产两个方面,分析讨论了其中包含的可能的创造性劳动,分别提出了原始数据生产和数据再生产的4种可能的创造性劳动,为当前数据知识产权登记过程中实质

2025-10-16 16:16:42 64

转载 《大数据》2025年第5期目次&摘要

点击上方蓝字关注我们《大数据》第11卷第5期 2025年9月大数据2025年第5期(点击原文链接在官网阅读完整文章)目次01 《大数据》十周年寄语马礼,王晓光02 基于重排序和后检索反思的教育大模型问答增强方法孙浩然, 王志豪, 吴一帆, 高晓影, 向阳03 杉杉:面向高吞吐低延迟服务的计算机公共课问答系统杨贇, 刘天扬, 王硕, 苏斌, 蒲鹏, 陆雪松04 基于对比学习的数学应用题求解方法研究张天成, 王玉杨, 张亦嘉, 于明鹤, 冷芳玲, 于戈05 基于知识增强大语言模型的历史学科试题生成系统纪天昀,

2025-10-13 16:17:10 59

转载 数据知识产权: 将知识产权扩展到网络空间

叶雅珍1,2 朱扬勇1,2,3(1. 复旦大学计算与智能创新学院,上海 200438;2. 上海市数据科学重点实验室,上海 200438;3. 上海数据研究院,上海 200011)摘 要 数据知识产权作为数据产权制度的重要内容而广受关注。虽然数据知识产权实践如火如荼,但是否需要设立数据知识产权、如何设立数据知识产权在学术界尚存争议。分析讨论了数据形式的知识产权的存在性,给出了可赋数据知识产权的3种数据集类型,从新的保护客体、新的甄别方法、新的保护手段三方面论述了新设数据知识产权的必要性,提出了一个数据知识产

2025-10-10 16:16:36 89

转载 基于One-Class学习的鲁棒音频真伪识别

梁子琪1,2 张旭龙1 王健宗1 肖京1(1. 平安科技(深圳)有限公司,广东 深圳 518063;2. 中国科学技术大学先进技术研究院,安徽 合肥 230026)摘 要 深度伪造技术对社会经济、政治稳定和社会安全构成了严重威胁,而深度伪造中,语音伪造技术被广泛应用于电话诈骗、舆论操控等危害性活动中。近年来,随着深度学习技术的应用,语音合成和语音转换技术飞速进步,已经能够生成以假乱真的语音,足以欺骗机器和人类。针对语音伪造技术的危害,目前已经有许多语音欺骗检测技术来提高说话人验证系统的可靠性。然而,现有方法

2025-09-29 16:20:37 122

转载 基于5W传播模型的技术体系:计算传播技术综述

王续澎 何洪波 王闰强(中国科学院计算机网络信息中心,北京 100083)摘 要 海量的数据和人工智能技术为传播学的研究提供了很大的便利,可以有效地解决传播效果测量的问题。该领域现有的研究主要关注计算传播学的研究范式、场景应用和发展路径,缺少对计算传播中新型计算方法的梳理和归纳。采取文献调研法,提出了基于5W传播模型的计算方法归类框架,以提升传播效果为目标,较系统地梳理了传播过程中的新型计算方法,阐述了不同计算方法的思路、所需的数据集以及各项评价方法。分析了计算传播技术面临的挑战,展望了未来可能的研究方向。

2025-09-25 16:16:37 137

转载 基于多模态大模型的具身智能体研究进展与展望

赵博涛 亢祖衡 瞿晓阳 彭俊清 张旭龙 王健宗(平安科技(深圳)有限公司,广东 深圳 518063)摘 要 具身智能体指能够根据指令完成某种或多种任务并且具备与物理环境交互能力的智能实体。其在服务机器人、智能教育、辅助医疗等领域具有巨大的潜在应用,是实现通用机器人的重要途径之一。随着多模态大模型的发展,具身智能体具备了更强的语言理解、推理判断和环境感知能力,极大地推动了该领域的发展。近年来,具身智能体领域涌现出许多优秀的研究工作,但缺乏系统的调查评述。为了帮助研究者更全面地了解这一领域,对具身智能体的研究进

2025-09-22 16:16:49 294

转载 山东省推行“无证明之省”赋能数字政府建设研究

侯新玥(山东省大数据中心,山东 济南 250011)摘 要 各地区和政府部门正积极探索数字政府建设的新模式,推进电子证照扩大应用领域和全国互通互认。山东省聚焦深化“放管服”改革,优化营商环境,将建设“无证明之省”作为推动政府数字化转型的重要举措。然而,目前山东省正处在“无证明之省”建设的初期,在探索“无证明”服务过程中还面临一些问题和挑战。为此,分析其中的难点、痛点及堵点,并提出具有针对性的对策建议,旨在加快山东数字政府建设的进程,进一步提升政务服务效能。关键词 无证明之省; 电子证照证明; 数字政府DOI

2025-09-15 16:16:39 77

转载 2025第三届全国工业互联网创新大赛颁奖典礼在宁隆重举行

8月21日上午,由国家自然科学基金委员会信息科学部、江苏省工业和信息化厅指导,未来工业互联网基础理论与关键技术重大研究计划指导专家组主办,中国工业互联网研究院、南京航空航天大学、南京邮电大学、紫金山实验室、南京工业职业技术大学承办,国家自然科学基金委员会科学传播与成果转化中心、江苏省工业互联网发展研究中心、北京海外高层次人才协会协办的“2025第三届全国工业互联网创新大赛颁奖典礼”在南京隆重举行。本届大赛的成功举办,呈现了新工业控制、新工业网络、新工业智能、新工业安全的工业互联网新的发展态势。

2025-08-25 13:23:58 149

转载 【CCF BigData 2025开放注册,早鸟截止8月17日】

CCF大数据学术会议由中国计算机学会(CCF)主办,是我国大数据领域最具影响力、规模最大的高水平学术会议之一,自创办以来已成功举办12届。大会将持续发挥国家级智库作用,汇聚国内外顶尖专家学者与产业力量,助力国家大数据战略实施与数字中国建设。”这一主题指引下,本次大会将聚焦大数据在新技术背景下的创新发展路径,深入探讨数据资源的高效治理、价值释放与安全应用,推动大数据与人工智能技术的协同创新。重磅回归,同时设立多个特色技术论坛,汇聚领域权威专家,深入剖析大数据关键技术突破与前沿发展趋势。

2025-08-05 09:48:00 153

转载 面向云边端协同的数据库预聚合方法研究

崔双双 马若尧 王宏志 (哈尔滨工业大学计算学部,黑龙江 哈尔滨 150001)摘 要 云边端协同架构是智能制造、智慧城市等应用的基础,协同计算是其重要支撑技术。在云边端协同架构下,由于数据类型多样且规模庞大,传统数据管理技术难以支持大规模数据的实时查询。为此,提出一种面向云边端协同的数据库预聚合方法,通过物化视图自动生成策略实现数据预聚合,提升实时查询性能。实验结果表明,该预聚合方法使查询时间最多缩短68.45%,显著提升了云边端协同架构下的数据查询性能。关键词 云边端协同; 物化视图;深度强化学习DO

2025-08-05 09:48:00 137

转载 “地方政府大数据”栏目 视频解读 | 山东省实践

大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。关注《大数据》期刊微信公众号,获取更多内容。

2025-07-18 17:44:48 66

转载 大会日程确认,CCF第40届中国计算机应用大会将在京召开

大会期间还将举办中国计算机应用技术大赛——全国总决赛,“全国智能无人车大赛”、“全国算法精英大赛”、“全国测试开发大赛”等多条赛道将汇聚超过3000人同场竞技,以赛促学,产教融合,协力助推计算机应用赋能新质生产力。围绕可信医学人工智能、智慧气象、可信数据空间、信息系统应用与安全评测、智慧海洋、工业人工智能、AI大模型、期刊编辑面对面、青年学者国际影响力、技术公益等。由中国计算机学会(CCF)主办,CCF计算机应用专业委员会、北京邮电大学、上海师范大学联合承办的。:2025年8月6-9日(不含报道日)

2025-07-17 15:16:49 134

转载 《大数据》2025年第4期目次&摘要

通过知识产权部门法的比较研究,从知识产权一般原理和规则出发,论证数据知识产权概念的适格性,厘清数据知识产权与数据产权、数据产品、数据知识产权构建方案等概念的区别。分析讨论了数据形式的知识产权的存在性,给出了可赋数据知识产权的3种数据集类型,从新的保护客体、新的甄别方法、新的保护手段三方面论述了新设数据知识产权的必要性,提出了一个数据知识产权的定义,以及知识产权从物理空间向网络空间扩展形成数据知识产权的框架,为数据知识产权推进提供了理论支持。罗中岩, 夏正勋, 唐剑飞, 杨一帆, 杨洪山, 李昊骅, 张燕。

2025-07-15 16:30:14 86

转载 SpanTrain:基于云边端异构设备的跨域分布式模型训练系统

王锦权1,2刘旭昭1,2廖晓坚1,2肖利民1,2霍志胜1,2索珈顺1,2李云潼1,2沈润楠1,2,3谢喜龙1,2唐熙程1,2(1.北京航空航天大学计算机学院,北京 100191;2.北京航空航天大学复杂关键软件环境全国重点实验室,北京 100191;3.北京航空航天大学沈元学院,北京 100191)摘 要 目前,除云计算中心外,以物联网、固定或移动计算边缘为代表的边、端侧环境中也部署了大量的智能计算设备。将深度神经网络(DNN)模型的训练任务从云计算中心拓展到边、端侧,在新应用模式支持、数据隐私保护、训练成

2025-07-09 17:04:28 219

转载 面向广域分布式智能计算的运行时算力网络资源协同调度方法研究

本文提出的RCSR方法通过综合考虑资源负载情况、数据访问热度等多重因素,协同调整系统中的任务分配、网络资源分配和数据布局,使系统中的任务执行更加高效,因此RCSR方法相较于对比基准算法具有更优的系统吞吐量性能。可见,在系统负载较小时,即任务数量较少时,数据副本机制带来的额外开销将造成较大的性能损失,此时DRS方法和RCSR方法的全局数据迁移开销达到runData方法的近3倍。然而,随着系统负载的增加,数据副本机制的优势将会更加明显,RCSR方法在全局数据迁移开销性能上与runData方法的差距逐渐缩小。

2025-07-03 17:03:54 160

转载 公共数据分类分级及应用实践研究

数据分类分级进一步明确了数据的价值,合规界定不同类别和级别的数据在市场上的价值差异,通过合理的分类分级确保评估结果的公正性和准确性。通过数据分类分级,数据开发应用能够根据数据敏感级别设置更加合理的模型算法、风险防控措施,在发挥数据价值的同时兼顾数据安全,参赛者更加深入地挖掘数据的潜在价值,发现新的应用场景和解决方案,从而深化数据管理开发利用,推进数据资源的高效率配置、高质量供给,强化公共数据与行业数据深度融合,以业务需求为牵引积极打造应用场景,提升政府治理能力和公共服务水平。第一种为政务数据分级框架体系。

2025-06-25 17:04:50 221

转载 数据产品及其流通监管体系研究

具体地,本文围绕内容、时间和空间质量维度,结合产品流通维度,采用实体关系抽取技术提取盒装数据产品的合规证书、质量证书和外部性说明书等中的质量指标,依据数据质量国际/国家数据质量相关标准,构建涵盖数据内容的有效性、完整性、时效性、数据源的合规性、数据访问的安全性和经济性等指标的多层级、多维度的数据产品质量评价指标体系。数据产品是数据生产与数据再生产、数据再再生产的结果,因此,数据产品流通监管覆盖数据产品生产和流通环节,且每个环节都有相应的监管方法和策略。综上可知,盒装数据是面向数据产品形态而设计的;

2025-06-25 17:04:50 108

转载 面向云边场景的读写均衡键值存储系统

郑宜湉1 张余豪2 霍志杰1 舒继武2(1.厦门大学信息学院,福建 厦门 361102;2.清华大学计算机科学与技术系,北京 100084 )摘 要 基于LSM-tree的键值存储因其高效的数据存储机制,成为云端和边端数据管理的理想选择。但LSM-tree采用的Leveled压实策略具有较高的写放大率,会对前台写性能造成明显的负面影响。如何在降低写放大、进一步提升写性能的同时不牺牲读性能,成为优化LSM-tree面临的一大挑战。针对以上问题,提出一种新型的键值存储系统LooseKV,该系统利用Tiered压

2025-06-25 17:04:50 106

转载 数据产品定价策略:独占式与非独占式定价

也就是说,当数据规模增加没有提升数据产品质量时,应选择“独占式定价”,针对高支付意愿用户,在不影响用户购买意愿的同时占据消费者剩余,既可以避免成本上升,又能获利。也就是说,当数据规模变化对数据产品质量影响适中时,微调数据规模即可满足所有用户的需求,成本增幅小,“非独占式定价”能获得更高利润,数据产品质量增幅与定价和利润成正比。不变的情况下,当数据用户偏好质量更高的数据产品时,数据产品提供方需要提供规模更大的数据产品,并需要提高产品价格,以取得更高的最优利润,且此时社会总福利更高。

2025-06-23 17:01:42 171

转载 面向恶劣天气的航班延误Stacking集成预测模型

软投票法中,每个基分类器预测结果为各个类别的概率值,将所有基分类器的结果求平均,最终概率最高的类别为最终的输出结果;能见度对飞行路径的选择与飞行操作的安全性都有重要影响,气象台的天气预报通常将其划分为1 km、2 km、4 km、6 km、8 km、10 km和10 km以上几个等级,达到10 km及以上的值意味着能见度非常良好,基本不会对航班的正常运行造成不利影响,因此被剔除,而余下能见度等级的样本对航班延误的影响,还需要结合其他航班信息与天气信息进行进一步分析,予以保留。

2025-06-16 17:00:55 173

转载 面向权属治理的分布式数据空间架构模型研究

孙金烨1郭树行2(1.中央财经大学保险学院,北京 102206;2.中央财经大学信息学院,北京 102206)摘 要当前,我国有关权属治理的顶层制度有待体系化完善,并且存在交易机制不健全、数据流通共享水平较低等问题,阻碍数据要素市场化进程,抑制其价值充分释放。基于上述背景,首先,从价值网理论、生态协同理论、架构者理论和金融信托理论4个视角探究了跨领域数据流转的权属治理理论基础;其次,结合分布式架构理论和动态能力理论,创新性地提出了面向数据授权运营商的基于跨领域协同视角的分布式数据空间架构模型;最后,结合交通

2025-06-12 09:01:05 84

转载 StabilizeNet:用于缓解时间序列非平稳性的新型框架

安俊秀万里浪(成都信息工程大学软件工程学院,四川 成都 610225)摘 要 时间序列预测在现代生活中广泛应用于众多领域,其重要性日益凸显。非平稳性是影响时间序列预测准确性的主要问题之一。时间序列数据的统计特性随时间变化,导致从历史数据中学习的规律难以被稳定地应用于未来预测,从而增加了预测的难度和不确定性。针对该问题,提出了一种新型框架StabilizeNet,旨在减少时间序列数据的非平稳性。该框架包括中心化和尺度变换、线性变换及逆序变换3个部分,通过引入可学习的归一化线性变换矩阵,优化数据的信息保留,并增

2025-06-09 17:03:28 117

转载 有限标签下的非平衡数据流分类方法

可知,在发生突变型、重复型、增量型和逐渐型概念漂移时,采用重构机制的算法(IDS-ELM、CALMID和OALM-IDS)的分类精确率可快速提升,这是由于分类器在发生概念漂移之后重新训练,可以更快地适应概念漂移,由于WOSELM和AI-WSELM没有应对概念漂移的机制,在发生概念漂移之后,分类精确率明显下降。提出了基于概念漂移指数的分类器的更新与重构机制。基于信息熵的方法虽然考虑了所有的预测概率的分布,但忽略了在评价样本预测的确定性时,预测概率大的值之间的差异要比预测概率小的值之间的差异更重要。

2025-06-04 17:01:27 111

转载 语言模型增强的引文网络连边因子挖掘

王慜懋1,2 赵洪科1,2 吴李康1,2 焦之贤3 黄振亚4(1.天津大学管理与经济学部,天津 300072;2.天津大学复杂管理系统实验室,天津 300072;3.北京大学光华管理学院,北京 100871;4.中国科学技术大学认知智能国家重点实验室,安徽 合肥 230026)摘 要 GNN可以有效聚合图结构数据中邻近节点的信息以学习节点表征,在引文网络数据挖掘领域展现出了巨大的潜力。然而,现有的大多数GNN在捕获连边信息的驱动因子方面缺乏深入探索,这限制了对节点间复杂关系的深入理解和解释。例如,不同论文之

2025-05-28 17:02:37 163

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除