数据挖掘前沿发展与未来论坛召开,产学研一体化成焦点

阿里巴巴集团、中国中文信息学会及KDDChina联合主办的数据挖掘前沿发展与未来论坛于6月29日在杭州举行,吸引了近300名专家学者到场及近30000人在线观看。论坛聚焦数据挖掘领域的最新科研成果,探讨学术与产业的合作路径。

6月29日,由阿里巴巴集团、中国中文信息学会、KDD China联合主办的数据挖掘前沿发展与未来论坛在杭州举行,会议吸引了来自国际顶级高校和知名企业的近300名专家学者到场参会、近30000人在线观看。论坛除了分享最新的数据挖掘领域最新科研成果及研发思路外,来自国际知名企业、高校的代表还针对学术与产业如何互动合作展开了热烈的讨论。

中国中文信息学会社会媒体处理专委会主任、哈尔滨工业大学计算机学院刘挺教授现场表示,前沿技术落地一个很重要的方式就是通过校企合作,高校没有大数据,没有和用户交互的宝贵数据,如果闭门造车,研究成果并不能对企业产生帮助,不能很好的落地。如果企业和高校能共同研究,甚至一起承担国家级项目,可以达到双赢的目的,通过校企合作共同推进发展。

0?wx_fmt=png

图为中国中文信息学会社会媒体处理专委会主任、哈尔滨工业大学教授、计算机学院副院长刘挺

事实上,校企双方在做前沿技术研究时正在面临不同维度的问题,这也是产学研一体化目标提出的基础。蚂蚁金服人工智能部技术总监李小龙表示,从工业界讲,深度学习目前还有一些难以克服的问题,比如风险模型,为什么不给这个人贷款,用深度学习没法做到,还有芝麻信用分,为什么他的高,为什么他的低,这个也是实际应用中必须认识到深度学习还是有缺陷的。清华大学计算机科学与技术系副教授崔鹏认为,深度学习之外其他的一些前沿方法,之所以没有在产业界推广开,一方面可能的原因是理论门槛过高,怎么在可控的条件内去调整它,不容易标准化;另一方面是技术发展到一定程度,比如说刷榜刷到顶了,就需要具备其他理论基础的人来进一步研究。阿里巴巴iDST(Institute of Data Science & Technologies,数据科学与技术研究院)负责人金榕现场分享了将Robust优化理论和双边匹配理论应用于阿里电子商务平台中的技术商业化案例,引起了广泛讨论。

0?

图为阿里巴巴iDST负责人金榕与现场观众互动

近些年,随着阿里业务场景的不断丰富、业务体量的不断攀升,数据已经成为阿里技术中最关键的环节,如何用技术处理海量的数据,完成实时的业务需求,以及人货场的数据匹配,保护好数据安全,是阿里业务发展中的关键问题。在2017国际知识发现与数据挖掘大会(KDD)阿里集团和蚂蚁金服共有5篇论文中选被收录,涵盖深度学习、大规模图计算、商品智能排序等多个研究领域,这些前沿的学术成果正是在解决阿里商业体运转过程中出现的各类数据问题而凝结沉淀的。阿里在用技术拓展商业边界的同时,也在反哺学术界,开拓学术界技术创新的视野。

0?wx_fmt=png

图为阿里巴巴集团技术发展部总监刘湘雯

当前,阿里正在积极探索产学研一体化并取得了系列成果,5月和浙江大学签署战略合作,成立“阿里巴巴-浙江大学前沿技术联合研究中心”,以双聘制引入学界人才配合阿里在人工智能、泛在信息安全、无障碍感知互联等前沿技术领域开展研究;引进国立台湾大学卓越教授、IEEE FELLOW、AAAI FELLOW以及ACM FELLOW林智仁作为技术顾问一起参与前沿技术的研发。阿里巴巴集团技术发展部总监刘湘雯在数据挖掘前沿发展与未来论坛上透露,阿里将在7月正式启动AIR计划,把未来1-2年阿里关注的话题和项目公开出去,期待老师们用学术力量来支持这些技术的发展。专家认为,阿里此番启动AIR计划,将吸引更多高端人才聚合到这家商业巨无霸周围,对促进前沿技术走出实验室,加速商业化落地,推动产学研一体化发展起到重大作用。

计及源荷不确定性的综合能源生产单元运行调度容量配置优化研究(Matlab代码实现)内容概要:本文围绕“计及源荷不确定性的综合能源生产单元运行调度容量配置优化”展开研究,利用Matlab代码实现相关模型的构建仿真。研究重点在于综合能源系统中多能耦合特性以及风、光等可再生能源出力和负荷需求的不确定性,通过鲁棒优化、场景生(如Copula方法)、两阶段优化等手段,实现对能源生产单元的运行调度容量配置的协同优化,旨在提高系统经济性、可靠性和可再生能源消纳能力。文中提及多种优化算法(如BFO、CPO、PSO等)在调度预测中的应用,并强调了模型在实际能源系统规划运行中的参考价值。; 适合人群:具备一定电力系统、能源系统或优化理论基础的研究生、科研人员及工程技术人员,熟悉Matlab编程和基本优化工具(如Yalmip)。; 使用场景及目标:①用于学习和复现综合能源系统中考虑不确定性的优化调度容量配置方法;②为含高比例可再生能源的微电网、区域能源系统规划设计提供模型参考和技术支持;③开展学术研究,如撰写论文、课题申报时的技术方案借鉴。; 阅读建议:建议结合文中提到的Matlab代码和网盘资料,先理解基础模型(如功率平衡、设备模型),再逐步深入不确定性建模优化求解过程,注意区分鲁棒优化、随机优化分布鲁棒优化的适用场景,并尝试复现关键案例以加深理解。
内容概要:本文系统分析了DesignData(设计数据)的存储结构,围绕其形态多元化、版本关联性强、读写特性差异化等核心特性,提出了灵活性、版本化、高效性、一致性和可扩展性五大设计原则。文章深入剖析了三类主流存储方案:关系型数据库适用于结构化元信息存储,具备强一致性高效查询能力;文档型数据库适配半结构化数据,支持动态字段扩展嵌套结构;对象存储结合元数据索引则有效应对非结构化大文件的存储需求,具备高扩展性本优势。同时,文章从版本管理、性能优化和数据安全三个关键维度提出设计要点,建议采用全量增量结合的版本策略、索引缓存优化性能、并通过权限控制、MD5校验和备份机制保障数据安全。最后提出按数据形态分层存储的核心结论,并针对不同规模团队给出实践建议。; 适合人群:从事工业设计、UI/UX设计、工程设计等领域数字化系统开发的技术人员,以及负责设计数据管理系统架构设计的中高级工程师和系统架构师。; 使用场景及目标:①为设计数据管理系统选型提供依据,合理选择或组合使用关系型数据库、文档型数据库对象存储;②构建支持版本追溯、高性能访问、安全可控的DesignData存储体系;③解决多用户协作、大文件存储、历史版本管理等实际业务挑战。; 阅读建议:此资源以实际应用场景为导向,结合具体数据库类型和表结构设计进行讲解,建议读者结合自身业务数据特征,对比分析不同存储方案的适用边界,并在系统设计中综合考虑本、性能可维护性之间的平衡。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值