『DavyYew』[SD2.0大会]王坚:Data–centric Computing

本文探讨了互联网作为基础设施的发展,包括数据中心成为计算机、计算成为公共服务的趋势。分析了数据密集型计算的重要性及面临的挑战。

原文链接:http://blog.youkuaiyun.com/DavyYew/archive/2009/10/22/5509209.aspx

 

作者:DavyYew

 

 

1969年

APAR网仅有4个节点
人类登月
一、未来会很不同

PC会不同
Software会不同
Internet会不同
Software is Different

Value of 传统软件
功能
Data-driven software(service)
Release cycle
Internet is Different

当人类有了火:互联网不单单是技术
Biggest computing platform
connect resources
Biggest database ever and growing
connect data
Biggest social network
connects people
Most vibrant marketplace
connects supply & demand
二、计算的趋势

Internet as infrastructure 互联网成了基础设施
Data center is the computer 数据中心成了一台计算机
Computing as utility 计算成了公共服务
Internet as infrastructure

SaaS
Software + Infra + Data = Internet Services

Internet service disruption
AD-支持的商业模式

Data Center is the computer

Moore定律在进一步缩小化
Ubiquity of broadband and wireless
Computing as utility

Data-intensive computing

Data as an important part of the services
Need to managae and process lots of data
Internet apps
Web Search,
Digital AD
Map service
etc
Providing a computing platform for data-intensive business
How many data you can process in your data center?
Data–centric Computing

Scale of web data
Billions of query per day
Green Technology is our commitment

Road ahead

Making data-intensive computing commodity
Data driven internet economies
Making data-centric computing utility
Write your code for thousands of machines
Q&A

Q:会考虑自己创业吗?
A:’规模化’。Cloud Computing 不是一个人能做的,而是需要几千人聚集在一起,静心做。
Q2:ALIBABA最大的竞争对手是谁?
A:笔和纸

Nano-ESG数据资源库的构建基于2023年初至2024年秋季期间采集的逾84万条新闻文本,从中系统提炼出企业环境、社会及治理维度的信息。其构建流程首先依据特定术语在德语与英语新闻平台上检索,初步锁定与德国DAX 40成分股企业相关联的报道。随后借助嵌入技术对文本段落执行去重操作,以降低内容冗余。继而采用GLiNER这一跨语言零样本实体识别系统,排除与目标企业无关的文档。在此基础上,通过GPT-3.5与GPT-4o等大规模语言模型对文本进行双重筛选:一方面判定其与ESG议题的相关性,另一方面生成简明的内容概要。最终环节由GPT-4o模型完成,它对每篇文献进行ESG情感倾向(正面、中性或负面)的判定,并标注所涉及的ESG具体维度,从而形成具备时序特征的ESG情感与维度标注数据集。 该数据集适用于多类企业可持续性研究,例如ESG情感趋势分析、ESG维度细分类别研究,以及企业可持续性事件的时序演变追踪。研究者可利用数据集内提供的新闻摘要、情感标签与维度分类,深入考察企业在不同时期的环境、社会及治理表现。此外,借助Bertopic等主题建模方法,能够从数据中识别出与企业相关的核心ESG议题,并观察这些议题随时间的演进轨迹。该资源以其开放获取特性与连续的时间覆盖,为探究企业可持续性表现的动态变化提供了系统化的数据基础。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值