谷歌、微软、Meta?谁才是 Python 最大的金主?

Python软件基金会(PSF)2021年的年度报告显示,维护Python项目每年需约200万美元,主要来自赞助商如谷歌、微软和Meta等公司的支持。这些资金用于基础设施、开发者支持和社区活动,促进Python语言的发展与推广。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

你知道维护 Python 这个大规模的开源项目,每年需要多少资金吗?

答案是:约 200 万美元!
PSF(Python 软件基金会)在 2022 年 6 月发布了 2021 的年度报告,其中披露了以下这份支出明细(单位:千美元):

图片

总支出金额 196 万美元,基本与 2020 年持平,不知道这个数额有没有超出你的预期呢?

另外,在收入方面,2021 年总收入为 271 万,因此年度净结余为 75 万。(PS.加上之前的资产,目前基金会还有 506 万~)

PSF 是一个独立的非营利性机构, 致力于促进 Python 语言的发展与推广、促进 Python 国际化多元化社区的繁荣。虽然不以营利为目标,但不可否认的是,它也有着一笔不菲的金钱诉求:有更多的收入,才能实现更大的目标,才能发挥出基金会的更大价值。

比如,尽管 PSF 在 2001 年就成立了,但是,直到 20 年后,它才拥有了第一位全职的开发者!也就是说,长久以来,基金会的其他成员及核心开发者们都只是兼职或志愿者!

将来若有更多收入的话,PSF 很有可能会再次扩员全职的开发者,必然能创造出更多的可能性!
在这里插入图片描述

(2021年在“Program Service”单项上的支出)

既然 PSF 开销不小,诉求也大,那么,它目前的资金是怎么来的呢?

PSF 主要的资金来源是大大小小的金主所赞助,比如,JetBrains(Pycharm 出自这家公司)恰巧正在为 PSF 举行年终筹款。通过以下链接可以 7 折购买 Pycharm Pro,全部销售额将捐献给 Python。

JetBrains
活动(2022.11.22结束):https://blog.jetbrains.com/zh-hans/pycharm/2022/11/jetbrains-pycharm-python

PSF 将赞助者们分成了七类:远景的(Visionary)、持续的(Sustainability)、保持的(Maintaining)、贡献的(Contributing)、支持的(Supporting)、伙伴的(Partner)、联合的(Associate)。
在这里插入图片描述

标题中的谷歌、微软、Meta 都是 PSF 最高级别的远景赞助者。但是,谁才是 Python 最大的金主呢?

下面,我将根据相关新闻资讯,梳理大家比较感兴趣的这三家公司对 PSF 的赞助。

谷歌从 2010 年起成为 PSF 的赞助者,在 2021 年 2 月成为首个远景赞助者(赞助 35 万美元,以及其它资源)。资金主要用于提升 Python 生态的供应链安全,资源主要为 Google Cloud 的产品:

  • 开发用于检测 PyPI 恶意软件的产品
  • 改善 Python 的基础设施工具与服务
  • 2021 年资助 CPython 一名常驻开发者(Developer-in-Residence),他全职分析 CPython
    项目的维护优先级,帮助解决积压的工作
  • 赞助谷歌云基础设施,比如用于 Pypi 的云存储,谷歌云公开数据集(Google Cloud Public Datasets)支持
    Pypi 的下载统计、项目元数据查询分析

除此之外,谷歌还参与赞助了 Python 的各类活动,比如,2022 年 10 月为期 5 天的核心开发者 sprint 活动

图片

(2022年核心开发者 Sprint 活动合影)

微软从 2006 年起成为 PSF 的赞助者,在 2021 年 4 月成为远景赞助者(赞助 15 万美元,以及其它资源)。

  • 资助打包工作组,助力改善 PyPI 和打包生态
  • 包括 Guido van Rossum 在内的 6 人团队,兼职为 Faster CPython 项目作贡献
  • 雇用了 Python 生态系统中关键开源项目的几个核心贡献者和维护者
  • 通过 VS Code 相关插件、pyright、Azure 相关服务等,为 Python 社区作贡献

其中比较瞩目的是包括 Python 之父在内的豪华开发团队,可以通过微软发布的 《A Team at Microsoft is Helping Make Python Faster》 了解这支团队以及正在做的事。(正在开发 3.12,可查阅《Python 3.12 Goals》)

除此之外,微软也是各类活动的主要赞助方之一,比如 2022 年 10 月的一场 Hacktoberfest ,比如 2019 年的核心开发者 sprint 活动

图片

(2019年核心开发者 Sprint 活动合影)

Meta(即 Facebook)在 2022 年 3 月成为远景赞助者(赞助 30 万美元)。

  • 资助 2022 年的 Developer-in-Residence
  • 通过 Cinder 解释器给上游贡献,提升 CPython 解释器性能
  • 维护和支撑 PyPI,管理 Python 知识产权,提供托管 Python 发行版的基础设施

同样地,Meta 也是 Python 各类活动的主要赞助方之一,比如,2016 年 9 月的第一期核心开发者sprint 活动,这为之后每年的惯例活动开了一个好头!

图片

(2016年核心开发者 Sprint 活动合影)

另外,值得一提的是,在 2019 年 12 月,陈和扎克伯格基金会(Chan Zuckerberg Initiative)连同 Mozilla 一起给 PSF 赞助了 40.7 万美元,而扎克伯格正是 Meta 的掌舵人。

这几家科技巨头对 Python 的赞助有一个明显的共同点,即有不少资金用于 Python 基础设施的维护。这里只给大家分享几个关键的数据(出自年度报告,统计维度:2021 年):

  • 1100 亿次 Python 发行版下载量
  • 1265 亿次 PyPI 软件包下载量(36.9 万个软件包)
  • 以上这么多下载量需要 324 PB 数据传输,或 82.2 Gbps 带宽,并且是 24x7x365

如此大数量级的服务,其实现的困难程度可想而知,而这仅是冰山一角。

回到前文的话题:谁才是 Python 最大的金主呢?

图片

如果你只看它们成为远景赞助者时单次的资金量的话,容易得出一个答案,但是,这没有意义!

因为,每个赞助方对 Python 的赞助都是全方位的长期持续性的(比如谷歌的云服务、微软的人力投入、对 CPython 及开源生态的贡献、每年各式各样的活动、宣传与推广),很多内容根本无法直接通过金钱来衡量!

另外,需要说明的是,本文为了话题性及便利性,主要介绍了三家巨头企业成为 PSF 远景赞助者的相关信息,并不代表其它赞助者的贡献不值一提。

所有赞助者、志愿者、开发者都有一个共同的愿景:那就是希望 Python 语言、Python 生态、Python 社区变得越来越好!

大家一起自豪地做着一些力所能及的贡献,这才是十分值得称道的事,你觉得呢?

最后

如果对Python感兴趣的话,可以试试我的学习方法以及相关的学习资料

👉Python学习路线汇总👈

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(全套教程文末领取哈)
在这里插入图片描述

👉Python必备开发工具👈

在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉Python学习视频600合集👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

👉实战案例👈

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉100道Python练习题👈

检查学习结果。
在这里插入图片描述

👉面试刷题👈

在这里插入图片描述
在这里插入图片描述

资料领取

上述这份完整版的Python全套学习资料已经上传优快云官方,朋友们如果需要可以微信扫描下方优快云官方认证二维码输入“领取资料” 即可领取

<think>好的,用户现在问的是目前主流公司的AI技术是如何开发的。我需要先回顾之前的对话,看看有没有相关的上下文。之前用户问的是工程造价软件的技术,现在转向了AI开发,这可能是一个拓展性的问题。用户可能对AI技术的整体开发流程感兴趣,或者想了解大公司是如何具体实施这些技术的。 首先,我需要明确用户的需求。他们可能想了解主流公司如Google、微软、亚马逊等在AI开发上的通用流程和技术栈。可能需要分步骤解释,从数据准备到模型部署的整个流程。同时,用户可能对具体的工具和框架感兴趣,比如TensorFlow、PyTorch等。 接下来,我要考虑用户可能的背景。他们可能是学生、开发者,或者是对AI技术感兴趣的非技术人员。需要保持回答的清晰和易懂,避免过于专业的术语,但又要准确。之前的回答结构很清晰,分点列出,所以沿用类似的格式可能更好。 需要涵盖的主要方面包括数据准备、模型开发、训练优化、部署应用、伦理法律问题,以及未来的趋势。每个部分都要简要说明技术要点,比如数据清洗、特征工程、模型选择、训练技巧、部署工具等。还要提到主流公司的案例,比如谷歌的BERT,OpenAI的GPT,这会让回答更具体。 还要注意用户可能想知道这些技术如何在实际中应用,比如推荐系统、自然语言处理等。同时,伦理和法律部分也是当前热点,不可忽视。最后,未来趋势部分可以帮助用户了解AI发展的方向,如多模态模型、自动化AI等。 需要确保回答结构清晰,逐步展开,每个部分有子点,用项目符号或编号列出。同时,保持语言简洁,技术点准确,但不过于深入细节。可能还需要比较不同公司的做法,比如谷歌Meta在分布式训练上的不同框架。 检查是否有遗漏的重要技术,比如强化学习、迁移学习,以及工具链如Kubeflow、MLflow等。另外,边缘计算和模型轻量化也是部署中的重要部分,需要提及。 最后,确保回答符合之前的格式要求,使用中文,行内公式用$...$,独立公式用$$...$$,但在这个问题中可能公式不多,不过如果有提到算法或数学概念时需要注意。但用户的问题是关于开发流程,可能不需要太多公式,所以可以忽略这一点,但保持LaTeX格式的正确性。 总结下来,回答的结构应该是分几个大点,每个大点下有子点,涵盖数据、模型、训练、部署、伦理、趋势,并举例说明主流公司的做法,使用清晰的技术术语但不过于晦涩,保持口语化但专业。</think>目前主流科技公司的AI技术开发普遍遵循系统化的技术路径,以下是典型开发流程及关键技术应用分析: --- ### 一、数据基础建设 1. **数据采集与清洗** - 多源异构数据采集:通过Web Crawler(Scrapy框架)、IoT设备、用户行为埋点等获取数据 - 数据标注体系:建立众包标注平台(如Amazon Mechanical Turk)+ 半自动标注工具(Snorkel框架) - 特征工程:使用Pandas/Spark进行缺失值填充、异常值处理、标准化($x' = \frac{x-\mu}{\sigma}$) 2. **分布式数据存储** - 数据湖架构:Hadoop HDFS + Iceberg数据表格式 - 实时数据处理:Apache Kafka流式管道 + Flink实时计算引擎 - 典型案例:Netflix每天处理**10PB**用户行为数据 --- ### 二、模型开发核心流程 1. **算法选型与优化** - 监督学习:CNN(图像)、Transformer(NLP)、XGBoost(结构化数据) - 自监督学习:对比学习(SimCLR)、掩码语言模型(BERT) - 强化学习:PPO算法(游戏AI)、Q-Learning(机器人控制) 2. **模型训练技术** - 分布式训练:Google的TPU Pod + Mesh TensorFlow框架 - 混合精度训练:NVIDIA A100 GPU + AMP自动混合精度 - 参数优化:AdamW优化器($w_{t+1} = w_t - \eta\frac{\hat{m}_t}{\sqrt{\hat{v}_t}+\epsilon}$) 3. **主流开发框架** ```python # 典型PyTorch训练代码结构 model = Transformer(num_layers=12, d_model=768) optimizer = AdamW(model.parameters(), lr=5e-5) for batch in dataloader: loss = F.cross_entropy(model(batch.input), batch.label) loss.backward() optimizer.step() ``` --- ### 三、工程化落地实践 1. **模型部署技术** - 服务化部署:TensorFlow Serving/TorchServe + gRPC接口 - 边缘计算:TensorRT引擎优化 + ONNX模型格式转换 - 模型轻量化:知识蒸馏(如DistilBERT)、量化(INT8精度转换) 2. **持续迭代体系** - MLOps工具链:Kubeflow流水线 + MLflow模型注册 - A/B测试系统:分层抽样实验框架 + 效果评估指标(如NDCG@10) - 典型规模:Meta每日运行**10万+**次模型实验 --- ### 四、行业特色技术路径 | 公司领域 | 核心技术 | 典型应用 | |----------------|---------------------------------------------|----------------------------| | 搜索引擎 | 知识图谱(Neo4j+图神经网络) | Google Knowledge Graph | | 社交网络 | 图嵌入算法(Node2Vec) | Facebook社交关系推荐 | | 自动驾驶 | 多传感器融合(Kalman滤波+BEV感知) | Tesla FSD视觉系统 | | 金融科技 | 时序预测(LSTM+TCN) | 蚂蚁集团风控模型 | --- ### 五、伦理与合规技术 1. **隐私保护** - 联邦学习(FATE框架)+ 差分隐私(Laplace噪声注入) - 数据脱敏:k-匿名化($k≥5$) + 同态加密(Paillier算法) 2. **可解释性技术** - SHAP值分析($ϕ_i = \sum_{S⊆N∖{i}}\frac{|S|!(M-|S|-1)!}{M!}[f(S∪{i})-f(S)]$) - LIME局部解释模型 --- ### 六、前沿发展方向 1. **大模型技术栈** - 千卡集群训练:Megatron-LM + 3D并行(数据/流水线/张量并行) - 提示工程:Chain-of-Thought(思维链)提示方法 2. **AI基础设施创新** - 光子计算芯片(Lightmatter芯片) - 量子机器学习(VQC变分量子电路) --- **技术演进趋势**:从单点模型开发转向端到端MLOps体系,开发周期从数月缩短至数天。据IDC数据,2023年全球AI开发投入已超**500亿美元**,年均增长率达26.3%。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值