g80 architecture overview

本文深入探讨了NVIDIA G80架构的特点与革新之处,包括统一着色器、即时编译器、流处理器等核心组件的工作原理及优势,并概述了其如何通过灵活高效的资源分配改善实际计算性能。
部署运行你感兴趣的模型镜像

http://www.nvidia.com/attach/941771?type=support&primitive=0

 

06年底nv发的文章,从g80到fermi架构之前的nv显卡都是秉承g80的architecture,所不同的是各个部件有所增减,或者微调。

之前做ps3,学习的7系列的gpu知识,很多放在g80架构上都是“错的”了,g80架构看得很high,真是无愧于革命性的一代产品。

 

这个是overivew的图:

 

很多东西都很熟悉了,所以挑一些重要的记录吧:

 


 

unified shader

这里和console上编程有不同的就是,unified shader的分配是由driver和gpu内部的机制来分配,会根据shader的指令数,vertex和fragment数量比等预判vs和ps的计算量之间的关系,来进行计算资源的分配。

unified shader最大的好处是让资源分配更加市场经济,根据需要来分配,以至于一定程度上消除了vs和ps的瓶颈(但是也不绝对了)

 

  • 这个是一个unified shader的内部结构图,里面包括sp,ta,tf,cache。
  • 内部做的时候,alu和sample运算时各自独立的,可以并行。

 

 


 

JIT Compiler

这个倒是以前没见过的东西,原来写shader的时候,对于coder来讲是像写java,编出来的code虽然也是汇编的,但是仍然是中间代码,在runtime的时候driver会把这个asm转成真正gpu使用的机器码,有点意思。

 

 


 

stream processor

 

真正做计算的unit:

  • 由不同于其他unit的时钟周期来驱动,比如这里的http://www.nvidia.com/object/product_geforce_gts_240_us.html,可以看到graphics clock和processor clock两个周期,graphics clock可以做像vertex assembly一个周期生成一个triangle这种情况。
  • 可以dual issue
  • scalar processor----这个是比较关键性的改动相比于之前的vector processor,现在又转变成scalar计算了。我们一般写cg,hlsl时候,compiler还是会变成vector based asm,在8800里面会被转成scalar code(太tmd神奇了)。
  • 另外有一点是,里面做性能对比的时候是128scalar processor和32个vector processor做的对比,性能说要高2倍,这里的128对32,也就意味着是本身1个vector processor也是类似4个scalar processor组成的,有点意思。

 

 


 

其他:

  • csaa
  • zcull
  • bilinear anisotropic filter nearly free
  • geometry shader
  • stream output

 


 

总结:

除了对graphics coding有很多指导外,整个architecture的设计则破除了之前的种种不灵活(vector processor, non-unified shader)变得更加灵活和高效,可以看做是算法上的一种进步,在理论计算能力上有限进步下,取得了更大的实际计算能力。

您可能感兴趣的与本文相关的镜像

Wan2.2-I2V-A14B

Wan2.2-I2V-A14B

图生视频
Wan2.2

Wan2.2是由通义万相开源高效文本到视频生成模型,是有​50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力

内容概要:本文是一份针对2025年中国企业品牌传播环境撰写的《全网媒体发稿白皮书》,聚焦企业媒体发稿的策略制定、渠道选择与效果评估难题。通过分析当前企业面临的资源分散、内容同质、效果难量化等核心痛点,系统性地介绍了新闻媒体、央媒、地方官媒和自媒体四大渠道的特点与适用场景,并深度融合“传声港”AI驱动的新媒体平台能力,提出“策略+工具+落地”的一体化解决方案。白皮书详细阐述了传声港在资源整合、AI智能匹配、舆情监测、合规审核及全链路效果追踪方面的技术优势,构建了涵盖曝光、互动、转化与品牌影响力的多维评估体系,并通过快消、科技、零售等行业的实战案例验证其有效性。最后,提出了按企业发展阶段和营销节点定制的媒体组合策略,强调本土化传播与政府关系协同的重要性,助力企业实现品牌声量与实际转化的双重增长。; 适合人群:企业市场部负责人、品牌方管理者、公关传播从业者及从事数字营销的相关人员,尤其适用于初创期至成熟期不同发展阶段的企业决策者。; 使用场景及目标:①帮助企业科学制定媒体发稿策略,优化预算分配;②解决渠道对接繁琐、投放不精准、效果不可衡量等问题;③指导企业在重大营销节点(如春节、双11)开展高效传播;④提升品牌权威性、区域渗透力与危机应对能力; 阅读建议:建议结合自身企业所处阶段和发展目标,参考文中提供的“传声港服务组合”与“预算分配建议”进行策略匹配,同时重视AI工具在投放、监测与优化中的实际应用,定期复盘数据以实现持续迭代。
先展示下效果 https://pan.quark.cn/s/987bb7a43dd9 VeighNa - By Traders, For Traders, AI-Powered. Want to read this in english ? Go here VeighNa是一套基于Python的开源量化交易系统开发框架,在开源社区持续不断的贡献下一步步成长为多功能量化交易平台,自发布以来已经积累了众多来自金融机构或相关领域的用户,包括私募基金、证券公司、期货公司等。 在使用VeighNa进行二次开发(策略、模块等)的过程中有任何疑问,请查看VeighNa项目文档,如果无法解决请前往官方社区论坛的【提问求助】板块寻求帮助,也欢迎在【经验分享】板块分享你的使用心得! 想要获取更多关于VeighNa的资讯信息? 请扫描下方二维码添加小助手加入【VeighNa社区交流微信群】: AI-Powered VeighNa发布十周年之际正式推出4.0版本,重磅新增面向AI量化策略的vnpy.alpha模块,为专业量化交易员提供一站式多因子机器学习(ML)策略开发、投研和实盘交易解决方案: :bar_chart: dataset:因子特征工程 * 专为ML算法训练优化设计,支持高效批量特征计算与处理 * 内置丰富的因子特征表达式计算引擎,实现快速一键生成训练数据 * Alpha 158:源于微软Qlib项目的股票市场特征集合,涵盖K线形态、价格趋势、时序波动等多维度量化因子 :bulb: model:预测模型训练 * 提供标准化的ML模型开发模板,大幅简化模型构建与训练流程 * 统一API接口设计,支持无缝切换不同算法进行性能对比测试 * 集成多种主流机器学习算法: * Lass...
评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值