返回 登录
0

在配有英特尔® Iris™ 显卡的系统上通过优化对 Just Cause 3 进行增强

高端 PC 继续通过高性能显卡驱动桌面游戏。 一流的“梦想机器”基于第六代智能 英特尔® 酷睿™ 处理器i7-6700K等 CPU,通常与高端独立显卡配合使用以运行要求最严苛的游戏。 由 Avalanche Studios* 开发、由 Square Enix*发布的 Just Cause 3 就是这样一款游戏。 作为 2015 年末发布的一款广受好评的游戏,JC3 提供猛烈的爆炸、茂密的地形和迷人的风景,Rico Rodriguez 特工在一个无比惊艳的广阔世界中战斗、翱翔、滑行和格斗。

虽然游戏机的目标受众很大,但 Avalanche 希望确保游戏能够在尽可能多的 PC 硬件上顺畅运行,包括带集成显卡的系统。 英特尔与 Avalanche 合作完成了一系列使所有 PC 配置受益的一般优化,但并没有就此停止。 他们还组建了一支小型独立团队(大部分成员来自于 Avalanche Studios 的 Engine and Research 事业部),单独开展一个针对英特尔® Iris™ 和英特尔® Iris™ Pro 图形芯片进行优化的项目。 该项目涉及利用第六代智能英特尔® 酷睿™ 品牌 CPU 的新图形功能。

这一团队还使用了针对 Microsoft* DirectX* 12 级硬件(暴露在 DirectX 11.3 API 下)的新图形功能。 通过使用各种专长的英特尔研发工程师提供的额外资源,该团队开发了一款在最新游戏机和高端游戏电脑上呈现出色视觉效果的游戏,这款游戏还吸引玩家使用配有英特尔 Iris 显卡的高性能笔记本电脑。

英特尔集成显卡基本上分为三个级别:主流级别是高清显卡,上一级是高端主流质量的 Iris 显卡。 最高级别的集成显卡是 Iris Pro 显卡,最新版本可在第六代智能 英特尔酷睿处理器上找到。 在这份案例研究中,您将了解到英特尔优化工具如何提供多种改进途径。 我们将深入探索着色器、实例化和低级算术逻辑单元 (ALU) 优化,并说明英特尔和 Avalanche Studios 如何寻找每个性能提升机会。
图片描述
图 1. 在Just Cause 3中,英雄 Rico Rodriguez 飞过覆盖复杂植被的地形。

英特尔® 图形性能分析器 (GPA) 为帮助优化Just Cause 3的复杂世界提供了一款很好的工具。 Just Cause 3 是这一大受欢迎的游戏系列的第三部。截至 2016 年中期,它在所有平台上的销售量约为 700 万。 从阳光明媚的海滩到白雪皑皑的山峰,该游戏提供 400 平方公里的绝佳地形,评论家将其称之为“为爆炸行动而准备”的开阔运动场。 英特尔和 Avalanche 专注于多重优化,将高级渲染技术推向极限。

英特尔® 图形性能分析器为 Cause 提供鼎力支持

英特尔 GPA 工具套件使游戏开发人员能够充分利用其游戏平台的全部性能潜力。 该工具能够可视化您应用的性能数据,帮助您了解系统级和单帧性能问题,以及实施“假设”实验,以估计优化能够带来的潜在性能提升。

英特尔图形应用工程师 Antoine Cohade 负责领导英特尔方面的 JC3 优化工作。 他时常从其位于慕尼黑的办公室赶往瑞典斯德哥尔摩与 Avalanche 的开发人员会面,包括项目负责人 Christian Nilsendahl 和研究负责人 Emil Persson。 “我们在远程做了很多工作,但我们在现场做了一些繁重的分析工作。 Cohade 表示:“有时候,我们每天都打电话或在线沟通。 我们基本上已经证明,我们可以让最高级、要求最苛刻游戏让英特尔硬件上顺畅运行。 开发人员可以使用这些工具和技术,在各种移动系统上运行其游戏。”

除了其他工具之外,该团队使用了英特尔 GPA 的三个关键部分:

系统分析器 – 分析 CPU 图形 API 以及 GPU 性能和功率指标。
图形帧分析器 – 对 Microsoft DirectX、OpenGL* 和 OpenGL ES* 游戏工作负载执行单帧分析和优化。
平台分析器 – 查看应用在 CPU 和 GPU 上所花费的时间。
图片描述
图 2. 优化团队首先运行系统分析器,以确定系统是 CPU 限制还是 GPU 限制。

在 6 个月的时间里,该团队调整了下列领域:

低级 ALU 优化
实例化
植被
遮蔽
动态分辨率渲染
DirectX 优化,适用于 DX11.3 API
最初,英特尔 GPA 揭示了一些关键挑战。 多个帧中有大量的绘制调用,一些单独的绘制调用在处理能力方面的成本高昂。 聚类的照明着色器和植被是改进的关键领域。
图片描述
图 3. 图形帧分析器屏幕的高级视图,显示了各个组件的信息可以在哪里找到。

该团队决定实施多个 ALU 优化,以简化昂贵的单个着色器。 他们还调查了大量绘制调用经常使游戏受到 CPU 限制(由于单个 API 调用的成本)的问题。

从底层开始: 调整算术和逻辑单元 (ALU)

许多低级 ALU 优化工作涉及重做数学计算,以生成更少的指令。 这一工作的负责人是 Emil Persson,他在游戏开发者大会上发布了其作品并发表了两篇关于着色和优化的重要文章。 Persson 总结的一些经验非常简单:不要依靠编辑器为您优化,单独的标量和向量工作,并记住低级和高级优化不是相互排斥的——尽量做到两面兼顾。

调查结果显示,着色器编译器…查看全文


了解更多相关内容,请关注CSDN英特尔开发专区

Intel技术双周刊已全面开启:订阅请点击这里

评论