# Shader优化
# 前言
为了做出更加炫酷的效果,我们往往会自定义材质,然后定义自己的Shader,或者直接重写替换原版Shader,特别是目前的很多光影MOD,基本都需要对Shader进行修改。Shader与GPU性能密切相关,Shader写得好能让配置不是很高的玩家也能流畅体验炫酷的效果。写得不好,则可能导致高端机也很卡。
# 尽量少用 if else 条件语句
GPU是并行处理逻辑的,采用SIMD(单指令多数据)结构, 同一段代码,同一时刻会被多个GPU的处理单元同时处理,这段代码的执行耗时取决于会被执行到的时间最长的代码。为了充分发挥GPU的并行性,我们尽量少用条件分支逻辑,让所有GPU处理单元都执行相同的代码。
if else的写法如果底下逻辑不多,大部分可以合并,则常常可以改用step()函数进行优化
step(a,b)的功能为:
若b >= a则返回1,否则返回0
所以如果有这么一个写法:
if(r >= 0.5)
{
r = 0.6;
}else{
r = 0.4;
}
则应该写成:
r = 0.4 + step(0.5, r) * (0.6 - 0.4);
逻辑上相当于若r >= 0.5 ,则:
r = 0.4 + 1 * 0.2 = 0.6;
否则r < 0.5,则:
r = 0.4 + 0 * 0.2 = 0.4;
由此即可消去if else语句。
- 错误写法: (if else大量使用)
// 简单的卡通着色例子,把连续的颜色值映射到几个特殊的离散的值上面
//根据传入的颜色值取得一个新的颜色值, 这里为了展示简单,我们用仅用一个通道进行举例
void main()
{
color.r = getNewRedColor(color.r);
...(省略无关代码)
}
float getNewRedColor(float r)
{
float newR;
if(r >= 0.6)
{
newR = 0.8;
}else if(r >= 0.3)
{
newR = 0.5;
}else{
newR = 0.1;
}
return newR;
}
- 正确写法: (分开每帧只处理5个)
// 简单的卡通着色例子,把连续的颜色值映射到几个特殊的离散的值上面
//根据传入的颜色值取得一个新的颜色值, 这里为了展示简单,我们用仅用一个通道进行举例
void main()
{
color.r = getNewRedColor(color.r);
...(省略无关代码)
}
float getNewRedColor(float r)
{
float newR = 0.0;
newR = newR + step(0.6, r) * 0.8;
newR = newR + step(0.3, r) * step(r, 0.6) * 0.5;
newR = newR + step(r, 0.3) * 0.1;
return newR;
}
# 循环语句
for, while这类的循环语句内部实现其实也会有条件判断if else语句,并行性比较低,所以如果可以不用尽量不用,但这并不是让大家去复制粘贴多少次代码,这没有意义,则是尽量从逻辑上避免循环逻辑的出现,如果实在需要使用,则建议循环体内不要做太多耗性能的操作。 除此之外,循环变量一定要记得初始化!变量的初始值在不同设备上有时候是不一样的, 比如int的初始值并不一定在所有设备上都是0。
- 错误写法: (循环变量i没有初始化)
for(int i; i < 5; i ++)
{
func();
}
在一些设备上i的值会被初始化为0,循环5次没有问题。但在一些设备上,i的默认值可能是一个没有意义的数,甚至是负数!例如是−2147483648,上面循环则会循环超级多次,玩家会直接卡到动不了。
- 正确写法: (分开每帧只处理5个)
//这里i一定要给一个默认值
for(int i = 0; i < 5; i ++)
{
func();
}
# 精美贴图开关
开关在游戏中的位置:设置->视频->精美贴图 开发者可根据玩家是否开启精美贴图执行不一样的shader逻辑。这里需要声明两个文件,materials/sad.json 和 materials/fancy.json。我们先看下原版中两个文件的内容:
sad.json:
[
{"path":"materials/sad.material"},
{"path":"materials/entity.material"},
{"path":"materials/terrain.material"},
{"path":"materials/portal.material"},
{"path":"materials/barrier.material"},
{"path":"materials/wireframe.material"}
]
fancy.json:
[
{"path":"materials/fancy.material", "+defines":["FANCY"]},
{"path":"materials/entity.material", "+defines":["FANCY"]},
{"path":"materials/terrain.material", "+defines":["FANCY"]},
{"path":"materials/hologram.material"},
{"path":"materials/portal.material", "+defines":["FANCY"]},
{"path":"materials/barrier.material"},
{"path":"materials/wireframe.material"}
]
开启精美贴图的时候会加载下面的材质,不开启的话加载上面的材质。我们用一个材质进行举例,比如sad和fancy中都有的terrain.material材质,fancy中不同在于额外定义了FANCY字段,则在Shader中可以这样写:
void main()
{
#ifdef FANCY
//这里可以做更多的逻辑,渲染更好的效果
renderBeautiful();
#else
// 这里是关闭了精美贴图,这里不应该执行过多逻辑,只需要提供简单的显示效果就可以了
renderSimple();
#endif
}
# 降低精度
通常来说,我们写的shader不需要过于关注精度,因为大部分情况下性能瓶颈不在这里,但一些过于复杂,大部分玩家都说卡的MOD,建议可以考虑在精度方面做一些优化。
shader中变量精度越低,GPU运算越快,精度分为3档,关键字分别为:
低:lowp
中:mediump
高:highp
int(整数):建议256内的整数使用lowp, 1024内的整数使用mediump,其它情况则使用highp float(浮点):建议256内的浮点数使用lowp, 16384内的浮点数使用mediump,其它情况则使用highp
默认精度:
顶点着色器中float, int均为highp
像素着色器中int为mediump,float根据设备不同无默认精度
声明方法例子(直接把精度关键字加在变量类型前面):
lowp float color
# 移除无用变量与逻辑
部分开发者编写Shader的时候可能会偷下懒,从自己以前写的代码里面复制粘贴过来,但这部分代码可能有很多逻辑或者变量都没有用上,导致大量的运算是无意义浪费性能的,需要去掉。
- 错误写法: (包含大量无用逻辑)
void main()
{
//这里声明多个变量,又或许是从其它地方复制过来,具体值先省略
A = ...;
B = ...;
C = ...;
//这里只用了变量A;B和C都没有用到
DoSomeThingWithA(A);
return;
}
- 正确写法: (删除无用逻辑)
void main()
{
//只留下A,把其它没用上的都删除掉
A = ...;
//这里只用了变量A;B和C都没有用到
DoSomeThingWithA(A);
return;
}
# 分级做多个MOD版本
开发者可根据Shader复杂度上架不同版本,举个例子,例如可以有“网易光影低配版”, “网易光影高配版”,玩家看名字就大概知道对性能有不同的要求了,让玩家下载时自行选择。
https://nie.res.netease.com/r/pic/20210728/5a263f49-e1f3-4a9a-96b3-307b11848590.png
进阶
30分钟