Version: 2019.4
Subida Asincrónica de Texturas
Agrupamiento de Draw Calls

Optimizando el Rendimiento Gráfico

Un buen rendimiento es crítico al éxito de muchos juegos. Abajo hay algunas guías simples para maximizar la velocidad de la renderización gráfica de su juego.

Ubique los gráficos que tienen alto impacto

Las partes gráficas de su juego pueden tener principalmente un precio en dos sistemas del computador: el GPU o el CPU. La primera regla de cualquier optimización es encontrar dónde el problema de rendimiento está; ya que las estrategias para optimizar el GPU vs. el CPU son bastantes diferentes (y puede inclusive ser opuestas - es bastante común hacer que el GPU trabaje más mientras se optimice para el CPU, y vice versa).

Problemas típicos y maneras de revisarlos:

  • El GPU es a menudo limitado por fillrate o el ancho de banda de memoria.
    • Baje la resolución de la pantalla y corra el juego. Si una resolución de pantalla más baja hace que el juego corra más rápido, usted puede estar limitado al fillrate en el GPU.
  • El CPU a veces es limitado por el número batches que necesitan ser renderizados.
    • Marque “batches” en la ventana Rendering Statistics. Entre mayor batches (lotes) están siendo renderizados, mayor será el costo del CPU.

Problemas menos comunes:

  • El GPU tiene demasiados vértices para procesar. La cantidad de vértices que son aceptables dependen en el GPU y la complejidad de los vertex shaders. De manera general, intente no tener más de 100,000 vértices en móviles. Un PC maneja muy bien varios millones de vértices, pero es todavía buena práctica mantener este número tan bajo como sea posible para optimizar.
  • El CPU tiene muchos vértices que procesar. Estos pueden estar en skinned meshes, simulación de telas, partículas, u otras game objects y meshes. Como se menciono arriba, por lo general es buena práctica mantener este número tan bajo como sea posible sin comprometer la calidad del juego. Ver la sección acerca de optimización del CPU abajo por guías acerca de cómo hacer esto.
  • Si Renderizar no es un problema para el GPU ni en el CPU puede que haya un problema en otro lado - Por ejemplo, en sus scripts o su físicas. Utilice el Profiler para ubicar el problema.

Optimización del CPU

Para renderizar cualquier objeto en la pantalla, el CPU tiene mucho trabajo que hacer: trabajar qué luces afecta ese objeto, configurar el shader y los parámetros del shader, y enviar comandos de dibujo al driver gráfico, que luego prepara los comandos para que sea enviado a la tarjeta gráfica.

Todo este uso del CPU “por objeto” es intensivo a los recursos, por lo que si usted tiene muchos objetos visibles, esto se puede agregar. Por ejemplo, si usted tiene miles de triángulos, es mucho más fácil en el CPU si todos están en un mesh, en vez de un mesh por triángulo (agregando hasta 1000 meshes). El precio de ambos escenarios en el GPU es muy similar, pero el trabajo hecho por el CPU para renderizar mil objetos (en vez de uno) es significativamente mayor.

Reduzca la cuenta visible de objetos. Para reducir la cantidad de trabajo que el CPU necesita hacer:

  • Combine objetos cerca juntos, ya sea manualmente, o utilizando el draw call batching de Unity.
  • Utilice menos materiales en sus objetos, colocando texturas en un texture atlas más grande.
  • Utilice menos cosas que cause que los objetos sean renderizados múltiples veces (como lo son los reflejos, sombras, y luces per-pixel).

Combine los objetos juntos para que cada mesh tenga al menos varios cientos de triángulos y utilice solo un Material para el mesh entero. Es importante que tenga en cuenta que combinar dos objetos que no compartan un material no le da a usted ningún incremento de rendimiento. La razón más común para tener múltiples materiales es que dos meshes no compartan la misma textura; entonces para optimizar el rendimiento del CPU, usted debe asegurarse que cualquier objeto que usted combine comparta las misma texturas.

Cuando se utilice muchas pixel lights (luces de pixel) en el Forward rendering path, hay situaciones dónde combinar objetos no tiene sentido. Ver la sección de rendimiento de Iluminación abajo para aprender a cómo manejar esto.

CPU optimization using OnDemandRendering

Use OnDemandRendering to improve CPU performance by controlling your application’s rendering speed.

You might want to lower the frame rate in the following scenarios:

  • Menus, such as the application entry point or a pause menu. Menus tend to be relatively simple scenes that don’t need to render at full speed. You can render menus at a lower frame rate to reduce power consumption and to prevent device temperature from rising to a point where the CPU frequency may be throttled.
  • Turn based games, such as chess. Players spend time waiting for other users to make their move or thinking about their own move. During periods of low activity, you can lower the frame rate to prevent unnecessary power usage and prolong battery life.
  • Applications where the content is mostly static, such as Automotive UI.

Adjusting the rendering speed helps you manage power usage and device thermals to maximize battery life and prevent CPU throttling. It works particularly well with the Adaptive Performance package. Even though frames don’t render as often, the application still sends events to scripts at a normal pace (for example, it might receive input during a frame that isn’t rendered). To prevent input lag, you can call OnDemandRendering.renderFrameInterval = 1 for the duration of the input so that movements, buttons, etc. still appear to be responsive.

Situations that are very heavy in areas such as scripting, physics, animation, but not rendering, don’t benefit from using this API. Your application’s visuals might stutter with minimal impact on power usage.

Note: VR applications don’t support On Demand Rendering. Not rendering every frame causes the visuals to be out of sync with head movement and might increase the risk of motion sickness.

GPU: Optimizing Model geometry

There are two basic rules for optimizing the geometry of a Model:

  • Don’t use any more triangles than necessary.
  • Try to keep the number of UV mapping seams and hard edges (doubled-up vertices) as low as possible.

Tenga en cuenta que el número de vértices que el hardware de gráficas tiene que procesar usualmente no es lo mismo que el número reportado por una aplicación 3D. Las aplicaciones de modelado usualmente muestran la cantidad de puntos de esquina distinos que componen el modelo (conocido como la cantidad de vértices geométricos). Sin embargo, para una tarjeta gráfica algunos vértices geométricos necesitan ser divididos en dos o más vértices lógicos por propósitos de renderización. Un vértices debe estar dividido si tiene múltiples normales, coordenadas UV o colores de vértice. En consecuencia, la cuenta de vértices en Unity es usualmente superior que la cuenta dada por la aplicación 3D.

While the amount of geometry in the Models is mostly relevant for the GPU, some features in Unity also process Models on the CPU (for example, Mesh skinning).

For more tips on improving performance while creating Assets in 3D applications outside of Unity, see Modeling characters for optimal performance.

Rendimiento de Iluminación

La opción más rápida es siempre crear una iluminación que no necesite ser calculada en absoluto. Para hacer esto, utilice Lightmapping para “bake” la iluminación estática solamente una vez, mas bien de calcular esto cada frame. El proceso de generar un ambiente lightmapped toma solamente un poco más que colocar una luz en la escena en Unity, pero:

  • Corre más rápido (2–3 veces más rápido que dos luces por-pixel)
  • Se verá mucho mejor, ya que puede bake la iluminación global y el lightmapper puede suavizar los resultados

En muchos casos usted puede aplicar varios trucos simples en vez de agregar varias luces extra. Por ejemplo, en vez de agregar una luz que brilla directamente a la cámara para darle un efecto de Rim Lighting , agregue un cálculo dedicado Rim Lighting directamente a sus shaders (ver Surface Shader Examples para aprender a cómo hacer esto).

Las luces en fordward rendering

También ver: Forward rendering

La iluminación dinámica por pixel agrega un trabajo significante de renderizado a cada pixel afectado, y puede llevar a objetos siendo renderizados en múltiples pases. Evite tener más de una una Pixel Light iluminando cualquier objeto sencillo en dispositivos menos poderosos, como móviles o GPUs de PCs de baja gama, y utilice lightmaps para iluminar objetos estáticos en vez de calcular su iluminación cada frame. La iluminación dinámica por vértice puede agregar trabajo significante a las transformaciones de vértice, entonces intente evitar situaciones dónde hay varias luces iluminando un solo objeto.

Evite combinar meshes que están lo suficiente lejos para ser afectados por diferentes conjuntos de pixel lights. Cuando usted utilice la pixel lighting, cada mesh tiene que estar renderizado tantas veces que haya pixel lights iluminándolo. Si usted combina dos meshes que están muy lejos, esto aumenta el tamaño efectivo del objeto combinado. Todas las pixel lights que iluminan cualquier parte de este objeto combinado son tomados en cuenta durante el renderizado, por lo que el número de pases que se debe hacer para renderizar el objeto combinado es la suma de la cantidad de pases para cada uno de los objetos separados, por lo que nada se gana al combinar los meshes.

During rendering, Unity finds all lights surrounding a mesh and calculates which of those lights affect it most. The settings on the Quality window are used to modify how many of the lights end up as pixel lights, and how many as vertex lights. Each light calculates its importance based on how far away it is from the mesh and how intense its illumination is - and some lights are more important than others purely from the game context. For this reason, every light has a Render Mode setting which can be set to Important or Not Important; lights marked as Not Important have a lower rendering overhead.

Ejemplo: Considere un juego de manejar en la que el carro del jugador está manejando en la oscuridad con los faros de luz prendidos. Los faros de luz son probablemente la fuente de luz más significante que hay en el juego, por lo que su Render Mode debería estar configurado a Important. Puede que haya otras luces en el juego que son menos importantes, como las luces traseras de los otros carros o faros de luz, y que no mejoran el efecto visual al ser pixel lights. El Render Mode para esas luces con seguridad se pueden configurar como Not Important para evitar que se gaste capacidad de renderizado en lugares dónde no tiene casi beneficio.

Optimizar iluminación por pixel ahorra trabajo para el CPU y GPU: el CPU tiene menos draw calls que hacer, y el GPU tiene menos vértices que procesar y pixeles para rasterizar para todos los objetos adicionales de renderizado.

GPU: Compresión de Textura y mipmaps

Use Compressed textures to decrease the size of your textures. This can result in faster load times, a smaller memory footprint, and dramatically increased rendering performance. Compressed textures only use a fraction of the memory bandwidth needed for uncompressed 32-bit RGBA textures.

Mipmaps de Textura

Siempre habilite Generate mipmaps para texturas utilizadas en una escena 3D. Una textura mipmap le permite al GPU utilizar una resolución de textura menor para triángulos pequeños. Esto es parecido a cómo la compresión de textura puede ayudar a limitar la cantidad de datos de textura transferidos cuando el GPU está renderizando.

La única excepción para esta regla es cuándo un texel (píxel de textura) es conocido de mapear 1:1 al píxel de la pantalla renderizada, tal como elementos UI o en un juego 2D.

Distancias LOD y cull per-layer

Hacerle cull (omitir/cortar) a los objetos involucra hacer de ellos invisibles. Esta es una manera efectiva de reducir ambas la carga del CPU y GPU.

En muchos juegos, una manera rápida y efectiva de hacer esto sin comprometer la experiencia del jugador es cull objetos pequeños de manera más agresiva que las más grandes. Por ejemplo, las rocas pequeñas y el escombro pueden volverse invisibles en distancias grandes, mientras que los edificios más grandes todavía serían visibles.

Hay un número de maneras en que se puede lograr:

Sombras en tiempo real

Las sombras en tiempo real son bonitas, pero pueden traer un impacto mayor en el rendimiento, en términos de draw calls extra para el CPU y un procesamiento extra en el GPU. Para más detalles, ver la página acerca del Light Performance (rendimiento de iluminación)

GPU: Tips para escribir shaders de alto rendimiento

Las diferentes plataformas que hay tienen diferentes capacidades de rendimiento; el GPU de un PC de alta gama puede manejar más en términos de gráficos y shaders que un GPU móvil de baja gama. Lo mismo es cierto incluso en una sola plataforma, un GPU rápido es una docena de veces más rápido que un GPU integrado más lento.

El probable que el rendimiento en las plataformas móviles y los Pcs de baja gama sea mas bajo que en su maquina de desarrollo. Se recomienda que usted optimice manualmente sus shaders para reducir los cálculos y lectura de texturas, con el fin de mantener un buen rendimiento a través de las maquinas GPU de baja gama. Por ejemplo, algunos Shaders integrados en Unity tienen equivalentes “móviles” que son mucho más rápido, pero tienen algunas limitaciones o aproximaciones.

Abajo hay algunas guías para tarjetas gráficas de baja gama para móviles y PC:

Operaciones matemáticas complejas

Transcendental mathematical functions (such as pow, exp, log, cos, sin, tan) are quite resource-intensive, so avoid using them where possible. Consider using lookup textures as an alternative to complex math calculations if applicable.

Evite escribir sus propias operaciones (como lo son normalize, dot, inversesqrt). Las opciones integradas de Unity aseguran que el driver pueda generar mejor código. Recuerde que la operación Alpha Test (discard) hace que su fragment shader sea más lento.

Precisión Floating point

Mientras que la precisión (float vs half vs fixed) de variables floating point en su mayoría son ignorados en GPUs de escritorios, es bastante importante que obtenga un buen rendimiento en GPUs móviles. Ver la página Shader Data Types and Precision para detalles.

Para detalles adicionales acerca del rendimiento del shader, ver la página Shader Performance

Una simple lista de verificación para hacer su juego más rápido

  • Mantenga la cantidad de vértices debajo de 200k y 3M por frame cuando construya para PC (dependiendo en el GPU objetivo).
  • Si usted está utilizando uno de los shaders integrados, escoja uno de las categorías Mobile o Unlit. Estas funcionan en plataformas no necesariamente de móviles, pero son versiones simplificadas y aproximadas de más shaders complejos.
  • Mantenga el número de materiales diferentes por escena bajo, y comparta tantos materiales que pueda entre objetos como sea posible.
  • Configure la propiedad Static en un objeto que no se mueva para permitir optimizaciones internas como static batching.
  • Solo tiene una solo pixel light (preferiblemente directional) afectando su geometría, en ves de varios.
  • Bake la iluminación (static) en vez de usar una iluminación dinámica.
  • Utilice formatos de textura comprimidos cuando pueda, y utilice texturas 16-bit en vez de texturas de 32-bit.
  • Evite utilizar fog (niebla) cuando sea posible.
  • Utilice Occlusion Culling para reducir la cantidad de geometría que está visible y draw calls en casos de escenas estáticas complejas con mucho occlusion. Diseñe sus niveles con occlusion culling en mente.
  • Utilice skyboxes para distancias de geometría “falsas”.
  • Utilice sombreadores de píxel o combinadores de texturas para mezclar varias texturas en vez de un enfoque multi-pass.
  • Utilice variables de precisión half cuando sea posible.
  • Minimice el uso de operaciones matemáticas complejas como pow, sin y cos en pixel shaders.
  • Escoja fewer textures per fragment (menos texturas por fragmento).

Véase también

Subida Asincrónica de Texturas
Agrupamiento de Draw Calls
Copyright © 2023 Unity Technologies
优美缔软件(上海)有限公司 版权所有
"Unity"、Unity 徽标及其他 Unity 商标是 Unity Technologies 或其附属机构在美国及其他地区的商标或注册商标。其他名称或品牌是其各自所有者的商标。
公安部备案号:
31010902002961