A Nintendo explicou durante a GDC que Donkey Kong Bananza foi projetado para tornar a destruição dos cenários mais divertida, levando os desenvolvedores a optar por ambientes visualmente detalhados em vez de blocos simples.
Segundo o programador Tatsuya Kurihara, os primeiros protótipos do jogo já permitiam destruir partes do cenário, mas a equipe percebeu que a experiência não era tão satisfatória. O motivo era simples: quebrar blocos genéricos não causava tanto impacto quanto destruir elementos visuais mais elaborados. A conclusão da equipe foi que é mais divertido destruir algo que parece bonito e aparentemente impossível de quebrar.

A solução encontrada foi construir os cenários usando voxels, uma tecnologia que funciona como uma versão tridimensional dos pixels. Cada voxel representa um pequeno bloco de dados dentro de um espaço 3D, permitindo que o jogo registre propriedades detalhadas do ambiente e crie interações mais precisas.
No caso de Donkey Kong Bananza, cada voxel contém informações como densidade, tipo de material, nível de dano e até umidade. A partir desses dados, o jogo gera dinamicamente as malhas poligonais que aparecem na tela, garantindo que a destruição do cenário ocorra de forma dinâmica sem comprometer o desempenho.
Mesmo com limites de polígonos para manter o jogo rodando próximo de 60 quadros por segundo, a quantidade de voxels usada é enorme. Um exemplo citado pela equipe é a área Canyon, que sozinha possui cerca de 340 milhões de voxels estruturando o cenário.
Fonte: Games Radar

