Duvido que a Nvidia use um bus de 512bit.
Simplesmente não é necessário, as G8x já fazem um uso muito mais eficaz da largura de banda disponível do que as R6xx, e um bus mais largo implica um PCB mais complexo, mais chips de memória RAM por placa, etc.
Se houver um aumento do bus, acho improvável que passe dos 448bit, mas tudo é possível daqui por 4 ou 5 meses.
-----------------------------------------------------------------------------------------
Por outro lado, não podem somar os Scalar Processors e dizer que vai ter 160, 192, 256 ALU's, etc. Não é assim tão linear.
Relembro que os Scalar Processors da G92 vão suportar cálculos em dupla precisão (FP64), que não existe nas G8x.
Só isso já chega para aumentar significativamente a complexidade de cada um.
A tudo isto, há aínda o facto de serem 100% escalares (ao contrário do que acontece nas AMD R6xx). Isto significa que a Nvidia pode até optar por manter um nº relativamente reduzido de ALU's comparativamente com as G80, mas aumenta o nº de estágios para cada uma delas de forma a atingir velocidades de relógio mais elevadas.
Uma pista para a evolução dos clock domains separados nas unidades de shading para uma futura terceira geração (depois das Geforce 7 e Geforce 8) pode muito bem ser isto:
http://www.beyond3d.com/content/pr/31