Primeiro que tudo, queria desde já pegar num comentário já feito (não sei por quem, não interessa, li esta thread um pouco na diagonal):
Se o Google não tem a própria página validada, porque é que eu devo ter a minha?
A resposta mais simples é: Se eu não tenho a minha página validada, problema meu, é pior para indexação que vão fazer do
meu site, que pode nem sair bem.
Este tipo de afirmações equivale a 100% com "Se o individuo X não paga impostos, porque é que eu devo pagar os meus?".
Sobre o assunto, finalmente:
Entrei agora mesmo no google.com, sem o meu login na GAccount. A página tem 14KiB. 8KiB são do logotipo, 4KiB do JS. Os restantes 2KiB são do documento HTML em si.
Agora podíamos ir pela de "se eles tem mais uma linha, gastam mais tráfego", mas isso é, desculpem o termo,
bullshit.
Se eles têm mais uma linha, mais uns Bytes ou KiB, então é sempre mais algum tempo que o user demora a fazer load da página, invariavelmente.
A meu ver, e tal como ouvi vindo de empregados do Google, faz sentido que eles queiram que o user entre na página deles, faça a sua bela pesquisa, e saia. Isto o mais rápido possível, para não atrapalhar o que o user está a fazer.
Voltando atrás, ter uma página válida implicava ter mais KB (porque não é apenas o Doctype), que atrasariam o load, nem que fosse por 1 segundo mais, mas a muita gente.
E se a página funciona bem, de forma igual em todos os browsers, qual é a cena de estar válida?
A validação (ou, por outras palavras, construir uma página com base em standards, e respeitando-os) apenas serve para as máquinas poderem ler correctamente a página. Sejam "as máquinas" browsers ou bots (não estou a ver outras "máquinas" relevantes que façam crowl da web).
Visto que os browsers lêem bem a página, ficamos por aqui. Isto porque, mais uma vez, o Google não necessita de ser indexado, e, até pede para não ser, se forem ver o
robots.txt.