Processador Intel Meteor Lake [2023]

O problema da instabilidade dos raptor lake, pelo que vi, na grande maioria dos casos não se deve a ram. É mesmo degradação do silício dos núcleos, em alguns casos também podes ter degradação do IMC mas não é tão comum.

É o que dá lançarem cpus em stock do lado errado da curva de v/f, a juntar a isso tens boards high-end que nem os limites da Intel respeitam. Alguns destes cpus estão a experienciar electromigração acelerada e por vezes é gente que só os colocou a funcionar em stock. Curiosamente é sempre em boards Z e processadores K, com PL1=PL2 ilimitado e MCE ativado por default. Que é basicamente o equivalente a comprares um ryzen já com OC de fabrica e como se não bastasse o fabricante da board ainda te ativa o PBO automaticamente.

Degradação acho mais raro, mas também é possível. Os cores do meu 13700kf estão exatamente iguais a quando recebi o chip, mas nunca esteve a 90º+C e 250+w durante muito tempo.

Eu já trabalhei com 13700k / 13900ks e o meu 13700kf. E stock todas boards da asus fazem undervolt (AC_LL mais baixo), em todos eles reduzir o AC_LL ainda mais manualmente permite cerca de 20-30mv undervolt antes de ficar instável (whea errors/crashes) em loads pesados como y-cruncher small fft/prime95 smallfft/ stockfish chess engine.

Não deve ser difícil que apareçam chips com vf curve mais apertada que fiquem instáveis com o UV stock que as boards aplicam.

 
Última edição:

A culpa é de ambos. Mas o utilizador final também tem culpa.
As boards não deviam remover power limits stock. Mas se um chip crasha stock com power limits (pl1/pl2 253w / ICCmax 307A) é problema da intel.

Intel fail safe/baseline obviamente que torna qualquer chip estável, mas se um chip precisa dessa voltagem toda é RMA e nem devia ter saído da fábrica.

As boards fazem UV de origem (SVID trained/auto). Dos 4 chips da Intel que testei todos têm +- a mesma margem de 20-30mv com boards Asus diferentes. Ou seja a asus já otimiza loads lines para o chip ficar no limite mas garantir estabilidade em todos os loads até 100ºC.
Isto é bom e mau. Pode sempre haver um chip ou outro que não aguente e também não é muito dificil degradar um chip 20-30mv com power limits desbloqueados...
 
Última edição:
Sinceramente, o que me surpreende é estes cpus andarem perto dos 300W há já algum tempo e só agora se começou a verificar que estão a dar problemas.
 
Degradação acho mais raro, mas também é possível. Os cores do meu 13700kf estão exatamente iguais a quando recebi o chip, mas nunca esteve a 90º+C e 250+w durante muito tempo.

Eu já trabalhei com 13700k / 13900ks e o meu 13700kf. E stock todas boards da asus fazem undervolt (AC_LL mais baixo), em todos eles reduzir o AC_LL ainda mais manualmente permite cerca de 20-30mv undervolt antes de ficar instável (whea errors/crashes) em loads pesados como y-cruncher small fft/prime95 smallfft/ stockfish chess engine.

Não deve ser difícil que apareçam chips com vf curve mais apertada que fiquem instáveis com o UV stock que as boards aplicam.


Não é fácil teres degradação ao fim só de uns meses, a não ser que a corrente seja muito elevada, mas é possivel principalmente nestas litografias mais pequenas. Degradação por temperatura, era necessário teres hotspots no chip acima de 120ºC, é claro que isto depende da resiliência da litografia a esse efeito e isso são dados internos que apenas a Intel tem acesso.

Olhando mais atentamente para este caso, parece-me ser mais um problema de controlo de qualidade da Intel. Estes chips deveriam ter mais margem para aceitarem os settings default de todas as boards, ou isso ou a spec que a Intel fornece aos fabricantes teria de ser mais apertada.

Não é por acaso que a maioria dos chips que têm tido problemas são i9s.

E tenho visto que algumas das correções que têm saido para as BIOS, com o chamado "Intel default" são ainda pior e variam imenso dependendo do fabricante da motherboard.
 
Não é fácil teres degradação ao fim só de uns meses, a não ser que a corrente seja muito elevada, mas é possivel principalmente nestas litografias mais pequenas. Degradação por temperatura, era necessário teres hotspots no chip acima de 120ºC, é claro que isto depende da resiliência da litografia a esse efeito e isso são dados internos que apenas a Intel tem acesso.

Olhando mais atentamente para este caso, parece-me ser mais um problema de controlo de qualidade da Intel. Estes chips deveriam ter mais margem para aceitarem os settings default de todas as boards, ou isso ou a spec que a Intel fornece aos fabricantes teria de ser mais apertada.

Não é por acaso que a maioria dos chips que têm tido problemas são i9s.

E tenho visto que algumas das correções que têm saido para as BIOS, com o chamado "Intel default" são ainda pior e variam imenso dependendo do fabricante da motherboard.

Se as boards operam os chips abaixo do VID em load com IA CEP disabled o problema não é da Intel...
Se não desligassem IA CEP não havia problema porque o chip faz "clock stretching" quando leva com undervolt para garantir estabilidade.

A verdade é que todos gostam de ter bons resultados nos benchmarks. Logo undervolt e IA CEP off em todas as z690/z790 stock. Dos 4 chips que testei todos estavam estáveis stock, mas como disse anteriormente, todos no limite em loads avx2 pesados. prime95 avx2 smallfft / stockfish chess engine são os loads que piores para estes chips. O stockfish é realista, porque não é um power virus.

O meu 13700k consegue -60mv em relação ao stock undervolt da asus com LLC tudo em auto. Mas no stockfish só consegue -25mv, mas também tem muito mais vdroop por ser um load com muito mais currente.
O prime95 avx2 smallfft é ainda mais pesado com mais vdroop mas é semelhante ao stockfish em termos de voltagem.
 
Última edição:
Se o problema fosse só respeitar a tabela de VID não tinhas chips que só passados uns meses começam a dar bluescreen. Tens demasiados limões vendidos como i9. Não é por acaso que a maioria dos problemas reportados são i9s.

Aliás a tabela do VID seria respeitada se a Intel fosse rigorosa em implementar limites claros naquilo que os fabricantes de motherboards podem colocar no power limit em default, as próprias recomendações para AC_LL são demasiado relaxadas e não ajuda que sejam apenas recomendações que basicamente podem ser ignoradas.
 
Última edição:
Back
Topo