1. Tämä sivusto käyttää keksejä (cookie). Jatkamalla sivuston käyttämistä hyväksyt keksien käyttämisen. Lue lisää.

Satasen prossut - Ja yleinen AMD/Intel-ketju

Viestiketju PC:n rautaan liittyvä keskustelu -osiossa. Ketjun avasi Axu_ 09.02.2012.

Viestiketjun tila:
Viestiketju on suljettu.
  1. RatCon

    RatCon Senior member

    Liittynyt:
    18.01.2010
    Viestejä:
    9,502
    Kiitokset:
    574
    Pisteet:
    193
    Ja tämän kerrot henkilölle, jolla on i5-2500 prossuna ?
    Mulla ei ole mitään syytä puolustaa kumpaakaan leiriä, mutta nää sun "faktat" näyttää kusetukselta. Sen sanoo jo terve järki kun katsoo lähemmin noita tuloksia. Käytän itse inteliä, enkä ole varma mihin prossuun ja lankkuun seuraavaksi siirryn. Pohjana P67, joten Haswell jää haaveeksi. Tein niin tai näin, vaihdan emon joka tapauksessa.

    Uppmas alkaa syyttää heti fanituksesta, jos sanoo poikittaisen sanan. Tämäkin on taas nähty.
     
  2.  
  3. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Ompas BPVestmäinen vastaus, tai sitten olet sen verran nuori kaveri, ettet vielä ole koskaan ollut tekemisissä yhtälöiden kanssa. Miten vaan.

    Pointtina oli kuitenkin: "Josta voi suorittaa vain osan rinnakkaisina".

    Oliko se 1G=1000MHz, Eli tuhatmiljoonaa värähdystä sekunnissa. Siitä tulee aika iso kerroin pienellekkin odottelulle :).
    Sitähän olet itse valitellut... Asia vaan on niin ettei yhtä threadia voi jakaa osiin (harvassa vaan on todellisuudessa vain yksi. Se toinen säie(et) voi odotella tiettyä tapahtumaa odotuslistalla tai olla niin pieni ettei se edes näy Windowsin tehtävienhallinnassa edes yhtenä%).

    Esim. Ghostsin MP: ssä on 45 säiettä +yhteydenpitoa varten 18 säiettä lisää.
    Vs. Sandy bridge, missä oli todella nopea.
     
  4. Uppmas

    Uppmas Active member

    Liittynyt:
    03.02.2013
    Viestejä:
    2,482
    Kiitokset:
    81
    Pisteet:
    58
    Ihmisen ''tervettä järkeä'' on sen verran helppo kusettaa, ettei sille kukaan järkevä ihminen paljoa painoarvoa anna.
    Jos ei ole järkeenkäypää syytä kiistää tuloksia, niin joko ei ota kantaa ollenkaan tai myöntyy tuloksiin.
    Terve järki ei ole mikään argumentti, vaan argumentaatiovirhe (argumentti henkilökohtaisesta epäuskosta).

    Se koira älähtää mihin kalikka kalahtaa?
    Jos viittaat kommenttiin ''Ainoa mikä minua kyrsii, on kun faktoja pitää ruveta vääristelemään oman henkilökohtaisen merkkiuskollisuuden takia.'', niin en yksilöinyt ketään. Itse kukin tietää varmasti, kuvaileeko tuo kommentti juuri häntä.
    Minä kun en keksi muuta syytä sille, miksi kiistäisi testitulokset ilman todisteita niiden epäuskottavuudesta, kuin merkkiuskollisuus.
    Jotain parempaa ja hienostuneempaa syytä olen kysellyt, mutta sellaista ei ole kuulunut.
     
  5. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Vainosan pystyy = kaikkia ei pysty? Ne mitä ei pysty suorittaan rinnakkaisina suoritetaan enimmäkseen rinnakkaisina noin.

    Jaa? Aikasemmin nanosekunti sinne tai tänne oli yks lysti.

    Ne Windowsin säikeet on ihan eri asia ku mistä ny puhutaan. Montakohan säiettä on Superpi:ssa? En tiiä.

    Häh? Tossahan pitkään selitin kuinka Sandyn korkee latenssi oli syy lagiin. Haswellissa korkeempi latenssi = Haswell lagaa vielä pahemmin.
    Sandy Bridge=lagip*aska
    Haswell=pahempi lagip*ska
     
  6. Ransester

    Ransester Active member

    Liittynyt:
    20.07.2007
    Viestejä:
    2,360
    Kiitokset:
    2
    Pisteet:
    68
    Eikö tämän voisi vaihtaa jo AMD vs. Inteli APU-prossut. Eihän AMD ole enää highendissä edes mukana kilpailussa.
     
  7. Gereti

    Gereti Senior member

    Liittynyt:
    08.10.2011
    Viestejä:
    8,356
    Kiitokset:
    426
    Pisteet:
    163
  8. RatCon

    RatCon Senior member

    Liittynyt:
    18.01.2010
    Viestejä:
    9,502
    Kiitokset:
    574
    Pisteet:
    193
    Montako kertaa pitää sanoa, että mulla on intel i5-2500 ?
    Viimeeks kun oli AMD koneessa, se oli Athlon kannalla s939.

    Upmmas vetää taas syytöksiä vaikka väkisin, kun ei muuta keksi.
     
  9. Uppmas

    Uppmas Active member

    Liittynyt:
    03.02.2013
    Viestejä:
    2,482
    Kiitokset:
    81
    Pisteet:
    58
    Niin? Kaikki ihmisvihaajatkin ovat ihmisiä.
    Eivät perustelemattomat väitteet tai merkkiuskollisuus ole välttämättömästi riippuvaisia omistetuista tuotteista, itsensä tai omistamansa tuotteen (jälkimmäinen etenkin) irrationaalinen halveksuminen / vastapuolen irrationaalinen tykkääminen on täysin mahdollista.

    Hyvin kyllä välttelet asiaan kommentoimista ja takerrut mitättömiin seikkoihin.
    Minähän juurikin keksin kysyä perusteluita tuon graafin hylkäämiseen, vastaukseksi sain aurinkoakin kirkkaamman oppikirja-argumentaatiovirheen. Minä juurikin annoin (ja annan yhä) tilaisuuden antaa jotain järkevää kritiikkiä pointtiani kohtaan.

    Sitä odotellessa...

    Voit olla ihan varma siitä, että minua ei sinun henkilökohtaiset motivaatiot juuri paljon päätä pakota. Ihmetyttää lähinnä kun viestejäsi luen.
     
    Viimeksi muokattu: 02.08.2014
  10. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Kts. alla.

    En ole puhunutkaan Windowsin taustaprosesseista/ säikeistä. Tuossa äsken ollut karkea laskuesimerkki koski nimenomaan pääprosessin jakamista säikeisiin. Ja esim. Ghostsin MP: ssä on 45 säiettä (+yhteydenpitoa varten 18 säiettä lisää. Korjaus: ei koske pelkästään Ghostsin yhteydenpitoa)
    vaativat paljon enemmän yhdensäikeen suorituskykyä kuin esim. Windowsin taustaprosessit.

    Toki, jos on monta toisistaan riippuvaista säiettä, voidaan nitäkin aina kun mahdollista suorittaa rinnakkain.
    Siitä on esimerkkinä MulticoresuperPI. Jossa on valitun säie määrän mukainen määrä prosesseja, joista kukin sisältää neljä peräkkäin suorittavaa säiettä. (+ikkunasta tulee yksi) Siitä tosin puuttuu ne toisten säikeiden lopputuloksesta riippuvaiset säikeet ja on niiltä osin kevyempi.

    Kysyit aikaisemmin:
    Eli jos puhutaan heikommasta yhden ytimen suorituskyvystä. Tähän olet saanut nyt vastauksen.

    Tuossakin näkyy vajaan sek. ero (FX 8350-i7 4770K), joka johtuu heikommasta säie tehosta. Joka kertautuu kun laskettavaa on enemmän ja se on monipuolisempaa.
    Kyse ei siis ole yleensäkään "huonosta/ antiikkisesta" koodauksesta vaan tarvittavasta yhden säikeen tehosta. Multitaskauksessa/ monisäikeistetyissä softissa se vaan korostuu.

    SuperPI: ssä on yksi säie +yksi tulee ikkunasta. Säikeistystä on helppo tutkia ainakin Win8.1: llä, menemällä: Windowsin resurssienvalvonta -> suoritin.
    Poistin bioksesta käytöstä 2- ydintä:
    [​IMG]
    Kaikki taas käytössä:
    [​IMG]
    Graffi on pysäytetty, keskellä kuvassa valkoinen viiva, josta kohdasta tiedot on vas. ylä nurkassa.
    Minkäänlaisia viiveitä en huomannut, ehkä 6- ytimellä rivakkampi, aika parantui 21,6s->15,6s eli n.28%.

    Ei, vaan valittelit sen vaihtelevan, sitä se ei enään tee.
     
  11. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Termi voi olla väärä jne mut yleensä 1 säikeen softa käyttää yhtä ydintä eikä hyödy vaikka pistettäis lisää ytimiä. Windowsin säikeet eri juttu.

    En saanu. Toi pätee tollasenaan vaan jos ne ylimääräset ytimet idlaa. Toisekseen konkreettinen esimerkki jäi saamatta. Amd on tarpeeks nopee yhellä ytimellä joten ei merkitystä.

    Muistutan et FX-8350 prossussa on vaan 4 FPU:ta. Eli AMD:n FPU on pirun vahva. Samalla näkee miks Intelin rakenne kelpaa museoon.

    Eiköhän Seiskallaki onnistu. Katon joskus.

    Testaas L3 latenssi vaikka Sandralla ja oot parempi mitä mikään maksettu testisivu.

    Ring bus hidastuu useemmista stopeista tai se ei oo ring bus.
     
  12. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Kokoajan ratkaisee yhdensäikeen suorituskyky, riippumatta siitä lasketaanko niitä yhdellä tai useammalla ytimellä.

    Intellin HT on siitä hyvä että, yleensä säikeet harvoin tarvitsevat koko ytimen 100% tehoa, jolloin ei haittaa vaikka loogisen ytimen suorituskyky ei olekaan fyysisen ytimen veroinen ja silti jää vielä koko vahva fyysinen ydin käytettäväksi.


    Tuo Ghostsin (MP) 45 säiettä on hyvä esimerkki. Oli ytimiä sitten esim. 4 tai 8: an, joutuu käyttis multiplexaamaan säikeille CPU: n käyttöajan eri ytimille. Mitä nopeammin säie on laskettu, sitä nopeammin päästään seuraavaan ettei käyttäjä esim. huomaa FPS: n laskua tässä tapauksessa.

    Joo ja ei. Tuo on vain yksi testisofta, eikä se sisällä mitään monipuolista/ sekalaista laskettavaa.
    Intel ei ole siirtynyt eikä ole siirtymässä moduli- ytimiin. Koska sen haitat on selkeät.

    SiSoft Sandran sivuilla on jo testattu Sisofttilla.

    Memory latencyt (sisältää siis koko paketin yhteensä):

    i5-2500K (sandy):
    Sequential 7.7ns
    In-page random 25.3ns
    Full random 75.6ns

    i7-3960K (sandy-e):
    Sequential 6ns
    In-page random 22ns
    Full random 65.8ns

    Eli ytimien lisääminen EI lisää viivettä/ vasteaikaa.

    Ja aikavaihtelun näet tuosta:
    Scalability to the number of processor cores is not the only advantages of the ring bus. The latency of the L3 cache has also gone down, since data transfers along the “ring” take the shortest route. Now the L3 cache latency is 26-31 clock cycles, while the L3 cache in Nehalem processors offered 35-40 clocks latency. However, in this case you should keep in mind that all cache memory in Sandy Bridge works at the processor frequency, i.e. this is another reason why it has become faster.
    Lähde: http://www.xbitlabs.com/articles/cpu/display/sandy-bridge-microarchitecture_4.html
     
    Viimeksi muokattu: 03.08.2014
  13. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Mitä useemmalla lasketaan, sitä vähemmän ratkasee.

    Eikä jää koska looginen ydin ei laske mitään. Se ei tee muuta ku syöttää laskettavaa fyysiselle. Looginen ydin ei yksin toimi.

    Mitä enemmän ytimiä, sitä enemmän voi dedikoida säikeitä ytimille. Toimii noinki päin.

    Sellanen softa joka sopii tosi huonosti AMD:lle. Silti AMD pärjää hyvin. Intel ei siirry moduuleihin koska ei pysty.

    Toossa ei oo testattu 1. Kovalla kuormalla 2. Miten vaikuttaa haut eri ytimeltä.

    Piti olla Sandy vs Haswell eikä Sandy vs Nehalem.
     
  14. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Jos otetaan esim. kaksi 8- ydin prossua, jotka ovat eri arkkitehtuuria keskenään ja suoritetaan molemmilla samat x- määrä rinnakkaisia säikeitä. Ja toisella prossulla on parempi yhdensäikeen laskentateho. Saa toinen prossu ensin laskennan valmiiksi.
    Kyllä laskee. Pystyy laskemaan perättäisiä säikeitä samanaikaisesti ja kaikki loogiset rinnakkaisia samanaikaisesti. L1 syöttää corea.
    Mitenköhän ne prossut toimivat tuossa "syöttö mallissasi" missä ei ole kuin fyysisiä ytimiä pelkästään, vaatisi varmaankin jo erilaisia koodia (vs. loogiset).
    Joillekkin säikeille on määrätty erilaisia onaisuuksia, esim. tietty suoritusaika.

    Eikä esim. 4/8- ytimisten prossujen yhden säikeen laskentatehoa näe suoraan ytimen määrästä. Taas jos ovat molemmat samaa arkkitehtuuria, on 8- ytiminen tehokkaaampi.
    1. Itse halusit mitata Sisoft Sandralla.
    2. Ei vaikuta mitään, koska Sandy-E: n L3 välimuisti on kaikkien ytimien välissä (keskellä).
    "L3 cache latency is 26-31 clock cycles" Siinähän se on Sandy, olet itse vaan väittänyt Haswellin toimivan samoin.
     
    Viimeksi muokattu: 04.08.2014
  15. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Koska toisessa on enemmän laskentatehoo ko. softalla. Ero on silti pienempi mitä se olis yhen säikeen softalla.

    Ei tasan tarkkaan pysty. Miten looginen ydin laskee ilman laskentayksiköitä? Oliski melkonen läpimurto saada nykyprossuilla laskettua FPU laskuja poistamalla FPU kokonaan.

    Fyysinen ydin ottaa laskuja ja laskee. Looginen ei laske vaan ainoostaan varastoi laskettavaa.

    Ei suoraan näekään. Ja se 8-ytiminen on tehokkaampi vaan jos kaikki ytimet saa käyttöön.

    1. Ei tullu muutakaan softaa mieleen ja Sandrassa ei pystykään valitteen vaan yhtä ydintä käyttöön.

    2. Mihin se Ring bus hävis? Sandy Bridge E:sta se löytyy.
     
  16. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Eli mielestäsi, jos käytän, lasken 6- fyysisellä ytimellä (joissa 6 kpl FPU: ia) laskentatulos ei voi enää siitä nopeutua, kun otan HT: n käyttöön ja suoritan laskentaa 12- loogisella ytimellä?

    Niin ja L1 välimuisti varastoi.
    Ei se minnekään hävinnyt, mielestäni siinä vaan ei ole mitään mielenkiintoista, se on vaan nimitys käytetylle tekniikalle. Menin vaan suoraan "ongelman" ytimeen.
    Lainaus:"256-bit/cycle ring bus interconnect between cores, graphics, cache and System Agent Domain".
    http://en.wikipedia.org/wiki/Sandy_Bridge
     
  17. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Voi nopeutuu JA tulla hitaammaks. HT usein hidastaa.

    Loogisesta ytimestä L1 välimuisti puuttuu, fyysisestä ei.

    Siinä on se mielenkiintonen asia et latenssit voi kasvaa tosi isoiks varsinki isoilla kuormilla. Eikä pelkkä L3 latenssi kerro paljookaan koko latenssista.

    Tossa muuten näkee miten heikosti muut testailee tolla Sandralla. Intelin L3 kakku on jaettu 2 megan siivuihin, joten latenssin pitäis muuttua (ja muuttuuki) 2 megan ja 8 megan välillä selkeesti. Siks pitäis antaa useempi latenssiarvo. AMD:lla voi käyttää yhtä L3 latenssiarvoo, Intelillä ei.
     
  18. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Vielä äsken olit satavarma, nyt kumpikin onkin mahdollista!
    Vaikka kaikkien FPU: tien teho onkin jo "käytetty" paranee aika MulticoresuperPI: ssä 128M: n testissä -1.8sek. Wprimessä paranee -1.4 sek, lyhyessä testissä.
    AMD: llä (FX vs 4770K) molemmissa 4 FPU: ttia silti AMD jää, eikä saa mitään lisätehoja 4: stä lisäytimestä! Vrt. HT josta yleensä on apua.
    Niin, niissä mun esittämissä "memory latencyissä" oli mukana L1, L2, L3 ja RAM huomioituna.
    Ja se Sandyn L3 välimuistin viiveen vaihteluväli on 26-31 kello sykliä. Haswellin ei vaihtele, se on 36 kello sykliä. (jos se nyt ketään kiinnostaa)
     
  19. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Missä kohtaa olin varma? Se et looginen ydin varastoi ei tarkota et se aina nopeuttais. Netistä löytyy hitosti testejä joissa HT hidastaa.

    AMD saa apua 4 lisäytimestä heti ku laitetaan muuta ku FPU laskentaa. HT:sta on usein haittaa, 4 lisäytimestä harvoin.

    Ring bus ja latenssi ei vaihtele. Vaihtoehdot: 1. Haswellissa ei ring bussia, 2. Haswell hidastaa nopeetki haut hitaimman tasolle 3. testi kusee.

    Ykkönen ei pidä paikkaansa, kakkonen olis aika tyhmää. Kolmonen pätee suunnilleen jokaseen testiin.
     
  20. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Kaikki jotka ovat tätä seuranneet tietävät mistä on kyse, ei siitä sen enempää.
    Juurihan sen todistin, että laskee. Loogisten ydinten/ HT: n laskemisen huomaa myös lisääntyneenä tehonkulutuksenakin.
    Meinasitko mennä HDD, SSD, RAM, L3 cache, L2 cache vai L1 cache: n viiveillä? Kaikilla on omansa. Viime kädessä on vielä näytön input lag+response time (signaalin käsittely+vasteaika). Input lag on aika joka kuluu siitä kun signaali on tullut näytölle (elektroniikalle) ja tullut kuvana ruudulle näkyviin. Response time on aika mikä kuluu kun esim. hiiren osoitinta siirretään eri paikkaan. Noihin kuluu muutamia ms: ja.
    Yleensä luvatut vasteajat näytöille eivat pidä ihan kutiansa, kun nuo molemmat huomoidaan. Esim. eräs uutuusnäyttö, luvatut arvot: 144Hz, 1ms. Ovat todellisuudessa 2.55ms+1.45ms= 4ms keskiarvona. Lisäksi näytön viiveisiin/ vasteaikaan vaikuttaa mistä väristä on kyse....Tässä vähän perspektiiviä sille, miten tärkeitä ovat yksittäiset ns: t, kun kokonaisuus ratkaisee.

    Olet väittänyt AMD: n reagoivan selkeesti Intelliä nopeammin, jos olet edelleen samaa mieltä. Tee itse mieleisesi testi (ja laita näytille) jonka mielellään toistan ja joka vahvistaa väitteesi. Sullahan on ytimiä enemmän, joten pitäisi olla puheittesi mukaan helppo "nakki"?
     
  21. Themu

    Themu Active member

    Liittynyt:
    18.01.2006
    Viestejä:
    3,105
    Kiitokset:
    85
    Pisteet:
    78
    vähemmä mutua ja lotinaa ja enemmän ite tehtyjä testejä. Ruvetaan vertaileen vehkeitä kuin pojat uimahallin pukuhuoneessa.
     
    ThaGh0stED, IlmoPJ ja Axu_ kiittävät tästä.
Viestiketjun tila:
Viestiketju on suljettu.

Jaa tämä sivu