1. Tämä sivusto käyttää keksejä (cookie). Jatkamalla sivuston käyttämistä hyväksyt keksien käyttämisen. Lue lisää.

Satasen prossut - Ja yleinen AMD/Intel-ketju

Viestiketju PC:n rautaan liittyvä keskustelu -osiossa. Ketjun avasi Axu_ 09.02.2012.

Viestiketjun tila:
Viestiketju on suljettu.
  1. jartar

    jartar Senior member

    Liittynyt:
    07.04.2004
    Viestejä:
    8,485
    Kiitokset:
    111
    Pisteet:
    143
    Se on todella suuri ero. Puolet pois tehonkulutuksesta ja potentiaalia olisi ollut jo täysin eri tavalla tuossa prossussa.
    Ei minun mielestä. Kukaan muu kuin sinä ei käytä täällä roskasoftia. Ei mulle tulisi sellainen mieleenkään.
    Ei se ole boikotointia. Käsket muita välttämään SINUN mielestä huonosti koodattuja ohjelmia/pelejä mutta kuitenkin itse käytät niitä. Ei ole kovin loogista.
    AMD myönsi, että niiden prossu on huono. Sitä se todellakin on kun kokonaan uusi arkkitehtuuri haudataan vähän ajan päästä ilman yhtäkään prossua joka oltaisiin tehty pienemmällä valmistustekniikalla. AMD siis tiesi alusta asti, että prossusta ei tullut niin hyvä kuin oli tarkoitus. Sen parantelemiseen ei käytetty liikaa resursseja. Ihan järkevää AMD:ltä kun säästävät rahaa uuden kehityksen, sen sijaan että koittaisivat tekohengittää epäonnistunutta tuotetta. Pisteet siitä.
     
    Whatta Heck kiitti tästä.
  2.  
  3. wwallu

    wwallu Senior member

    Liittynyt:
    06.08.2014
    Viestejä:
    16,458
    Kiitokset:
    3,876
    Pisteet:
    243
    AMD:llä varmaankin ajateltiin että jossakin vaiheessa pelitkin säikeistyisivät paremmin. En nyt sanoisi että bulldozer täysin kehityskelvoton olisi - excavator-fx ja 8 ytimen peli niin eihän i7 pärjäisi alkuunkaan. Kun tuollaisia pelejä ei sitten alkanut kuulua niin eihän jatkokehittelyihinkään tietenkään kannattanut hirveitä panostaa. Zenin julkaisun aikoihin noita luulisi jo olevan, joten hötkyiliköhän AMD tässä onnensa ohi?

    Jos edelleen peleistä puhutaan niin itse odottelen aina vähintään puoli vuotta julkaisusta ennen kuin menen ostamaan, mutta bugista roskaa nuo tuppaavat silti monesti olemaan. Mutta jos pelata haluaa niin minkäs teet, noihin on tyytyminen.
     
    BPVest ja Whatta Heck kiittävät tästä.
  4. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Ehkä kuvaavampaa on sanoa maalataan. Ultran ohjeessa on muistaakseni 3-4 viivan väliä, riippuen lämmönlevittäjän koosta. Tässä tapauksessa olisi sirun koko n. kolmas osa siitä, eli n. 1 viivanväli.
    Ompa outoa, oman kokemuksen mukaan lähtee todella helposti pois isopropyylialkoholilla (mukana tulee yksi liina, apteekista saa lisää). Ek-block: ssa näyttää olevan vielä peilin kirkas pinta..
    Kyllä on, kaikki ytimet 100%: ia, käytännön softaan perustuva testi: Vakio coolerilla ja vielä kellotettujakin prossuja :):

    http://hwbot.org/benchmark/cinebench_r15/rankings#start=0#interval=20#coolingType=1#cores=4
    Turbo boostit pysyvät päällä.
     
  5. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Kyse ei vieläkään ollu siitä et FPU voitais poistaa prossusta. Kyse oli siitä tarvitaanko prossuissa vahvaa FPU:ta. Supertietokoneissa, joissa FPU tehoo tosissaan tarvitaan paljon, FPU hommat hoidetaan pääasiassa näyttiksillä. Pöytäkonepuolella taas FPU tehoo ei paljoo tarvita. Tarkottaa et FPU tehoo voi rankasti vähentää pöytäkoneprossuissa. Intelin ja AMD:n uusimmat tehoprossuarkkitehtuurit (tarkottaa: Bulldozer ja Pentium 4) on suunniteltu pääasiassa kokonaislukulaskentaan, eli FPU tehoo on pienennetty selkeesti kokonaislukulaskennan kustannuksella. Oot aika hankalassa tilanteessa koska Intelin ja AMD:n uusin arkkitehtuuri teki sun mielestä tyhmästi. Et saisko vähitellen niitä perusteluja? Selitykses olis selkeesti uskottavampi jos vaan AMD "olis tehny tyhmästi". Koska Inteliki teki, se kertoo siitä et molemmat valmistajat on periaatteessa samaa mieltä asiasta. Vieläkään se AMD:n FPU teho ei oo se pahin ongelma.

    Tuolta voit ettiä missä selkeesti huonompi FPU teho todellisuudessa näkyy http://www.anandtech.com/show/4955/the-bulldozer-review-amd-fx8150-tested/7

    FX-8150 ei FPU tehossa pärjää mitenkään Phenom II X6:lle.

    x86 on antiikkista mut x86:n sisälläki voidaan sanoo osaa arkkitehtuureista antiikkisemmiks mitä toisia.

    Se vois helpostiki onnistua paremmalla valmistustekniikalla.

    Ne ei tiedä käyttävänsä roskasoftia.

    Väitän softaa roskasoftaks kokeilematta, ei kelpaa koska ei kokemusta siitä.

    Väitän softaa roskasoftaks ja kokemusta on, ei kelpaa koska käytän roskasoftia.

    Vaikee tilanne.

    AMD:n prossu ei edelleenkään oo huono. Aika monta erinomaista prossua on menneisyydessä muuttunu huonoiks koska softa kusee. Ei AMD:lla oo tällä hetkellä vaihtoehtosta "parempaa" valmistustekniikkaa. AMD tiesi et ne ei saa parempaa valmistustekniikkaa ihan pian, joten voivat samantien kehittää uuden arkkitehtuurin. Mikäli se floppaa täysin, voidaan jatkaa Bulldozerin kehittelyy.

    :rolleyes:
     
  6. Whatta Heck

    Whatta Heck Senior member

    Liittynyt:
    16.09.2011
    Viestejä:
    10,263
    Kiitokset:
    1,293
    Pisteet:
    243
    Eli X6 1090T @ 4GHz (spoiler) on käyttökamaa edelleen? Hmm, jos noin ajattelisi niin katsellaan vielä tovi noita Amd:n uutuuksia sitten. Olisi jo aika siellä kehitellä voimakasta kiveä markkinoille, kilpailua. Sittempäs Zen näkee. :D
     
    Viimeksi muokattu: 31.01.2015
  7. R4ndom1

    R4ndom1 Regular member

    Liittynyt:
    06.06.2013
    Viestejä:
    588
    Kiitokset:
    52
    Pisteet:
    38
    Supertietokoneita on turha verrata pc koneisiin, koska niiden käyttötarkoitukset ovat täysin erinlaiset, ja yllättävän harvoin ne koostuu näyttiksistä (yleensä perusprossuista tai/ja erillisistä laskentaprossuista). Ja kaikkea laskentaa ei edelleenkään voi hoitaa näyttiksellä, eikä vielä ole kunnollista apia, joka toimisi joka alustalla hyvin. Sovelluskehittäjien pitäisi kehittää kolme veriota ohjelman ominaisuudesta, cuda, opencl ja cpu, mikä on kallista. Sitten ku gpgpu laskenta on siinä vaiheessa että voitaisiin rueta karsimaan prossujen fpu tehoa, on FX:t jo historiaa. Eli prossuissa tarvitaan tehokas FPU. AMD on karsinut sen tehoa, mikä näkyy testituloksissa. Onko se niin vaikea ymmärtää?
     
    Whatta Heck kiitti tästä.
  8. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Se on ihan käyttökamaa varsinki FPU softissa jotka ei käytä niitä käskykantoja jota siitä ei löydy.

    Uusissa supertietokoneissa käytetään näyttiksiä (tai erillistä laskentaprossua, monesti melkein sama asia). Homman voi ilmaista näinki: supertietokoneissa tarvitaan paljon FPU tehoo, joten käytetään näyttiksiä. Miks kotikoneissa ei käytetä näyttiksiä laskennassa apuna? Koska FPU tehoo ei tarvita paljoo.

    Prossujen FPU tehoo karsittiin Intelin osalta vuonna 2000 ja AMD:n osalta 2011. Eli prossuissa ei olla tarvittu tehokasta FPU:ta sitten vuoden 2000.

    Se on vaikee ymmärtää. Phenom II 1055T ja FX-8150 vetää melkein samoilla kelloilla. Phenom II:ssa on selkeesti enemmän FPU tehoo. Silti FX-8150 on keskimäärin selkeesti nopeempi. Asian ei pitäis oll noin jos FPU teholla olis oikeesti suuri merkitys. Niinku AMD sano, karkeesti 90% normisoftien laskennasta vedetään ilman FPU:ta. Ehkä just ton takia AMD ei panostanu FPU tehoon.

    Voisit oikeesti antaa tolle "FPU tärkee" väitteille jotain perusteluja. Se et Intel pärjää hyvin AMD:ta vastaan ei riitä koska AMD:n "vahva" FPU prossu häviää AMD:n "heikko FPU" prossulle ja sillä perusteella FPU ei oo se mikä ratkasee Intel vs AMD.
     
  9. R4ndom1

    R4ndom1 Regular member

    Liittynyt:
    06.06.2013
    Viestejä:
    588
    Kiitokset:
    52
    Pisteet:
    38
    Supertietokoneiden käyttötarkoitukset eroavat paljon pc tietokoneista. Simulotko sinä koti pc:lläsi mahdollisia säitä ja ennustat niitä? Semmoset asiat vain voidaan helposti laskea rinnakkain. Supertietokoneissa ei paljoa käytetä näyttiksiä, mitä järkeä on maksaa grafiikkapiireistä joissa hintaa on lisäämässä teksturointi ja rasterointi yms. yksiköitä.

    Annappa lähdettä sille että intel olisi järjestelmällisesti laskenut kaikkien prossujen FPU:iden tehoa. 2000 vuonna näyttiksistä puuttui kokonaan tuki omille shadereille eikä niillä ollut mahdollisuutta laskea yhtään mitään. Intel vain laski joidenki prossujen FPU:iden tehoa, jotta ihmiset ostaisi kalliimman version. Kerroppa mulle minkä takia liukuluvut muuttuivat turhiksi vuonna 2000? Joskus 90-luvulla prossut oli hitaita ja liukulukuja piti ohjelmoidessa välttää kuin ruttoa jos halusi ohjelman toimimaan nopeasti. Miten on mahdollista että kun prossujen tehot alko riittämään liukulukulaskentaan, niin yhtäkkiä liukuluvut muuttui turhiksi?

    FX-8150 69.48 gflops ja Phenom II X6 1090T 55.55 gflops (flops = floating point operations per second), on phenomissa selkesti enemmän FPU tehoa :D:D:D:D

    Tottakai suurin osa ohjelman laskennasta on kokonaislukuja, kaikki osoittimet ja indeksit tallennetaan kokonaislukuina, mutta se ei poista sitä faktaa että FPU:iden teho vaikuttaa erittäin paljon prossun tehoon. Yksinkertaisesti gpgpu-laskenta on vielä niin alkeellisella tasolla, ettei sitä pysty hyödyntämään kunnolla ja joidenki asioiden tekeminen sillä vain on yksinkertaisesti mahdotonta. Lisäks se käyttäminen vaatisi tuhottomasti lisää aikaa ja rahaa ohjelmaa kehitettäessä.
     
    Viimeksi muokattu: 31.01.2015
  10. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    :rolleyes:..... Vakiokellot on 3500MHz, vakio turbo boostit 3900MHz: iä. 4500MHz > 3900MHz: iä. :)
     
  11. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Kuitenki esim IBM:lta on tulossa supertietokone jossa on Nvidian näyttiksiä.

    Intelin julkastua Pentium 4:n, kaikki uudet prossut perustu siihen. Kunnes tuli Pentium 3 refresh joka Core nimellä tunnettiin. Tosta mallia

    [​IMG]

    Intelillä todettiin et suuri osa laskennasta vedetään kokonaisluvuilla joten ei järkee panostaa hirveesti FPU laskentaan.

    [​IMG]

    Siitäki huolimatta et Phenomissa selkeesti huonommat kakut sun muut. Raaka FPU teho vielä suurempi ero, pl käskykantatuet tietenki.

    Sais vielä tohon "vaikuttaa erittäin paljon prossun tehoon" jotain faktaa. AMD vs AMD ei tuota suurta eroo. Intel vs Intel ei tuota suurta eroo.

    http://www.anandtech.com/show/661/16

    Meinaan Pentium 4:n ei pitäis pärjätä alkuunkaan Pentium 3:lle jos FPU teholla olis suuri merkitys. Ja toi oli vuonna 2000.
     
  12. R4ndom1

    R4ndom1 Regular member

    Liittynyt:
    06.06.2013
    Viestejä:
    588
    Kiitokset:
    52
    Pisteet:
    38
    Suuri silloin vuonna 2000 liukulukujen merkitys oli kaikkein suurimmillaan. Silloin esim. peleissä kun ei ollut mahdollisuutta omille shadereilla, jouduttaa lähes kaikki verteksikohtaset laskut tekemään prossulla. Eikä toisinku joskus 90-luvun alkupuolella, voitu peleissä käyttää kokonaislukuja (ymmärrät varmaan miks 3d peleissä on käytetään liukulukuja).

    En jaksa asiaan tarkemmin tutustua, mutta pentium nelosissa oli kuitenki huomattavasti isommat kellot ja myös enemmän mflopseja, eli todellisuudessa liukulukulaskentateho kasvoi, ei vähentynyt kuten sinä täällä väitit. http://www.roylongbottom.org.uk/linpack results.htm

    Tuossa oli vain yksi testi ja testitulos. Kun katsotaan useampia testejä, voidaan sanoa että FX oli nopeampi lähes kaikissa multi thread testeissä, oli laskettavan sitten liukuluja tai kokonaislukuja. Joissaki testeissä se pesee jopa 2600k:n, vaikka testi olisi aika liukuluku painotteinen. Phenomi taas pesee FX:n single thread testeissä.

    Lue netistä vaikka jotaki open source projektien lähdekoodeja, siellä koodissa tulee kuitenki yllättävän paljon liukulukulaskuja, ja ymmärrät varmaan että heikolla FPU:lla, ne liukulukuoperaatiot suoritetaan hitaammin, joka hidastaa ohjelman suoritusta. Joissaki ohjelmissa (kuten vaikka tekstinkäsittely) liukulukulaskujen merkitys on erittäin pieni, mutta toisissa taas (kuten peleissä ja mallinnusohjelmissa) liukulukulaskenta teho merkkaa erittäin paljon. Ja kuten yllempänä mainitsin, niin pentium 4 oli parempi mflops teho, eli niissä oliki parempi liukulukulaskentateho, ei suinkaa huonompi kuten väitit.
     
    i9Extreme kiitti tästä.
  13. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Sehän tosta hommasta tekeeki mielenkiintosen. Intel suunnittelee sellaselle ajalle jossa FPU on tärkee prossun jossa FPU on hidas.

    Just ton takia oliki melkonen ongelma "FPU on tärkee" faneilla selittää miks Quake 3 Arenassa Pentium 4 pärjää niin hyvin. Sillä ei pitäis olla mitään mahiksia Pentium 3 vastaan koska Pentium 4 ei alkuunkaan pärjänny FPU laskennassa vs Pentium 3 ellei ollu SSE tai SSE2 käytössä. Tarkottaa käytännössä tota

    http://techreport.com/review/2784/intel-pentium-4-2ghz-processor/7

    Niinku näkyy, Pentium 4:lla ei oo mitään mahiksia x87 FPU laskennassa. Ts Athlon 1.4 GHz tulos on 58 ja Pentium 4 2 GHz tulos on 95.5. P4 pärjää sentään kohtuullisesti koska kelloja on selkeesti enemmän. Mitä tapahtuu ku laitetaan FPU painotteinen 3D-peli joka ei tue SSE/SSE2, eli Quake 3 Arena?

    http://techreport.com/review/2784/intel-pentium-4-2ghz-processor/8

    Oho. Kuinkas se noin? Edelleen se miks se hidas FPU ei näy peleissä ees sellasella aikakaudella jolloin FPU:n merkitys on suurimmillaan http://www.anandtech.com/show/661/16

    Sepä se. FPU:n merkitys ei ollu suuri ees sillon ku FPU tehoo tarvittiin enemmän mitä nykysin. Jos sillon ei tarvittu vahvaa FPU:ta, nykysin tarvitaan vielä vähemmän.

    Toi pitää paikkaansa vaan SSE2 softilla, ei x87:lla. Vuoden 2000 tienoilla SSE2 softia oli olematon määrä. Joten tota ei voi pitää mittarina 2000 vuoden alkupuolelle.

    Tossa lasketaan pelkkiä liukulukuja. Olennaista onki just se et pelkkiä liukulukuja lasketaan tosi harvassa softassa, siks turha siihen FPU tehoon liikaa panostaa. Vai onko AMD vaan tyhmä koska panosti kokonaislukulaskentaan (90% softista) ja jätti panostamatta FPU laskentaan (10% softista)?

    Heikolla FPU:lla ne laskut voidaan hoitaa nopeemmin. AMD K6:ssa oli selkeesti nopeempi FPU (ei liukuhihnaa) mitä Pentium 3:ssa (liukuhihna), kunhan pidettiin laskettava vähäsenä. Ts vähäseen laskentaan ei tarvita vahvaa vaan nopee FPU jotka on eri asioita.

    Niinku jo sanoin, toi tulos oli SSE2 optimoidulla (Pentium 3 ei sitä tue) versiolla, joten tulos ei kuvaa tilannetta vuonna 2000 ja siitä muutama vuosi eteenpäin ollenkaan.
     
  14. R4ndom1

    R4ndom1 Regular member

    Liittynyt:
    06.06.2013
    Viestejä:
    588
    Kiitokset:
    52
    Pisteet:
    38
    Ja jälleen kerran BPVest linkkasi vain yhden testituloksen joka tukee hänen väitettä. Joissaki peleissä taas p3 voittaa p4:n. Pentium 4:n oli nopeasti kyhätty puolivalmis prossu jonka oli tarkotus saada vähän kiinni AMD:ta jonka prossut oli nopeampia. Pentium 4:ssä se miten nopeasti ohjelma toimii riippuu paljon ohjelmasta ja kääntäjän asetuksista, ei pelkästään käytetäänkö x87 vai SSE.

    http://fi.wikipedia.org/wiki/Intel_Pentium_4#Arkkitehtuuri
    Tuolla on myös vähän tietoa p4:stä, joka ehkä auttaa hieman havaitsemaan miksi p4 on joissaki testeissä nopea ja joissaki hidas

    Kuten tässä P4 on hitaampi ku P3
    [​IMG]
    Ja tässä se taas on nopeampi
    [​IMG]


    http://www.roylongbottom.org.uk/linpack results.htm
    Eka lista on x87. Eli kyllä se p4 on p3:ea nopeampi myös x87:ssa.


    Joka ohjelmassa käytetään johonki liukulukuja, joissaki enemmän, joissaki vähemmän. AMD ei ole missään vaiheessa selkeästi panostanut mitenkään erityisesti kokonaislukulaskentaan, eikä myöskään intel. FX on liukulukulaskennallaan selkeästi nopeampi ku Phenom II. Samotenko p4 on nopeampi ku p3.


    Häh? Mitä sä taas yrität selittää? Nopea FPU suorittaa liukulukuoperaation nopeampaa kuin hidas FPU. Miten heikko FPU voi ollakki nopea? Joo, en halua kuulla :D:D:D


    BPVest annappa jotain lähdettä sille miks FPU on turha, eikä sen teholla ole mihinkään merkitystä? Miksi intel ja amd kasvattaa uusissa prossuissaan aina liukulukulaskentatehoa, jos sillä ei kerran tee mitään?
     
  15. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Quake 3 sattu oleen sen ajan "standardi". Aattelin et osaat kattella ne muutki pelit, pistetään sit loputki.

    [​IMG]

    [​IMG]

    "Nopeesti kyhätty puolivalmis prossu", ai jaa. Muuten vaan sillä piti mennä 10 GHz:n kellotaajuuksiin. Sen suunnittelu alotettiin joskus 1995 paikkeilla. AMD meni täysin ohi vasta 1999.

    Jaa se FPU teho ei ratkassukaan vaan kääntäjän asetukset ratkas? Kumpi ny ratkaskaan?

    Synteettiset softat on siinä mielessä huonoja et ne ei välttämättä kuvaa käytäntöö. Kuitenki niillä pystyy testaan tiettyjä asioita hyvin. Et jos vaikka muistikaistaa on synteettisessä testissä tuplasti, eiköhän sitä muistikaistaa sit löydy tuplasti vaikka käytännössä vaikutus voi olla olematon.

    Synteettinen FPU testi tosta

    [​IMG]

    Ny voidaanki kysyä miks hitossa P4 ei oo melkein kaikessa hitaampi jos se x87 FPU teho ratkasee...

    Haiskahtaa enemmän cache benchmarkilta ku x87 benchmarkilta koska P3 Tualatin pärjää selkeesti paremmin mitä P3. Lisäks tuolla ei näy P4 1,4 GHz prossua joka olis se jota pitäis P3:n verrata (suunnilleen samanikäset).

    FX ei tosiaankaan oo selkeesti nopeempi. Nopeus tulee mm. siitä et se tukee uudempia käskykantoja. Lisäks P4 on nopeempi vaan jos tuetaan SSE:ta. Sama kuva edelleen

    [​IMG]

    Ei tosta kyl P4:a mitenkään nopeemmaks ilman SSE:ta saa vaikka miten kattois. Joka tapauksessa P4 on hitaampi mitä AthlonXP. Intel perinteisesti hallitti FPU laskentaa mut eikä hallinnu enää P4 aikana.

    Johan kerroin mistä kyse. K6:ssa oli FPU ilman liukuhihnaa, P3:ssa liukuhihnalla. Yksittäisen käskyn K6 laski nopeemmin koska käskyn ei tarvinnu mennä liukuhihnan läpi. Tosin tarpeeks suurilla kuormilla siitä loppu puhti ja P3 meni ohi.

    Ts K6 oli nopeempi vaikka P3 oli tehokkaampi. Eli heikko FPU tosiaanki voi olla nopee.

    Kasvattaa? Siinähän se onki. Intelin "FPU tehon kasvatus" näkyy tossa (ihana kuva)

    [​IMG]

    AMD:n puolella taas

    [​IMG]

    Oon näkevinäni 2 isoo "putkee" kokonaisluvuille ja vaan yhden liukuluvuille. Huomioidaan ny sekin et Bulldozer arkkitehtuuri on vuodelta 2011 ja K7 vuodelta 1999. Ts 2011 vuoden prossulla ei pitäis olla mitään tarvetta keskustella onko FPU nopeempi vai ei vs 1999 vuoden prossu jos siihen FPU tehoon oikeesti panostettais (FX voittais 100-0 kaikki FPU testit vs Phenom II). Sama Pentium 4:n kohdalla, P3:n pitäis hävitä kaikessa FPU:n liittyvässä eikä vaan "jos SSE2 tuettu ja kääntäjä sitä ja tätä". Toi kertoo siitä ettei siihen FPU tehoon oikeesti panosteta vaan ennemmin otetaan kokonaislukutehoo enemmän.
     
  16. R4ndom1

    R4ndom1 Regular member

    Liittynyt:
    06.06.2013
    Viestejä:
    588
    Kiitokset:
    52
    Pisteet:
    38
    http://fi.wikipedia.org/wiki/Intel_Pentium_4

    Cache benchmarkin tulokset varmasti ilmoitetaan flopseina :D

    Miten FX voi käyttää uudempia käskykantoja, jos kummatki testit on ajettu samalla binäärillä? FX-8150 69.48 gflops ja Phenom II X6 1090T 55.55 gflops

    Ei kyllä vieläkään aukee. Liukuhihnan idea on pilkkoa konekäsky useaan pieneen osaan ja suorittaa ne rinnakkain.
    http://www.students.tut.fi/~hkultala/atk/liukuhihna.html

    P4:n arkkitehtuurin idea oli toimia suurilla kellotaajuksilla. Ja tuossa p4 näyttää voittavan selkeästi p3:n.

    Tottakai kokonaislukulaskentateho on suurimmassa osassa ohjelmista tärkeämpiä (osoittimet ja indeksit on kokonaislukuja), mutta se ei tarkoita sitä että FPU olisi turha tai että sen tehoon olisi turha panostaa. Osa konekäskyistä sisältää liukulukuoperaatioita ja jos FPU:n teho on pieni, niin niiden suorittaminen kestää kauemmin, jolloin ohjelman toiminta hidastuu. Vastaavasti jos kokonaislukuyksikkö on hidas, niin konekäskyjen, joissa on kokonaislukuoperaatioita, suoritus hidastuu. Osa ohjelmista sisältää enemmän liukulukuoperaatioita, osa sisältää vähemmän, mutta ne liukulukuoperaatiot täytyy kuitenki suorittaa ja hitaalla FPU:lla ne suorittuu hitaasti, jolloin ohjelman toiminta hidastuu. Eli on turha väittää ettei liukulukulaskentateho vaikuta prossun tehoon, miksi sitä edes mitattaisi jos sillä ei olisi väliä?
     
  17. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Tuo laittamasi lista oli hyvä. Liukulaskennan yhteydessä juuri puhutaan yksin/kaksikertaisesta tarkkuudesta.

    @BPVest Kyllä Intel edelleen laittaa täydet "paukut" liukulaskentaan, eikä ole todennut mitään FPU: n laskennan vähästä merkityksestä, ei vuonna 1-2 tai tänä päivänäkään (tarvitaan esim. multimediassa ja jos ei jossain softassa sitä ole merkittävästi, on tärkeää ettei siitä tule prossulle pullonkaulaa).

    "The Core i7 5960X outperforms the fastest and highest core-count Sandy Bridge dual Xeon system! Not bad for a “desktop” processor!"

    "Intel has also just released a new version of their excellent compilers and tools, Parallel Studio XE 2015, so I’ll be giving the new compilers a workout too".

    "Intel® Parallel Studio XE 2015 tool suite simplifies the design, development, debug, and tuning of code that utilizes parallel processing to boost application performance".

    [​IMG]
    "354 billion double precision floating point operations per second, VERY GOOD!"

    Ja nyt kun ei ole AMD: tä mukana ei haittaa vaikka on Intel optimoitua.
    "Linpack benchmark using the Intel MKL optimizations".

    Lähteet:
    http://www.pugetsystems.com/blog/20...rmance-Haswell-E-Core-i7-5960X-and-5930K-594/
    https://software.intel.com/en-us/intel-parallel-studio-xe

    Näin tänä päivänä! Itseä ei ainakaan kiinnosta minkälaisia prossut oli esim. v. 2000.
     
    R4ndom1 kiitti tästä.
  18. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Wikipedia ei petä :D

    Et siis Intel suunnitteli Pentium 4:n kahessa vuodessa :D:D:D:D

    Ja et otettiin käyttöön keskeneräsenä tarkottaa mitä :rolleyes:

    Tarkottaa et kuormittaa ja testaa lähinnä cachee, ei FPU:ta. Tai vaihtoehtosesti cachella on suurempi merkitys mitä FPU:lla.

    Vaikka sillä tavalla et binääri tukee uudempia käskykantoja? Tai sit siinä on muita Bulldozer optimointeja (pl käskykannat).

    Idea pilkkoo monta käskyy osiin ja suorittaa ne monen käskyn osat rinnakkain. Yksittäisen käskyn pitää kulkee koko liukuhihnan läpi, muutenhan. Siks ilman liukuhihnaa on mahdollista suunniterlla yksikkö joka laskee nopeemmin. Tosin sellanen yksikkö todennäkösesti menee tukkoon jossain vaiheessa jos laitetaan riittävästi laskettavaa.

    Ai miten niin? Mun nähdäkseni Pentium 3 tulos on 1366 MFLOPS ja Pentium 4 1,6 GHz tulos 965 MFLOPS. Kyse oli x87 eikä SSE2.

    Niinku tossa ylempänä sanoin, nopeus ja teho voi olla kaks eri asiaa. Pienillä laskumäärillä on aivan sama mikä on FPU:n kokonaisteho jos sillä pienellä kuormalla "tehottomampi" FPU laskee suunnilleen samaan tahtiin. Ehkä ton takia Intel ei viittiny pistää hirveetä laskentatehoo Pentium 4:n FPU:n harvinaisia extreme kuormia varten. AMD:lla Bulldozerissa sama. Normisoftilla yleensä saa helpostiki kokonaislukupuolen tukkoon, mut FPU:n saa vaan jollain extreme-kuormalla jota ei normisoftissa yleensä esiinny. Ts Pentium 4:n ja Bulldozerin FPU on tarpeeks hyvä. Esim joku Cinebench on FPU painotteinen softa mut ihmeellisesti FX-8350:n multithread tulos on 6,26 kertaa parempi mitä single thread tulos. Sellanen mutta et FPU teho teoriassa on vaan 4 kertaa parempi mitä single threadissa. Mistä toi ero sit tulee? Taitaa olla aika vähissä se FPU kuormitus koska käytännössä ylitetään reippaasti teoreettinen tulos.

    Miks prossun muistikaistoja mitataan vaikka sillä ei oo mitään väliä?

    [​IMG]


    [​IMG]

    Vuoden 2000 malli oli aika surkee FPU tehoissa verrattuna edeltäjään. Koska Intel oli aikasemmin panostanu just FPU laskentaan se kertoo et Intelinki mielestä FPU teholla ei paljoo merkitystä ollu.

    Mun Radeon R9 280 vetää tuplasti. AMD:n ammattimalli vetää noin 10x.

    Sua ei siis kiinnosta Intelin uusin arkkitehtuuri työpöytäprossuille? Sit vielä ihmettelet miks haukun Intelin prossuja museokamaks :D[/QUOTE]
     
  19. i9Extreme

    i9Extreme Senior member

    Liittynyt:
    22.09.2011
    Viestejä:
    2,669
    Kiitokset:
    402
    Pisteet:
    113
    Tiedätkö kun kaikkein vähiten mua kiinnostaa väitellä samoista asioista uudeellen ja uudelleen.

    Mainitsemasi "museo"prossut ei laske kellojaan kun tulee kunnolla monisäikeistä kuormaa, kuten AMD: t tekee.:D:p
     
  20. BPVest

    BPVest Senior member

    Liittynyt:
    26.03.2010
    Viestejä:
    17,608
    Kiitokset:
    701
    Pisteet:
    173
    Ethän oo ees väitelly Pentium nelosista.

    Eihän AMD laske kellojaan, AMD ei nosta niitä. Inteliki laskee kelloja jos on tarpeeks huono jäähy tai muuten vaan kuuma.
     
    roki80 kiitti tästä.
  21. roki80

    roki80 Member

    Liittynyt:
    01.05.2014
    Viestejä:
    85
    Kiitokset:
    12
    Pisteet:
    18
    4770k jimm's 400+ € ei mitään järkeä!!!
     
Viestiketjun tila:
Viestiketju on suljettu.

Jaa tämä sivu