/ Forside / Teknologi / Hardware / Bundkort / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Bundkort
#NavnPoint
tedd 7545
BjarneD 3920
peet49 3555
Gambrinus 2905
dk 2525
Klaudi 1680
Manse9933 1215
dos-man 1010
Brommi 1005
10  srhansen 945
Ram vs. performance....
Fra : teledk


Dato : 03-05-02 13:09

Hejsa,
Jeg skal lave en PC der er hyper optimeret for blokorienteret processering.

Umiddelbart ser det lovende ud at anvende Rambus da den højeste frekvens
(800 MHz), MEN: databredden er kun på 2 bytes pr. modul, dvs. 4 bytes (4x8 =
32 bit). "Kingston" (RAM fabrikant) skriver at man kan forvente en peek
performance på 3,2GB/sec ved anvendelse af Dual channel PC800 RIMM

DDR ram derimod har en databredde på 8 bytes pr. modul (8x8 = 64bit).
Tilsyneladende kan man "kun" få DDR ram i 333MHz datarate, det svarer til et
peak på 2,7GB/sec ved anvendelse af PC2700 DDR.

Hvad skal man dog satse på performer bedst? Og hvilket bundkort skal man
anvende (normalt sværger jeg til ASUS - men andre STABILE kort er også OK) ?

Det gør heller ikke noget at det samme bundkort kan købes om x måneder fra
nu da der helt sikkert bliver tale om en hel serie ens maskiner.

Gode dyr er rådne, men skindet skal sælge 10 fugle på taget!

/Niels Chr. Sørensen
ncs@SPAM.pc.dk



 
 
[9000] Søren (03-05-2002)
Kommentar
Fra : [9000] Søren


Dato : 03-05-02 13:36

> DDR ram derimod har en databredde på 8 bytes pr. modul (8x8 = 64bit).
> Tilsyneladende kan man "kun" få DDR ram i 333MHz datarate, det svarer til
et
> peak på 2,7GB/sec ved anvendelse af PC2700 DDR.

Der er da kommet pc3000 ddr ram så vidt jeg ved. Mener at i hvet fald
crucial har lavet noget, så mon ikke der snart dukker et board op der kan
udnytte dem fuldt ud. Ellers kan du i hvet fald trække meget ud af dem på et
asus p4s333 el. p4s533 hvis du oc'er en northwood cpu derpå



CC (03-05-2002)
Kommentar
Fra : CC


Dato : 03-05-02 18:15

Det hurtigste DDR RAM jeg kender til er 400MHz, PC3200 DDR RAM. Har dog ikke
set dem i DK, men min kammerat i USA bruger dem til sit super overclockede
system.


> > Tilsyneladende kan man "kun" få DDR ram i 333MHz datarate, det svarer
til
> et
> > peak på 2,7GB/sec ved anvendelse af PC2700 DDR.
> >




Peter Pan (04-05-2002)
Kommentar
Fra : Peter Pan


Dato : 04-05-02 14:30

<H_S_123@news teledk> skrev i en meddelelse
news:3cd27dc4$0$10680$4d4eb98e@news.dk.uu.net...
> Jeg skal lave en PC der er hyper optimeret for blokorienteret
processering.

Hvad er blokorienteret processering mere præcist?

Forskellen på DDR ram og RD ram ligger 2 steder, nemlig latency og
båndbredde.
RD-Ram:
400 MHz, 16 bits double pumpet=1600 MB/s båndbredde for PC800 ram som er det
hurtigste pt.
Det kører normalt med 2 kanaler, så man får 3200 MB/s båndbredde til rammen.
Latency på RD-Ram ligger i omejenen af 30-35 ns.

DDR-Ram
fåes i 100, 133 eller 166 MHz double pumpet og er 64 bits bredde. Det giver
1600, 2100 og 2700 MB/s respektivt.
DDR ram kører normalt kun med 1 kanal. (Nvidia har dog lavet et chipsæt der
kører DDR ram med 2 kanaler)
Latency på DDR ram ligger i omejenen af 5-10 ns.

Latencien på rammen betyder noget i nogle ting, intet i andre ting. Det
samme kan siges om båndbredden. Derfor er det meget svært at sige hvad der
er bedst til lige netop blokorienteret processering uden man ved præcist
hvad det kan lide.

> anvende (normalt sværger jeg til ASUS - men andre STABILE kort er også OK)
?

Tjae, jeg sværger også til Asus (og har gjort det meget længe!)

> Det gør heller ikke noget at det samme bundkort kan købes om x måneder fra
> nu da der helt sikkert bliver tale om en hel serie ens maskiner.

Hvis det er rigtig mange maskiner du skal lave, så bør du nok få testet
hvad der kører bedst, samt om det skal være en Intel eller AMD cpu, og om
det kan betale sig med 2 processorer i maskinerne. Kort sagt find ud af mere
præcist hvor flaskehalsen ligger i det software der skal køres.

Mvh
Anders



teledk (06-05-2002)
Kommentar
Fra : teledk


Dato : 06-05-02 08:56

> Hvad er blokorienteret processering mere præcist?

I vores tilfælde drejer det sig om lydbehandling. "Lyden" læses fra RAM i
relativt store blokke á (typisk) 256kB og behandles heftigt for derefter at
lagres i RAM igen.

> DDR ram kører normalt kun med 1 kanal. (Nvidia har dog lavet et chipsæt
der
> kører DDR ram med 2 kanaler)

Har Nvidia lavet et chipset til motherboards?

> Hvis det er rigtig mange maskiner du skal lave, så bør du nok få testet
> hvad der kører bedst, samt om det skal være en Intel eller AMD cpu, og om
> det kan betale sig med 2 processorer i maskinerne. Kort sagt find ud af
mere
> præcist hvor flaskehalsen ligger i det software der skal køres.

Nemlig! Og det er den aftestningsprocess jeg står foran. "Mange" maskiner
dækker over at jeg nok ender med at skulle lave en god håndfuld der skal
distribueres omkring i hele verden, derfor er nemmest at kunne "ghoste"
maskinerne helt ens - af support hensyn.

Dual processering lyder tillokkende, men da det ikke er min erfaring at M$
Winnows er ret god til "virkeligt" at få noget ud af mere end én processor -
og da det der skal køres SKAL eksekveres under Win-et-eller-andet tror jeg
nu ikke jeg vinder ret meget her - men det kan da prøves. Endelig skal det
siges at jeg ikke har den HELT store erfaring med SMP under M$ - til det,
anvender jeg typisk en "rigtig" maskine (SGI eller SUN).

AMD har jeg (personligt) aldrig haft fidus til - andet end til gamers. Mine
erfaringer med AMD er - at når der VIRKELIG skal knuses tal - så står de
stille i forhold til Intel. Men selvfølgelig kan de jo være kommet efter
det. Husk, grafik er jeg 100% fløjtende ligeglad med, jeg skal bare crunche
integers og floats.

Måske skulle jeg lave en executable med et time result output efter en
typisk kørsel og spørge lidt rundt om der er nogen der vil være
"forsøgskaniner". Det ville være en stor hjælp at få belyst dette en smule!





Søren 'Mufoxe' Lund ~ (06-05-2002)
Kommentar
Fra : Søren 'Mufoxe' Lund ~


Dato : 06-05-02 11:00

<H_S_123@news teledk> wrote in message
news:3cd6372c$0$10684$4d4eb98e@news.dk.uu.net...
> Har Nvidia lavet et chipset til motherboards?

Ja, det hedder nForce, men findes kun som AMD platform. nForce chipsættet er
ikke hurtigere end VIAs KT266a og KT333 - begge chipsæt yder marginalt bedre
end nForce og så har de færre problemer.

> Dual processering lyder tillokkende, men da det ikke er min erfaring at M$
> Winnows er ret god til "virkeligt" at få noget ud af mere end én
processor -
> og da det der skal køres SKAL eksekveres under Win-et-eller-andet tror jeg
> nu ikke jeg vinder ret meget her - men det kan da prøves. Endelig skal det
> siges at jeg ikke har den HELT store erfaring med SMP under M$ - til det,
> anvender jeg typisk en "rigtig" maskine (SGI eller SUN).

Problemet er sikkert, at ikke mange Windows programmer er skrevet til at
anvende den ekstra kraft. Hvis du selv står for at skrive softwaren, er det
jo "bare" at få kodet nogle tråde ind i dyret, så du kan afvikle på flere
CPU'er.

> AMD har jeg (personligt) aldrig haft fidus til - andet end til gamers.
Mine
> erfaringer med AMD er - at når der VIRKELIG skal knuses tal - så står de
> stille i forhold til Intel. Men selvfølgelig kan de jo være kommet efter
> det. Husk, grafik er jeg 100% fløjtende ligeglad med, jeg skal bare
crunche
> integers og floats.

AMD laver lige nu den hurtigste FPU, dog skal det nævnes at Intels nye
Northwood kerner har et rigtigt godt OC potentiale, hvilket dog ikke spiller
den store rolle, hvis du skal bruge maskinerne i en "skarp" situation. Clock
by Clock er AMD hurtigst.



HM (06-05-2002)
Kommentar
Fra : HM


Dato : 06-05-02 17:56

P4S533 plus Northwood 1.6@2.1-2.4 på retail-coller (FSB 133)
ram stænger fra samsung (PC2700 var det vist) de yder bedre end
de er specificeret til, denne kombination bliver svær at overgå, giv
10 gange mere og få en ydelse der end ikke er dobbelt, northwood
har en stor cashe sikkert også en fordel i dit tilfælde, P4S533 udnytter
ram "i den bedre ende" mere fordelagtigt end forgængeren P4S333

HM



Søren 'Mufoxe' Lund Jensen <mufoxe@hotmail.com> skrev i en
nyhedsmeddelelse:3cd65420$0$18626$edfadb0f@dspool01.news.tele.dk...
> <H_S_123@news teledk> wrote in message
> news:3cd6372c$0$10684$4d4eb98e@news.dk.uu.net...
> > Har Nvidia lavet et chipset til motherboards?
>
> Ja, det hedder nForce, men findes kun som AMD platform. nForce chipsættet
er
> ikke hurtigere end VIAs KT266a og KT333 - begge chipsæt yder marginalt
bedre
> end nForce og så har de færre problemer.
>
> > Dual processering lyder tillokkende, men da det ikke er min erfaring at
M$
> > Winnows er ret god til "virkeligt" at få noget ud af mere end én
> processor -
> > og da det der skal køres SKAL eksekveres under Win-et-eller-andet tror
jeg
> > nu ikke jeg vinder ret meget her - men det kan da prøves. Endelig skal
det
> > siges at jeg ikke har den HELT store erfaring med SMP under M$ - til
det,
> > anvender jeg typisk en "rigtig" maskine (SGI eller SUN).
>
> Problemet er sikkert, at ikke mange Windows programmer er skrevet til at
> anvende den ekstra kraft. Hvis du selv står for at skrive softwaren, er
det
> jo "bare" at få kodet nogle tråde ind i dyret, så du kan afvikle på flere
> CPU'er.
>
> > AMD har jeg (personligt) aldrig haft fidus til - andet end til gamers.
> Mine
> > erfaringer med AMD er - at når der VIRKELIG skal knuses tal - så står de
> > stille i forhold til Intel. Men selvfølgelig kan de jo være kommet efter
> > det. Husk, grafik er jeg 100% fløjtende ligeglad med, jeg skal bare
> crunche
> > integers og floats.
>
> AMD laver lige nu den hurtigste FPU, dog skal det nævnes at Intels nye
> Northwood kerner har et rigtigt godt OC potentiale, hvilket dog ikke
spiller
> den store rolle, hvis du skal bruge maskinerne i en "skarp" situation.
Clock
> by Clock er AMD hurtigst.
>
>



Søren 'Mufoxe' Lund ~ (06-05-2002)
Kommentar
Fra : Søren 'Mufoxe' Lund ~


Dato : 06-05-02 19:38

"HM" <henrik-mahler@mail.dk> wrote in message
news:3cd6b6bb$0$18621$edfadb0f@dspool01.news.tele.dk...
> P4S533 plus Northwood 1.6@2.1-2.4 på retail-coller (FSB 133)
> ram stænger fra samsung (PC2700 var det vist) de yder bedre end
> de er specificeret til, denne kombination bliver svær at overgå, giv
> 10 gange mere og få en ydelse der end ikke er dobbelt, northwood
> har en stor cashe sikkert også en fordel i dit tilfælde, P4S533 udnytter
> ram "i den bedre ende" mere fordelagtigt end forgængeren P4S333

Hvor har du lige 10 gange mere ydelse fra? Hvor kommer alle de tal i grunden
fra? Du slynger tal til højre og venstre, men ikke materiale til at
underbygge dem.



Peter Pan (06-05-2002)
Kommentar
Fra : Peter Pan


Dato : 06-05-02 22:16

<H_S_123@news teledk> skrev i en meddelelse
news:3cd6372c$0$10684$4d4eb98e@news.dk.uu.net...
> > Hvad er blokorienteret processering mere præcist?
>
> I vores tilfælde drejer det sig om lydbehandling. "Lyden" læses fra RAM i
> relativt store blokke á (typisk) 256kB og behandles heftigt for derefter
at
> lagres i RAM igen.

Det lyder som at en AMD platform vil være at foretrække. AMD har en meget
overlegen FPU enhed sammenlignet med Pentium3 og 4.
Intels cache kan dog også give Intel en fordel i dette tilfælde, da
datamængden er så lille. Intels cache er teoretisk 4x så hurtig og på
Pentium4 northwood er den også størrer. AMD har "kun" 256 KB cache i alle
deres Athlon'er. Pentium4 northwood har 512 KB, og den er sammentidig 4x så
hurtig. (AMD's cache læser 64 bits ad gangen, Intel's 256 bits)

> > DDR ram kører normalt kun med 1 kanal. (Nvidia har dog lavet et chipsæt
> der
> > kører DDR ram med 2 kanaler)
>
> Har Nvidia lavet et chipset til motherboards?

Jeps. Problemet med deres Dual channel DDR chipsæt er implementeringen. Den
ene kanal bruges nemlig til det interne grafikkort i chippen. Så programmer
for ikke mere båndbredde. Så det har kun betydning i spil som bruger
grafikkortet intensivt.

> Dual processering lyder tillokkende, men da det ikke er min erfaring at M$
> Winnows er ret god til "virkeligt" at få noget ud af mere end én
processor -
> og da det der skal køres SKAL eksekveres under Win-et-eller-andet tror jeg
> nu ikke jeg vinder ret meget her - men det kan da prøves. Endelig skal det
> siges at jeg ikke har den HELT store erfaring med SMP under M$ - til det,
> anvender jeg typisk en "rigtig" maskine (SGI eller SUN).

Windows 2000 / XP er udemærkedet til at køre SMP. Skal du køre noget
Win98/ME skal du ikke gå efter SMP, da de ikke kan bruge det. Men da det
lyder som om det er FPU'en der sætter begrænsningerne i program udførselen,
vil det sikkert give et boost i nærheden af 75-90% af have 2 processorer.

Det største problem er om det er muligt med det programel der skal bruges.
For enten skal programmet køre multi-threaded, eller også skal man f.eks
starte programmet op 2 gange, og det kræver lige at der er "2 data sæt" at
arbejde med.

> AMD har jeg (personligt) aldrig haft fidus til - andet end til gamers.
Mine
> erfaringer med AMD er - at når der VIRKELIG skal knuses tal - så står de
> stille i forhold til Intel. Men selvfølgelig kan de jo være kommet efter
> det. Husk, grafik er jeg 100% fløjtende ligeglad med, jeg skal bare
crunche
> integers og floats.

AMD var engang (dengang det hed K6 serien) aldeles uduelig hvad angår
regnekraft i deres FPU. Intel var over 100% hurtigere ved samme MHz. Idag er
de ca. 25-50% hurtigere end Intel ved samme MHz. Verdenen ændre sig!

> Måske skulle jeg lave en executable med et time result output efter en
> typisk kørsel og spørge lidt rundt om der er nogen der vil være
> "forsøgskaniner". Det ville være en stor hjælp at få belyst dette en
smule!

Jeg skal gerne melde mig frivilligt.....
Min nye maskine er lige kommet ind af døren idag, en Dual AMD Athlon 1.533
GHz (1800+ modellen) med 512 MB DDR ram PC2100. Den kan være meget
interessant at køre det på.
Og min nuværende Dual Pentium 3 500 MHz kan også være interessant at se lidt
tal fra.

Mvh
Anders



teledk (08-05-2002)
Kommentar
Fra : teledk


Dato : 08-05-02 11:40

Jeg fik lige en mulighed for at investere i en anden performance box der
skal anvendes som CAD arbejdsstation.

Ikke for at være på tværs, men mere for at finde den bedste løsning, har vi
besluttet at give P4 Northwood's cache en chance sammen med Rambus. Dvs, det
er det vi vil prøve her i huset.

Vi har lavet en lille testapplikation baseret på GNU kode der simulerer den
endelige applikations belastning af systemet. Der er tale om en applikation
der anvender FFT (Fast Fourier Transforms) der gør følgende:

"Programmet starter med at teste hardwaren igennem for at kunne planlægge
den hurtigste implementationsstruktur for FFT'en. Planerne for hhv. forward
og reverse FFT skrives ned i to '.wsd' filer efter første kørsel. Herefter
køres selve FFT'erne frem og tilbage 256 gange, og den forløbne tid måles.
På min 1.6 GHz P4 med P133 bus tager det 65 sekunder. Vi håber at kunne
reducere den tid med mindst en faktor 3 ved en mere tidssvarende RAM
struktur."
Hvis der er nogen der vil være med til at hjælpe med at finde "den bedste"
løsning - RAM og processormæssigt (incl. evt. SMP) ville det da være fedt!
Eneste "begrænsning" mht. optimal udnyttelse af flere processore er at vi
skal have kompileret programmet med et andet GNU bibliotek for at udnytte
dette.

Mit "ultrahemmelige" emailadresse (spam samler) der ender i Oblivion (NULL)
kan med fordel erstattes af: ncs@tcelectronic.SPAM.dk - fjern selv det
uønskede ord for dem der er interesserede. Og lad os så samle erfaringerne
her i en tråd, det gør os jo alle lidt klogere på hvad den bedst performende
PC til denne type talknuseri virkelig er.

> > Måske skulle jeg lave en executable med et time result output efter en
> > typisk kørsel og spørge lidt rundt om der er nogen der vil være
> > "forsøgskaniner". Det ville være en stor hjælp at få belyst dette en
> smule!
>
> Jeg skal gerne melde mig frivilligt.....

Anders - du er velkommen. Kan du ikke lige sende mig en mail på ovenstående
adresse, så sender jeg det nødvendige (incl. - naturligvis - links til
behørige GNU sources).

> Min nye maskine er lige kommet ind af døren idag, en Dual AMD Athlon 1.533
> GHz (1800+ modellen) med 512 MB DDR ram PC2100. Den kan være meget
> interessant at køre det på.
> Og min nuværende Dual Pentium 3 500 MHz kan også være interessant at se
lidt
> tal fra.

Lige nu kan vi kun få en single processor måling., men efter Kr. Flyvfart's
ferien kommer der en multitråds udgave.

Ved venlig hilsen - og håb om at der er nogen der vil hjælpe med målinger:

Niels Chr. Sørensen
R&D TechWiz
TC Electronic A/S



Søg
Reklame
Statistik
Spørgsmål : 177559
Tips : 31968
Nyheder : 719565
Indlæg : 6408938
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste