On 21 Apr 2006 16:15:03 +0200, nospam0000@gmail.com (Thorbjørn Ravn
Andersen) wrote:
>> På DTU bruger de en mysql-database til et projekt med nogle
>> DNA-sekvenser. Det er vist noget med at databasen fylder nogle
>> hundrede gigabytes.
>Det er faktisk ret interessant, for det er det første mysql projekt
>jeg hører om der har seriøst ikke-trivielle datamængder i sig (så
>længe det varer).
For what it's worth har jeg rodet lidt med mysql-databaser, hvor
datafilen var omkring 30GB og indexfilen 20GB for en enkelt tabel
(endda MyISAM). Det fungerede i og for sig fint. Der var vist nogle
hundrede millioner rækker.
En helt basal nødvendighed er at bulk-insert'e, når man skal smide et
par tusinde eller et par hundredetusinde rækker ind ad gangen. Nåja,
og at overveje om alle ens indexes overhovedet er nødvendige, eller om
man kan klare sig med blot få, og så leve med lidt større tablescans.
I forhold til events kan det fx også være fint her at aggregere logs
og deslige om natten. Evt. fyre en OPTIMIZE af på diverse tabeller
hver nat.
Jeg har en del forventninger til events. I dag klarer jeg mig med
cronjobs langt hen ad vejen, men nogle gange ønsker jeg at finmaske
jobs yderligere end blot på minuttet (uden at behøve at lave
sleep-hacks eller daemons eller på anden måde genopfinde cron).
I forhold til webhotel-branchen, hvor mysql jo er temmeligt udbredt,
tror jeg, der er mange kunder, der vil glæde sig over at kunne slippe
for "fattigmands-cron" (fx "hvis denne side ikke har været besøgt før
i dag, så lav lige følgende maintenance"). Dog, jeg tror at brugere i
den branche havde været endnu mere interesseret, hvis fx Apache tilbød
Events. Det er stadigvæk begrænset, hvad man kan lave fra MySQL, mens
man med php, perl eller lignende sprog kunne lave mere avancerede
operationer som at flytte filer, sende e-mails, kaste en backup ud i
verden, m.m.
Til gengæld tror jeg også, der er en god indkørselsperiode med events,
hvor vi kan forvente en del pudsigheder, rod i rettighedssystemet,
m.m.
Man kan bekymre sig om at mysql begynder at introducere et element,
der ikke er direkte database-orienteret, men jeg tror igen klart, at
hostingfirmaer er mere interesserede i at give brugere adgang til
dette end at give adgang til cron.
--
- Peter Brodersen
Find dig selv:
http://map.ter.dk/