In questi giorni ho avuto il piacere di iniziare a leggere il libro “The Fourth Paradigm: Data-Intensive Scientific Discovery” dove si parla di come la grandissima mole di dati (tera- o peta-byte) prodotte dalla scienza (genetica, astronomia, ecc. ecc.) debba essere tratta e possa essa stessa essere fonte di scoperte scientifiche.
Si stima, ad esempio, che l’LHC (Large Hadron Collider) una volta a regime produrra qualcosa come 50 – 100 PB (PetaByte!!!!) ogni anno! Impressionante, no? (Cosa devo fare per andare a lavorare con quei server!?!?!?!??! :) )
Tra le molte cose interessanti, nel paragrafo che sto leggendo, i ricercatori Alexander S. Szalay (The Johns Hopkins University) e José A. Blakeley (Microsoft) dicono a chiare lettere:
“Database features such as declarative, set-oriented languages and automatic parallelism, which have been successful in building large-scale scientific applications, are clearly needed. We believe that the current wave of databases can manage at least another order of magnitude in scale.”
A parte queste “chicche” :-), il libro è veramente uno sguardo tecnologico e scientifico sul futuro prossimo.
il libro è disponibile free in PDF qui:
The Fourth Paradigm Data-Intensive Scientific Discovery - Microsoft Research