Sökning bland stora flöden av mätdata - möjligt med ny metod
Pressmeddelande
I sin avhandling har Milena Ivanova tagit fram en ny metod för automatisk nedbrytning av stora dataströmmar för effektiva sökningar direkt i dataströmmarna. Hon försvarar sin avhandling vid Uppsala universitet den 7 november. Milena Ivanova Scalable Scientific Stream Query Processing ISBN: 91-554-6351-7 Abstract Databasforskningen har givit oss många användbara verktyg för att söka och hantera stora mängder data. Till exempel är Google och andra sökverktyg ett resultat av forskning och utveckling inom databasområdet. Då handlar det om att hitta information i en databas som finns lagrad på hårddisk. Många nya tillämpningar kräver dock sökning och analys av data som inte finns lagrad någonstans utan avges hela tiden av sensorer och instrument. Moderna vetenskapliga instrument som satelliter, digitala antenner och radioteleskop avger hela tiden mätvärden. Sådana kontinuerliga sekvenser av värden kallas dataströmmar. Fysiker vill göra sökningar och analyser i dessa dataströmmar för att upptäcka intressant information och lära sig mer om hur fysikens lagar fungerar. Många instrument avger mätvärden med enorm hastighet, vilket leder till väldiga dataströmmar. Det gör det omöjligt att spara dem på hårddisk för senare analys. Istället måste informationen behandlas genast. Hur ska då denna behandling göras? Ett vanligt sätt att få dataströmmarna hanterbara är att bryta ner dem i små delar som kallas fönster. Det är mycket lättare att göra sökningar på fönster av data än på oändliga dataströmmar. Men trots att dataströmmarna delas in i små delar så kan beräkningarna som utförs under sökningar och analyser vara så komplicerade att en enstaka dator är för långsam för att klara av dem. Därför använder forskare många samverkande datorer för att lösa stora beräkningsuppgifter. Milenas Ivanovas avhandling undersöker olika metoder för att bryta ner dataströmmarna till flera fönster och sprida ut dem mellan de samverkande datorerna för att utföra sökningar och analyser mer effektivt. Milena Ivanovas forskning har drivits av frågeställningar inom rymdfysiken där man snabbt måste analysera mycket stora mängder mätvärden från digitala radioteleskop. Resultaten från hennes forskning är också relevanta för andra mer jordnära områden som styrning och övervakning av trafik, nätverk och industriella processer, som också avger stora mängder mätvärden. Till exempel kan det vara viktigt att kunna handla snabbt när strömmen av mätvärden indikerar att något slutat fungera. Då vill alla få information om vad som händer nu, inte en sammanställning av data som är en timme, en vecka eller en månad gammal. Kontaktperson: Milena Ivanova, institutionen för informationsteknologi, Uppsala universitet, tel 018-471 28 46, e-post milena.ivanova@it.uu.se Linda Nohrstedt