Perspektiv – för bättre vetande

Han ser världen genom big data-linsen

2017-10-03

Raazesh Sainudiin, forskare vid matematiska institutionen

När folk missförstod hans dikter ville han ägna sig åt något där han kunde kommunicera på ett sätt som inte går att feltolka. Det var då han bestämde sig för att bli matematiker.

Raazesh Sainudiin drivs av en stark vilja att förstå omvärlden och har i sin forskning lyckats förena sitt samhällsintresse med sin matematiska kunskap. Med matematikens hjälp har han studerat allt från biologisk mångfald till spridning av ideologier. Sättet som han gör det på är nytt inom akademin och heter data science.

Förra året besökte Raazesh Sainudiin logikgruppen vid Stockholms universitet. Där fick han höra att matematiska institutionen i Uppsala sökte en forskare som skulle arbeta i industrin en del av tiden. Han tyckte att jobbet lät som gjort för honom och bestämde sig för att söka.

Vid den tiden bodde Raazesh Sainudiin i Nya Zeeland och hade precis gått tillbaka till akademin efter att ha varit ute i industrin ett tag. Han hade tagit tjänstledigt från sitt jobb på universitetet för att under en period arbeta på ett företag som låg i startgroparna och behövde personer kunniga inom data science. Där ledde han ett team bestående av ingenjörer och forskare som utvecklade en produkt för säkerhetsorganisationer som Interpol och australiska federalpolisen.

- Jag kan inte berätta så mycket om det eftersom det är hemlighetsstämplat, men det var ett problem som handlade om sammanslagning av data. Det var väldigt roligt, säger Raazesh Sainudiin.

När det var dags att återgå till jobbet på universitetet befarade Raazesh Sainudiin att han skulle sakna kontakten med industrin. Han ville fortsätta inom akademin eftersom han uppskattar friheten att tänka på problem på djupet, men samtidigt var har rädd för att tappa greppet om den senaste utvecklingen inom data science.

Vad är data science?

- Oavsett om du befinner dig i ett labb och gör experiment eller om du är på ett företag och samlar information om kundernas beteende behöver du hitta sätt att analysera informationen. Traditionellt skulle du lägga in all data i din PC och låta den göra beräkningarna. Problemet är att den information som du vill analysera inte kan få plats i en enda dator. Därför måste du fördela informationen över många datorer och sedan låta dem på något sätt göra analyser samtidigt. Inom datavetenskapen kallas det distribuerade beräkningar.

Men data science omfattar inte bara beräkningar och programmering utan också insamling och analys av data. Därför behöver en data scientist ha kunskaper inom matematik, statistik och datavetenskap.

- Det intressanta med data science, eller big data som det också kallas, är att det kommer från industrin. En stor del av teknologin har utvecklats av nödvändighet, av företag som Google och Yahoo. De har skapat distribuerade filsystem som de använder för att hantera big data. Vad som har gjort utvecklingen möjlig är att de här teknologierna är tillgängliga för hela världen. Det gör att alla kan hjälpa till med att utveckla koderna och teknologin öppet. På det sättet kan alla dra nytta av det och tjäna pengar på det.

Hur kan man tjäna pengar på det om det är öppet?

- Allt är inte öppet, men själva kärnan är det. Det är industrisidan av det. Inom stora delar av akademin är begreppet data science helt nytt. Själva begreppet myntades faktiskt för bara några år sedan av ingenjörerna på företag som Netflix. De sa: Vi vill inte riktigt ha en matematiker, vi vill inte riktigt ha en statistiker, vi vill inte riktigt ha en datavetare. De ville någon som kan tillräckligt inom matematik, statistik och datavetenskap, men som dessutom är intresserad av affärsprocessen. Så man kan säga att de definierade fältet.

Raazesh Sainudiin började intressera sig för vad som senare skulle kallas data science efter sin forskarutbildning på Cornell. Han forskade i Oxford ett tag och sedan arbetade han som lektor i Nya Zeeland i nio år. När han var tjänstledig från sitt lektorat åkte han tillbaka till Cornell där han gick på seminarier i maskininlärning och sannolikhetsteori. Det var då han började se kopplingar mellan matematik, statistik och datavetenskap – det som utgör grunden till data science.

Raazesh Sainudiins förmåga att med hjälp av det matematiska språket förstå hur olika områden är kopplade har gjort hans forskning mycket mångsidig. I ett av sina forskningsprojekt har han analyserat miljontals inlägg på twitter och tittat på hur ideologier sprider sig. Inom ett annat projekt har han tillbringat en månad på en avlägsen ö i Stilla havet där han tillsammans med beteendeekologer studerat fåglars beteende. I ett tredje utvecklar han dataprogram i statistik och simulering tillsammans med Stockholms universitets forskargrupp i matematisk logik. Hans forskningsintressen involverar många områden, men en sak som förenar dem alla är data science.

Enligt Raazesh Sainudiin kan data science ge oss nycklar till förståelse av världen. Men utmaningen är att hålla jämna steg med utvecklingen eftersom den går i ett rasande tempo. Om man vill hänga med måste man befinna sig i den miljö där utvecklingen sker. Det är därför Raazesh Sainudiin vill hålla kontakten med industrin.

- Jag kan inte längre läsa tidsskrifter för att ta reda på vad som händer. Om jag vill hålla mig uppdaterad måste jag titta på livesändningar från olika projekt på webben. Det är helt annorlunda jämfört med när jag var student, säger Raazesh Sainudiin och fortsätter:

- Jag försökte hitta en kombinerad tjänst i Nya Zeeland men det var svårt. Så jag blev väldigt glad förra året när Warwick Tucker berättade att matematiska institutionen i Uppsala sökte någon som mig.

Han fick jobbet på Uppsala universitet och det har visat sig motsvara hans förväntningar. Han arbetar på teknologiföretaget Combient en gång i veckan och på universitetet resten av tiden. Tanken är att samarbetet med Combient ska ge effekter åt båda hållen.

- En del av mitt uppdrag på Combient är att se till att det sker ett idéutbyte. På de doktorandkurser inom data science som jag ger i höst kommer studenterna att lära sig en enklare version av de verktyg som vi använder på Combient. Om jag fortsätter att ge kurserna kommer jag att förändra dem utifrån hur teknologin i industrin utvecklas.

Vilka studenter tror du kan ha nytta av kurserna?

- Doktorander inom olika ingenjörsgrenar, fysik, life science, samhällsvetenskap och IT till exempel. I mina kurser kommer jag att fokusera på data science-processen, som är en intressant mix av matematik, statistik och datavetenskap. Den kommer även att innehålla inslag av affärsinsikter och etiska aspekter, säger Raazesh Sainudiin och fortsätter:

- Utbytet sker mest på undervisningssidan. Visserligen forskar jag just nu mer inom big data-miljön, som twitterproblemet som jag jobbar med, så det är klart, den teknologin kommer att komma till nytta i min forskning.

Även om Raazesh Sainudiin uppskattar att vara ute i industrin tycker han också om den rent akademiska miljön. Han berättar att en av de största anledningarna till att han ville komma till Uppsala universitet var möjligheten att samarbeta med forskare i matematik och statistik.

- Eftersom jag jobbar inom så många olika områden är det perfekt att vara här. Ingemar Kaj jobbar till exempel med modeller som ligger nära dem som jag gjort inom populationsgenetik. När jag arbetar med twittergrejerna umgås jag mycket med Cecilia Holmgrens grupp. Cecilia är väldigt bra på slumpgrafer. Hon är en stjärna på uppgång, definitivt. Även om hennes grupp inte jobbar med big data har de en hel del insikter som användbara när vi bollar idéer under lunchrasterna. Och när jag arbetar med dataaritmetik umgås jag mycket med Warwick Tuckers grupp. Just nu försöker jag att titta på matematiska problem genom big data-filtret. Även om det sättet att se på saker inte bidrar till forskningen inom big data-fältet kommer det definitivt att vara av intresse för matematiken och statistiken.     

Utbyte är av idéer och samverkan verkar löpa som en röd tråd i det mesta Raazesh Sainudiin gör. Utöver sina många forskningssamarbeten har han också konstruerat en granitskulptur som numera står på Chennais matematiska institut i Indien.

- Skulpturen har vatten som rinner ner i kanaler som delas i två och går ihop, om och om. Det var efter den gamla indiska matematikern Pingala som för över 2200 år sedan kom på en version av det vi idag kallar Pascals triangel och Fibonaccital.

Att statyn står just i Chennai är inte en tillfällighet. Raazesh Sainudiin föddes i staden och bodde där tills han var sjutton år. Sedan flyttade han till Minnesota och redan då, långt innan han anade att han i framtiden skulle bosätta sig i Uppsala, fick han en relation till Sverige.

- I Minnesota gick jag på Gustavus Adolphus College som grundades av svenska immigranter. De hade ett stipendium, till Folke Bernadottes minne, som gick till en student från Asien varje år och jag var faktiskt Folke Bernadotte-stipendiat. Där har jag en rolig koppling till Sverige. 
 

FAKTA: RAAZESH SAINUDIIN

Vad tycker du om att göra på fritiden?

Jag gillar att göra experiment i köket som utmanar kulinariska konventioner tillsammans med min fru och mina döttrar. Sedan är jag intresserad av fältväxttaxonomi, poesi, pluralistisk historia, komparativ filosofi och tungvrickare på engelska, sanskrit och tamil.

Vem är din favoritpoet?

Dogen Kigen. Han är grundare till den japanska soto zen-skolan. Folk kallar inte honom poet men jag gillar hans ord. 

Vad tycker du om Uppsala?

Det är en mycket trevlig och familjevänlig stad att bo i.

Du har bott på många olika ställen. Var känner du dig mest hemma?

Jag känner mig mest hemma när jag är hemma med min kära familjNär det gäller vilken nation jag känner mig mest bekväm i är det mer komplicerat. Du förstår, jag föddes i Indien, växte upp i Amerika och bodde länge i Nya Zeeland. Jag är medborgare i Nya Zeeland och gillar verkligen landet. Jag känner att jag är indisk-amerikansk-kiwi.  

Alma Kirlic