David Rossell

Professor del departament d’Estadística. Universitat de Warwick (Regne Unit).

52-83

Les dades massives (big data) representen un recurs sense precedents per a afrontar reptes científics, econòmics i socials, però també incrementen la possibilitat de traure conclusions enganyoses. Per exemple, l'ús d'enfocaments basats exclusivament en dades i que es despreocupen de comprendre el fenomen en estudi, que s'orienten a un objectiu esmunyedís i canviant, que no tenen en compte problemes determinants en la recopilació de dades, que resumeixen o «cuinen» inadequadament les dades i que confonen el soroll amb el senyal. Repassarem alguns casos reeixits i il·lustrarem com poden ajudar els principis de l'estadística a obtenir una informació més fiable de les dades. També abordarem els reptes actuals que requereixen estudis metodològics dinàmics, com les estratègies d'eficiència computacional, la integració de dades heterogènies, estendre els fonaments teòrics a qüestions cada vegada més complexes i, potser el més important, formar una nova generació de científics capaços de desenvolupar i implantar aquestes estratègies.

0