Skip to main content

Spor influensa med Google Flu Trends

What we learned from 5 million books (Juni 2026)

What we learned from 5 million books (Juni 2026)
Anonim

Google Flu Trends publiserer ikke lenger gjeldende statistikk, men historiske data er fortsatt tilgjengelige på nettstedet.

Det er ikke overraskende at folk søker etter informasjon om influensa når de er syke. Google fant en måte å trykke på denne trenden og bruke den til å estimere influensaaktivitet etter region. De oppdaget at søketreningsdataene faktisk var omtrent to uker raskere enn tradisjonelle CDC-metoder (Centers for Disease Control) for sporing av influensautbrudd.

Google Flu Trends vil gi deg et estimat av det nåværende utbruddsnivået i USA eller bryte det ned staten etter stat. Du kan også se trender fra tidligere år og søke etter et sted for å finne influensasko nær deg.

Stor Data

Google Flu Trends er et eksempel på funnene som kan gjøres med store data, et begrep som brukes til å beskrive enorme strukturerte eller ustrukturerte datasett som ville være for store og komplekse å bli undersøkt ved hjelp av tradisjonelle metoder.

Tradisjonell analyse av data involverer vanligvis å holde det du samler inn i en håndterlig størrelse. Forskere brukte mindre statistiske prøver av svært store grupper for å gjøre informerte gjetninger om den større gruppen. For eksempel blir politisk avstemning gjort ved å ringe et relativt lite antall mennesker og stille spørsmål til dem. Hvis samplingen ligner den større gruppen (si alle velgere i Massachusetts), kan undersøkelsesresultatene fra den lille gruppen brukes til å gjette gjetninger om den større gruppen. Du må ha et veldig rent datasett og vite hva du søker etter.

Store data, derimot, bruker datasett så store som mulig - si alle søkene i Google. Når du bruker et datasett som er stort, får du også rotete data: ufullstendige oppføringer, søkeoppføringer av katter som går over tastaturer og så videre. Det går bra. Stor dataanalyse kan ta dette i betraktning og slutte med å trekke konklusjoner som ellers kanskje ikke har blitt funnet.

En av disse funnene var Google Flu Trends, som ser på pigger i søk etter influensa symptomer. Du er ikke alltid Google, "Hei, jeg har influensa. OK Google, hvor er en lege nær meg?" Du pleier å søke etter ting som "hodepine og feber." Den svake oppadgående trenden i et ellers veldig rotete og stort sett med søk er det som driver Google Flu Trends.

Dette er mer enn bare en nyhet siden den viser influensa-spikes raskere enn CDC. CDC er avhengig av positive influensatester fra leger og sykehus. Det betyr at folk må bli syke nok til å besøke en lege i antall som er tilstrekkelig til å forårsake en spike i influensetesting, og så må laboratoriene rapportere trenden. Folk vil allerede være syk når du er i stand til å mobilisere behandling.