Data mining er analysen av store mengder data for å oppdage mønstre og kunnskap. Faktisk er data mining også kjent som datafunn eller kunnskapsoppdagelse.
Data mining bruker statistikk, prinsipper for maskinlæring (ML), kunstig intelligens (AI) og enorme mengder data (ofte fra databaser eller datasett) for å identifisere mønstre på en måte som er så automatisert og nyttig som mulig.
Hva gjør Data Mining?
Data mining har to hovedmål: beskrivelse og prediksjon. For det første beskriver datautvinning innsikt og kunnskap fra analysemønstre i data. For det andre bruker data mining beskrivelsene av anerkjente datamønstre for å forutsi fremtidige mønstre.
Hvis du for eksempel har brukt tid på å surfe på et shoppingwebsted for bøker om hvordan du identifiserer forskjellige typer planter, logger datautvinningstjenestene bak scenene på nettsiden en beskrivelse av søkene dine i forbindelse med profilen din. Når du logger deg på igjen to uker senere, bruker nettstedets datautvinningstjenester beskrivelsene av de forrige søkene dine for å forutsi dine nåværende interesser og tilby tilpassede shoppingrekommendasjoner som inkluderer bøker om å identifisere planter.
Hvordan Data Mining fungerer
Data mining fungerer ved hjelp av algoritmer, sett med instruksjoner som forteller en datamaskin eller behandler hvordan du gjør en oppgave, for å oppdage forskjellige typer mønstre innenfor data. Noen av de forskjellige mønstergjenkjenningsmetodene som brukes i datautvinning, inkluderer klyngeanalyse, anomalitetsdeteksjon, foreningslæring, dataavhengighet, beslutningstrender, regresjonsmodeller, klassifiseringer, utleder deteksjon og nevrale nettverk.
Selv om datautvinning kan brukes til å beskrive og forutsi mønstre i alle forskjellige typer data, er det mange brukere som ofte møter, selv om de ikke skjønner det, å beskrive mønstre i dine innkjøpsvalg og atferd for å forutsi sannsynlig fremtidig innkjøp beslutninger.
Har du noen gang lurt på hvordan Facebook alltid synes å vite hva du har sett på nettet, og viser annonser i din nyhetsfeed relatert til andre nettsteder du har besøkt eller dine nettsøk? Facebook data mining bruker informasjon som er lagret i nettleseren din, som sporer aktivitetene dine, for eksempel informasjonskapsler, sammen med sin egen kunnskap om dine mønstre basert på din tidligere bruk av Facebooks tjeneste for å oppdage og forutsi produkter eller tilbud du måtte være interessert i.
Hva slags data kan utvinnes?
Avhengig av tjenesten eller butikken (fysiske butikker bruker data mining også), kan en overraskende mengde data om deg og dine mønstre bli utvannet. Data som er samlet inn om deg, kan inneholde hvilken type kjøretøy du kjører, hvor du bor, steder du har reist, magasiner og aviser du abonnerer på, og om du er gift eller ikke. Det kan også avgjøre hvorvidt du har barn, hva dine hobbyer er, hvilket band du liker, dine politiske leanings, hva du kjøper online, hva du kjøper i fysiske butikker (ofte gjennom kundeloyalitetsbelønningskort) og eventuelle detaljer du deler om livet ditt på sosiale medier.
For eksempel bruker forhandlere og mote-baserte publikasjoner rettet mot tenåringer innsikt fra data mining bilder på sosiale medier tjenester som Instagram og Facebook for å forutsi modetrender som vil lokke i tenåring kjøpere eller lesere. Innsiktene oppdaget gjennom data mining kan være så presise at enkelte forhandlere kan til og med forutsi om en kvinne kan være gravid, basert på svært spesifikke endringer i kjøpsvalgene. Forhandleren Target er rapportert å være så nøyaktig med å forutsi graviditet basert på mønstre i å kjøpe historie at det sendte kuponger til babyprodukter til en ung dame, og ga bort graviditeten hennes før hun fortalte familien sin.
Datautvinning er overalt, men mye av informasjonen oppdaget og analysert om våre kjøpevaner, personlige preferanser, valg, økonomi og online aktiviteter brukes av butikker og tjenester med det formål å øke kundeopplevelsen.