Naturlig språkbehandling eller NLP er en gren av kunstig intelligens som har mange viktige implikasjoner på måtene som datamaskiner og mennesker samhandler med. Menneskespråk, utviklet over tusen og tusen år, har blitt en nyansert form for kommunikasjon som bærer et vell av informasjon som ofte overskrider ordene alene. NLP vil bli en viktig teknologi for å bygge bro over gapet mellom menneskelig kommunikasjon og digitale data. Her er 5 måter som naturlig språkbehandling vil bli brukt i årene som kommer.
Maskinoversettelse
Som verdens informasjon er online, blir oppgaven med å lage dataene stadig viktigere. Utfordringen med å gjøre verdens informasjon tilgjengelig for alle, på tvers av språkbarrierer, har rett og slett vokst opp kapasiteten til menneskelig oversettelse. Innovative selskaper som Duolingo ønsker å rekruttere store mengder mennesker til å bidra, ved å sammenfalle oversettelsesarbeid med å lære et nytt språk. Men maskinoversettelse gir et enda mer skalerbart alternativ til å harmonisere verdens informasjon. Google er et selskap i forkant av maskinoversettelse, ved hjelp av en proprietær statistisk motor for sin oversettertjeneste fra Google. Utfordringen med maskinoversettelsesteknologi er ikke i å oversette ord, men i å bevare meningen med setninger, et komplekst teknologisk problem som ligger i NLPs hjerte.
Bekjempelse av spam
Spamfiltre har blitt viktige som den første forsvarslinjen mot det stadig økende problemet med uønsket e-post. Men nesten alle som bruker epost i stor utstrekning, har opplevd smerte over uønskede e-postmeldinger som fremdeles er mottatt, eller viktige e-postmeldinger som ved et uhell er tatt i filteret. De falske positive og falske negative problemene med spamfiltre er i hjertet av NLP-teknologien, og igjen kokes ned til utfordringen med å utvinne mening fra tekststrenger. En teknologi som har fått mye oppmerksomhet er Bayesian spam filtrering, en statistisk teknikk der forekomsten av ord i en e-post er målt mot dens typiske forekomst i et corpus av spam og ikke-spam e-post.
Informasjon Utvinning
Mange viktige beslutninger i finansmarkedene beveger seg i økende grad fra menneskets tilsyn og kontroll. Algoritmisk handel blir stadig mer populær, en form for finansiell investering som er helt kontrollert av teknologi. Men mange av disse økonomiske beslutningene påvirkes av nyhetene, av journalistikk som fremdeles fremdeles er fremstilt på engelsk. En stor oppgave, da, av NLP har blitt å ta disse plaintext kunngjøringer, og trekke ut relevant info i et format som kan bli fakturert i algoritmiske handelsbeslutninger. For eksempel kan nyheter om fusjon mellom selskaper ha stor innflytelse på handelsbeslutninger, og hastigheten der informasjonen om fusjonen, spillerne, prisene, som kjøper hvem som kan bli innlemmet i en handelsalgoritme, kan ha profittimplikasjoner i millioner av dollar.
samandrag
Informasjonsoverbelastning er et reelt fenomen i vår digitale tidsalder, og allerede vår tilgang til kunnskap og informasjon overskrider vår evne til å forstå det. Dette er en trend som ikke viser noe tegn på å bremse ned, og derfor blir en evne til å oppsummere betydningen av dokumenter og informasjon stadig viktigere. Dette er viktig, ikke bare ved å gi oss muligheten til å gjenkjenne og absorbere relevant informasjon fra store mengder data. Et annet ønsket resultat er å forstå dypere følelsesmessige betydninger, for eksempel basert på aggregerte data fra sosiale medier, kan et selskap bestemme det generelle stemningen for sitt nyeste produkttilbud? Denne grenen av NLP vil bli stadig mer nyttig som en verdifull markedsføringsaktivitet.
Spørsmål svarer
Søkemotorer setter verdens vell av informasjon innen fingertuppene, men er fortsatt generelt ganske primitive når det gjelder å svare på bestemte spørsmål som stilles av mennesker. Google har sett frustrasjonen dette har forårsaket hos brukere, som ofte må prøve en rekke forskjellige søkeresultater for å finne svaret de leter etter. Et stort fokus på Googles innsats i NLP har vært å gjenkjenne natursprogspørsmål, trekke ut betydningen og gi svaret, og utviklingen av Googles resultatside har vist dette fokuset. Selv om det virkelig forbedrer seg, er dette fortsatt en stor utfordring for søkemotorer, og en av de viktigste bruksområdene til naturlig språkbehandling.