Sådan installeres NLTK?

Den følgende artikel Installer NLTK giver en oversigt til installation af NLTK. NLTK er et sæt biblioteker til naturlig sprogbehandling. Det er en platform til opbygning af Python-programmer til behandling af naturligt sprog. NLTK er skrevet på Python-programmeringssprog. Det blev udviklet af Steven Bird og Edward Loper. Det understøtter forskning og undervisning i NLP eller tæt beslægtede områder, herunder kognitiv videnskab, empirisk sprogvidenskab, informationsindhentning, kunstig intelligens og maskinlæring. NLTK giver et brugervenligt interface.

NLTK (Natural Language Toolkit)

  • Natural sprogbehandling (NLP) er en del af kunstig intelligens, der behandler det sprog, der tales af mennesker. Således hjælper det mennesker med at interagere med computere, selvom de ikke har viden om, hvordan man bruger det. Ved hjælp af NLP er mennesker bare nødt til at diktere kommandoen til computere. Med kraften i maskinlæring bliver Natural Language Processing populære og lettere at implementere. Det er dybest set teknikken til at interagere med mennesker og udføre handlinger på stemmekommandoer.
  • Dette gør det muligt for enheder at blive brugt af selv en begynder, der ikke har nogen viden om teknologi. Men implementeringen af ​​naturlig sprogbehandling er ikke let, da et sprog, der tales af mennesker, ikke har nogen bestemt struktur. Det er tvetydigt og afhænger af sammenhængsord, der kan have en anden betydning.
  • NLTK har mere end 50 korpora og leksikale kilder som WordNet, Problem Report Corpus, Penn Treebank Corpus osv. Det leveres også med en vejledning, der forklarer begreberne sprogbehandling ved hjælp af værktøjssæt og programmeringsfundament i Python, hvilket gør det let for folket der ikke har dyb viden om programmering. Det har en bred vifte af pakker, der gør det til en af ​​de magtfulde værktøjssæt til NLP. Tokenization, Lemmatization, Stemming, Parsing, Character count, Tegnsætning, word count er nogle af disse pakker.

Installer NLTK til Windows

Herunder er instruktionerne til installation af NLTK i Windows. Disse er baseret på antagelsen om, at Python ikke er installeret i systemet. NLTK kræver Python versioner 2.7.3.5 og nyere.

Trin 1: Download den nyeste version af Python til Windows fra nedenstående link

https://www.python.org/downloads/

Trin 2: Klik på downloadet .exe for at køre det.

Trin 3: Vælg tilpas installation.

Trin 4: Kontroller for alle funktionerne, især “pip”, da det hjælper med at installere NLTK og klikke på Næste.

Trin 5: I det næste skærmbillede skal du vælge avancerede indstillinger, vælge stien og klikke på installation.

Trin 6: Når installationen er vellykket tæt på vinduet.

Trin 7: Kopier stien til mappen Scripts for at installere NLTK i den samme mappe.

NLTK kan let installeres ved hjælp af et “pip” installationsprogram. Vi er også nødt til at installere “numpy”.

Trin 8: For at installere NLTK skal du åbne kommandoprompten og indtaste kommandoen nedenfor.

Sørg for, at installationen er vellykket.

Efter en vellykket installation er det nu tid til at bruge NLTK til naturlig sprogbehandling.

Trin 9: Åbn Python Shell og skriv kommandoen nedenfor.

Hvis det importeres uden fejl, betyder det, at NLTK er installeret korrekt.

Installer NLTK til Mac / Linux

I modsætning til i Windows kommer Linux-systemer med Python installeret i det. For at installere NLTK i Linux / Mac bruges Pythons Pip-pakkeinstallatør. For at installere pip eller opdatere det, skriv det under kommandoer i kommandoprompten.

Brug følgende kommandoer til at installere python i Linux.

Trin 1: Brug følgende kommando til at opdatere pakkeindekset.

Trin 2: Sådan installeres Python i Linux-systembrug nedenfor.

Trin 3: Skriv følgende kommando for at installere “pip” til Python 3.

Trin 4: Når “Pip” er installeret, skal du bruge følgende kommandoer til at installere NLTK.

NLTK Datasæt

NLTK har mange datasæt tilgængelige til behandling af naturligt sprog, for eksempel WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank osv. Disse datasæt kaldes corpora. Grundlæggende indeholder NLTK-datasættet et sæt filer eller dokumenter. Hver fil / dokument indeholder en samling af ord, bogstaver eller tekst på et enkelt sprog. Således er et korpus hovedsageligt biblioteker til forståelse / indlæring af et sprog. Det har regler for grammatik og struktur for et sprog.

Når du har installeret NLTK, kan du importere den og også downloade dens corpora med følgende kommando.

NLTK downloader åbner et vindue til download af datasættene. Størrelsen på datasættet er stort, og det vil derfor tage tid. For at teste, om datasæt er installeret korrekt, skal du prøve at importere datasættet og bruge det.

Behandling af NLTK

Der er 5 hovedprocesser inden for Natural Language Processing. Dette er de trin, der er involveret i behandling af enhver tekst.

  1. EOS-detektion : Afslutning af taledetektion opdeler teksten i en samling meningsfulde sætninger. Det deler den lange tekst op i dele, der har en vis betydning.
  2. Tokenisering : Dette trin opdeler sætningerne i symboler. Tokens indeholder ikke kun ord, men inkluderer også mellemrum, sætningsbrud.
  3. POS-tagging : POS betyder lydaftryk. Her er information tildelt token. Denne information antyder, hvilken type tale det er som anspændt, verb, adjektiv, substantiv osv.
  4. Chunking : Chunking betyder indsamling af tekstbaseret på tags.
  5. Ekstraktion: Ekstraktion er en løbende proces med at gå gennem klumper og mærke dem som navngivne enheder som mennesker, lokationer, organisationer osv.

Konklusion:

NLTK bruges til tekstklassificering, billedtekst, talegenkendelse, besvarelse af spørgsmål, sprogmodellering, dokumentopsummering og mange andre handlinger. Der er mange andre værktøjer til naturlig sprogbehandling. Men NLTK har en bred vifte af biblioteker, der gør det til et af de kraftfulde naturlige sprogbehandlingsværktøjer. Det er mere nøjagtigt end noget andet værktøj, men på grund af et stort antal biblioteker er det lidt langsomt. Så det hele afhænger af brugerens krav. Hvis brugeren ønsker hastighed, kan de også foretrække andre værktøjer, men så bliver de nødt til at gå på kompromis med indholdets nøjagtighed. Men hvis nøjagtighed er en prioritet, bør de bestemt gå til NLTK.

Anbefalede artikler:

Dette har været en guide til installation af NLTK. Her diskuterer vi det grundlæggende koncept og forskellige trin til installation af NLTK på Windows og Linux \ Mac. Du kan også se på de følgende artikler for at lære mere-

  1. Installer Kubernetes Dashboard
  2. Sådan installeres JDK
  3. Installer Docker
  4. Sådan installeres Magento?
  5. Magento versioner | Funktioner i Magento-versioner

Kategori: