Natural Language Processing je odvětvím umělé inteligence, které se zabývá interakcí mezi počítači a lidským jazykem. NLP umožňuje počítačům rozumět, interpretovat a reagovat na lidský jazyk. Techniky NLP je možné použít pro nepřeberné množství úkolů. Lze jej využít pro automatickou analýzu dokumentů, jejich třídění, analýzu článků nebo uživatelských recenzí. Je možné zjistit sentiment textů a rozhodnout, zda jsou pozitivní či negativní. NLP má využití i v chatbotech, překladačích při scrapingu a podobně.
Přístupů k NLP je mnoho, lze využít statistické metody či pokročilé neuronové sítě. Vše závisí na konkrétním use casu a požadavcích klienta. Automatické zpracování textu zahrnuje i řadu velmi specifických technik, jako je stemmatizace, lemmatizace, named entity recognition apod.
V Sentiscrape máme zkušenosti s vývojem NLP funkcí například pro analýzu uživatelských recenzí či pro detekci nelegálního obsahu.