糖心原创

Guida per principianti all'analisi del testo

Guida per principianti all'analisi del testo

3 gennaio 2022

Customer Experience

Quando i clienti sono entusiasti o delusi dalleinterazioniecustomer experience CX) di un marchio, è probabile che abbiano fornitoun feedbackricco di dati insights. I dati di feedback — siano essidiretti,indiretti,strutturati onon strutturati— sono ovunque.

Dai sondaggi alle recensioni sui social media, un sito Azienda ha l'opportunità di cogliere i segnali dei clienti che guidano il processo decisionale e il successo complessivo dell'azienda.

Spesso, però, i brand hanno difficoltà a gestire questa mole di dati. Per gli analisti umani è eccessivo (e virtualmente impossibile) esaminare manualmente migliaia di feedback su un'ampia varietà di canali su base regolare.

Ma esiste una soluzione a questa sfida:l'analisi testuale, che fornisce insights dai dati, raccogliendo commentiricchi di sentiment e classificandoli in categorie rilevanti per il business.

Che cos'è l'analisi del testo nei Big Data?

Nell'ecosistema omnichannel, i punti di contatto tra un marchio e i suoi clienti sono innumerevoli. Ogni giorno vengono generate enormi quantità di dati, spesso definiti .

L'analisi testuale è uno dei metodi utilizzati per ottenere insights dai big data convertendo il testo non strutturato in dati strutturati.

Per analizzare e comprendere i dati testuali non strutturati sono necessarie diverse procedure. L'analisi del testo comprende processi come la pulizia dei dati, la pre-elaborazione, l'estrazione di caratteristiche e l'.

Differenza tra analisi del testo e text mining

L'analisi testuale evengono spesso confusi, ma non c'è dubbio che si tratti di due argomenti distinti. L'analisi testuale utilizza metodi statistici e di apprendimento automatico per valutare i dati testuali e ricavarne insights, mentre il text mining estrae informazioni da dati non strutturati.

Vantaggi dell'analisi del testo

L'analisi testuale sta diventando sempre più popolare. I marchi leader in molti settori stanno investendo in piattaforme softwarecustomer experience (CEM)che includono l'analisi testualetra le loro funzionalità principali.

Ecco una panoramica dei vantaggi dell'analisi dei testi che migliorano un programma di feedback:

  • Ottieni insights meno domande:i sondaggi lunghi e prolissi possono scoraggiare i clienti dal fornire un feedback, ma l'analisi testuale approfondisce anche le risposte più brevi per rivelarne il significato nascosto.
  • Arrivare alla causa principale: I punteggi numerici non sempre spiegano il "perché" del feedback. L'analisi testuale, invece, fornisce dettagli che permettono di identificare cosa funziona e qual è la causa principale di un problema che i clienti incontrano di frequente.
  • Ottieni insights tempestive:i dipendenti hanno già una lunga lista di attività che richiedono molto tempo da sbrigare, e chiedere loro di analizzare minuziosamente ogni parola dei feedback dei clienti non è realistico. L'analisi testuale si fa carico di tutto il lavoro, e lo fa con un'affidabilità di gran lunga superiore.
  • Identificare le tendenze emergenti: Gli esseri umani hanno bisogno di dati per prendere decisioni informate e intelligenti. Grazie alle parole e alle frasi utilizzate dai clienti, l'analisi dei testi mette in luce le tendenze che un'azienda non può permettersi di ignorare e di cui deve approfittare.
  • Comprendere le esigenze dei clienti: I clienti vi diranno cosa vogliono, di cosa hanno bisogno e cosa si aspettano. Basta ascoltarli e l'analisi dei testi porta in primo piano parole chiave, temi e sentimenti.
  • Prendere decisioni basate sui dati:per servire meglio i clienti, lasciamo che siano le insights ricavati dall'analisi testuale indicare la strada da seguire percustomer experience .
  • Migliorare employee experience dei clienti e employee experience:così come per la CX, l'analisi testuale migliora ancheemployee experience EX). L'analisi testuale esamina in dettaglio i dati relativi ai dipendenti, qualiil punteggio relativo all'impegno,il coinvolgimento,la soddisfazione eil sentiment.

Con l'aumento del volume di feedback raccolti dalle organizzazioni, l'analisi dei testi è l'unica opzione per tenere il passo.

Analisi del testo di base

L'analisi del testo varia da quella di base a quella avanzata. Il tipo di comprensione che si ottiene dipende dal tipo di analisi utilizzato.

A livello di base, l'analisi del testo comporta quanto segue.

Analisi della frequenza delle parole

L'analisi della frequenza delle parole conta le parole presenti nel testo. Questo approccio consente di individuare i termini e gli argomenti più popolari del testo.

Rilevamento delle frasi

Oltre all'uso di parole specifiche, ci sono frasi che il pubblico può usare e che hanno un'influenza significativa sul sentiment e su altri elementi chiave. Il rilevamento delle frasi permette di trovare frasi frequenti nel testo, consentendo di identificare i temi.

Analisi del sentimento

A livello superficiale, le parole possono essere fuorvianti se non si ha un contesto. Un modo per ottenere la giusta prospettiva è determinare le emozioni associate. ? qui che entra in gioco la sentiment analysis. Essa aiuta a determinare l'emozione di un testo, consentendo di identificare le aree di sviluppo.

Modellazione degli argomenti

Quando parole, frasi e sentimenti sono ripetitivi, significa che c'è un tema di fondo. La modellazione tematica identifica i temi del testo e aiuta a individuare le idee principali di un testo.

Analisi testuale avanzata

A seconda delle dimensioni e della natura dell'azienda, l'analisi testuale di base potrebbe non offrire una visione sufficiente. Potrebbe essere necessario ricorrere ad analisi testuali avanzate.

Riconoscimento di entità denominate

Il riconoscimento di entità denominate (NER) identifica e categorizza persone, organizzazioni e luoghi nel testo. Inoltre, questo metodo aiuta a identificare le connessioni tra entità testuali.

Classificazione del testo

La categorizzazione del testo prevede la classificazione del testo in diverse categorie. Oltre ad aiutare a organizzare i dati di un testo massiccio, questo metodo individua i modelli.

Raggruppamento

Un altro modo per identificare i modelli nei dati non strutturati è il clustering. Questo metodo raggruppa il testo in base al contenuto, rendendo più facile l'identificazione dei modelli.

Estrazione della relazione

Anche se non accade spesso, alcuni dei vostri consumatori potrebbero avere relazioni strette. Grazie all'estrazione delle relazioni, è possibile determinare le relazioni testuali tra persone, organizzazioni e luoghi. Questa conoscenza aggiunge un contesto alle loro conversazioni, consentendovi di agire di conseguenza.

Analisi della rete

Andando oltre le relazioni, vi renderete conto che esistono gruppi specifici con un legame comune. L'analisi di rete esamina i collegamenti testuali per trovare modelli e tendenze che aiutano a spiegare come le cose interagiscono.

Tecniche e applicazioni di analisi del testo

L'analisi testuale comprende diverse tecniche per l'analisi di dati testuali non strutturati. Oltre all'analisi tematica e all'analisi del sentiment, esistono diverse altre tecniche che le aziende possono utilizzare per ottenere insights dai propri dati testuali.

Passiamo in rassegna le tecniche e le applicazioni dell'analisi del testo.

Analisi degli argomenti

L'analisi tematica categorizza le frasi dei feedback dei clienti in argomenti rilevanti per l'azienda. Ad esempio, "l'addetto alle vendite era gentile" verrebbe categorizzato in "cordialità del personale". In genere esistono due modi per ottenere questo risultato: un'impostazione manuale, un approccio basato su regole e tecniche di apprendimento automatico.

Analisti e linguisti costruiscono manualmente le regole per il metodo basato sulle regole. Ad esempio, una clausola contenente due parole come "amichevole" e "dipendente" potrebbe essere inserita nell'argomento "Cordialità del personale".

Tali regole possono anche valutare l'ordine delle parole e le relazioni grammaticali tra parole importanti. La procedura di impostazione richiede molto tempo, ma i commenti classificati sono precisi perché ogni regola è costruita individualmente.

Anche l'apprendimento automatico, che utilizza la classificazione e il clustering supervisionati, è una componente chiave dell'analisi degli argomenti. Pertanto, un analista assegna manualmente i soggetti a un campione di commenti per la categorizzazione supervisionata. Da qui, il set di dati annotati addestra il classificatore a etichettare automaticamente i nuovi commenti.

Sebbene l'annotazione dei dati sia più semplice dello sviluppo di regole, i classificatori funzionano solo con meno di dieci soggetti.

Analisi del sentimento

L'analisi del sentimento etichetta le frasi come positive o negative. "L'addetto alle vendite è stato molto gentile" verrebbe etichettato come positivo.

L'analisi del sentiment basata sui dizionari è semplice da impostare. ? simile all'estrazione di tutte le parole da un dizionario e all'assegnazione di un sentiment positivo o negativo a ciascuna parola. Il sentiment delle parole cambia, tuttavia, a seconda del contesto.

Di solito si pensa che le parolacce trasmettano un sentimento negativo, ma nella comunità dei videogiochi, ad esempio, le cose possono essere più confuse. Le parole positive sono spesso usate in modo ironico e le parole negative hanno in realtà sentimenti positivi se inserite nel contesto.

Per tenere conto del contesto, le tecniche di apprendimento automatico supervisionato offrono un modo migliore di assegnare il sentiment. Simile alla classificazione supervisionata descritta per l'analisi degli argomenti, l'apprendimento automatico supervisionato per l'analisi del sentiment comporta il prelievo di un campione di clausole per il contesto a cui si è interessati e l'assegnazione manuale a ciascuna clausola di un sentiment positivo o negativo. Da questo insieme di dati annotati, l'algoritmo può quindi assegnare nuove clausole con un sentiment basato su ciò che ha appreso dal campione di commenti.

Riconoscimento di entità denominate

Il riconoscimento di entità denominate (NER) estrae persone, organizzazioni e luoghi da dati testuali non strutturati. Il NER è in grado di individuare persone e organizzazioni influenti nei feedback dei consumatori e nei dati dei social media. Inoltre, il NER può anche riconoscere temi e argomenti del testo.

Etichettatura part-of-speech

L'analisi del testo utilizza il part-of-speech (POS) tagging per classificare ogni parola di una frase. Questo metodo aiuta ad analizzare la grammatica delle frasi e a comprendere la letteratura.

Parsing delle dipendenze

Il Dependency Parsing nell'analisi dei testi aiuta le aziende a scoprire le connessioni grammaticali e di frase. Inoltre, questo metodo aiuta ad analizzare la struttura delle frasi e a comprendere i contenuti.

Classificazione del testo

La classificazione del testo utilizza i contenuti per classificare il testo in categorie predeterminate. Questo metodo aiuta a identificare gli argomenti più popolari nei feedback dei consumatori e nei social media. Inoltre, la classificazione del testo può anche rivelare le idee chiave.

Come condurre un'analisi del testo

L'analisi del testo comprende la raccolta dei dati, l'elaborazione dei dati, l'analisi del testo e la visualizzazione.

Ecco qualche informazione in più sul funzionamento di ciascuna fase.

#1. Raccolta dati

L'analisi del testo inizia con i dati provenienti dai social media, dai moduli di feedback dei consumatori e dalle recensioni online. Assicuratevi che i dati siano pertinenti alla vostra sfida aziendale.

#2. Elaborazione dei dati

Dopo la raccolta dei dati si passa all'elaborazione, alla pulizia e alla preparazione dei dati per l'analisi. L'elaborazione dei dati comporta l'eliminazione del materiale estraneo, la formattazione e la strutturazione dei dati non strutturati per l'analisi.

#3. Analisi del testo

Dopo aver elaborato i dati, è necessario analizzarli per trarne conclusioni. Ciò comporta l'analisi del sentiment, la modellazione degli argomenti e l'identificazione delle entità nominate.

#4. La visualizzazione

Infine, dovrete mostrare ai vostri interlocutori i risultati dell'analisi del testo. A questo scopo si possono utilizzare nuvole di parole, grafici a barre e mappe di calore.

Come preparare i dati di testo per l'analisi

La preparazione dei dati per l'analisi del testo garantisce risultati affidabili e comprensibili.

Ecco come preparare i dati di testo per l'analisi.

#1. Dati puliti

I dati di testo vengono puliti eliminando elementi HTML, URL e caratteri speciali. In questo modo i dati vengono puliti e organizzati per l'analisi.

#2. Pre-elaborazione del testo

La pre-elaborazione del testo converte i dati di testo in un formato pronto per l'analisi. Si tratta di rimuovere i numeri, la punteggiatura e il testo minuscolo.

#3. Tokenizzare il testo

La tokenizzazione divide il testo in parole e frasi. In questo modo, l'analisi dei dati testuali diventa più semplice.

#4. Rimuovere le stop words

La rimozione delle stop word rimuove dal testo parole frequenti come "e", "il" e "è". Questi termini possono distorcere le analisi.

#5. Semplificare i dati con lo stemming e la lemmatizzazione

La stemmatizzazione e la lemmatizzazione comportano il radicamento delle parole. In questo modo è possibile semplificare e analizzare i dati del testo. Lo stemming consiste nel rimuovere i suffissi dalle parole, mentre la lemmatizzazione li riduce.

Un approccio più intelligente all'analisi del testo

L'analisi del testo è un concetto complesso ed estraneo quando si esplorano per la prima volta le sue capacità e i suoi vantaggi. Ma ora dovreste conoscere le basi dell'analisi testuale e il prossimo passo sarà quello di collaborare con un fornitore di software che apporti competenze specialistiche.

L'analisi testuale in tempo reale e incentrata sull'utente糖心原创ti permette di individuare insights e stimolare l’azione. Utilizzal’intelligenza artificiale (AI)e per identificare rapidamente le tendenze emergenti e le insights su larga scala. E poiché abbiamo iniziato a sviluppare la nostra analisi testuale nativa più di dieci anni fa, è la soluzione di analisi testuale più completa, interconnessa e accessibile disponibile.


Autore

POSTI COLLEGATI