ANALISI DEI DATI CONTENUTI NEGLI SCONTRINI: MODELLI DI ANALISI E DATA CLEANING

ANALISI DEI DATI CONTENUTI NEGLI SCONTRINI: MODELLI DI ANALISI E DATA CLEANING

Che sia collegata o meno al profilo del consumatore, la lettura OCR degli scontrini e lo studio dei dati contenuti in essi consente moltissime analisi in tanti ambiti significativi, quali:

Basket analysis
Osservatorio prezzi
Promozioni in corso
Abitudini di spesa dei consumatori
Percorsi di spesa dei consumatori

Come si può fare a rendere questa enorme quantità di dati effettivamente fruibile?

Innanzitutto, bisogna capire quali siano gli obiettivi principali che si vogliono raggiungere. Successivamente, è necessario pensare a costruire modelli di analisi che siano facilmente leggibili dalle figure dell’azienda a cui sono destinate le informazioni raccolte. È importante che l’analisi effettuata venga restituita in modo tale che per le aziende sia facile trasformare le informazioni ottenute in indicazioni precise e concretamente realizzabili rispetto agli obiettivi fissati inizialmente.

 

Una volta creati, i modelli di analisi andranno implementati, testati e, a seconda del risultato raggiunto, modificati e testati nuovamente. Se possibile, in questi casi è preferibile seguire una modalità di project management “Agile”, in modo tale da accorciare i tempi di realizzazione, verificare subito i primi risultati e applicare velocemente gli eventuali correttori necessari tramite l’impiego di soluzioni diverse e più adatte.

 

L’analisi degli obiettivi e la loro continua verifica è un elemento necessario perché, pur disponendo di grandi quantità di dati, non è detto che tutte le analisi siano possibili o sensate. È possibile, ad esempio, che alcune analisi non siano considerate significative in quanto non si sono raggiunti i volumi numerici necessari ai fini statistici. Dipende inoltre, anche dalla tipologia di analisi a cui si è interessati. Facciamo qualche esempio:

Osservatorio prezzi: sarà sufficiente anche un solo scontrino che contenga il prodotto, ma su quante più catene possibili e in un range di tempo molto limitato.
Frequenza di acquisto: occorreranno più scontrini, legati al profilo del consumatore, in un periodo di tempo medio/lungo.
Basket analysis: occorreranno molti scontrini, possibilmente legati al profilo del consumatore, individuando molto bene le “categorie” e “sotto-categorie” che si vogliono considerare perché significative in relazione al proprio prodotto.

Partendo da questi presupposti, è evidente che anche le campagne di ingaggio dei consumatori dovrebbero essere tarate, fin dall’inizio, sugli obiettivi di analisi che si vorranno poi conseguire. Ad esempio, se consideriamo un’azienda interessata al settore “prima infanzia” che desidera ottenere informazioni sulle abitudini di acquisto delle famiglie con bambini piccoli, sarà necessario creare delle promozioni relative a prodotti adatti alle famiglie e, se previsto dalla promozione, mettere in palio premi che interessino chi ha bambini piccoli, in modo da intercettare e coinvolgere i consumatori di interesse.

Quest’ultimo passaggio introduce un concetto molto importante: più la campagna è mirata e più sarà possibile ingaggiare un mio consumatore.

Esistono diversi casi di data set di scontrini che è possibile ottenere e che presentano caratteristiche differenti tra loro. Alcuni esempi di data set possono essere:

 

  1. Legati ad una campagna di ingaggio del consumatore, la quale prevede l’inclusione di uno o più prodotti di un determinato brand.
  2. Legati ad una campagna di ingaggio del consumatore ma promossi da un retailer.
  3. Generici e/o raccolti senza l’ingaggio di un consumatore.

Esaminiamo ora più da vicino i vari punti.

Per quanto riguarda la prima tipologia sarà importante, in fase di analisi, tenere in considerazione che i dati che avremo a disposizione rappresenteranno principalmente i consumatori di quel determinato prodotto. È altrettanto importante ricordare che, per ottenere un’analisi precisa, sarà necessario scartare una certa percentuale di scontrini contenenti, ad esempio, solamente il/i prodotti relativi alla promozione, considerabili per la maggior parte come frutto di acquisti effettuati al fine della partecipazione alla promozione stessa. Con questa tipologia, per ottenere dati che siano significativi in relazione al proprio brand, non sarà necessaria una grande quantità di scontrini.

 

La seconda tipologia di data set prevede, invece, che i dati raccolti rappresentino tutti i consumatori, non solamente una piccola parte. Gli scontrini che avremo a disposizione saranno quindi adatti a tutte quelle analisi riguardanti i comportamenti e le abitudini d’acquisto dei consumatori stessi (basket analysis). Un elemento importante da considerare è sicuramente l’influenza dell’insegna che ha generato gli scontrini, sulla tipologia generica di consumatore e sull’analisi stessa. In questo caso, per poter avere informazioni interessanti per quanto riguarda il proprio marchio, bisognerà disporre di grandi quantità di scontrini.

 

Con la terza tipologia di data set sarà possibile svolgere differenti tipi di analisi molto accurate, in quanto i dati che avremo a disposizione saranno relativi a tutte le insegne e a più tipologie di prodotti. Per contro però, sarà assente la parte di analisi inerente al profilo del consumatore. Questa tipologia, come la seconda, prevede grandi quantità di scontrini in modo da ottenere dati significativi in relazione al proprio brand.

 

Anche solo questo breve accenno ad alcuni possibili scenari mette chiaramente in evidenza sia la necessità di effettuare una scelta accurata delle proprie campagne di ingaggio del consumatore sia l’importanza della pulizia e dell’arricchimento del dato per poter raggiungere gli obiettivi di analisi che ci si è posti. Quindi, per concludere, non è sufficiente la sola lettura dello scontrino, ma saranno essenziali altri elementi quali:

Analisi preliminari
Creazione e test dei modelli d’analisi
Stati avanzamento
Data cleaning, data engineering e data enrichment

Il risultato sarà un monitoraggio puntuale, efficace e in tempo reale degli andamenti del mercato, delle abitudini, delle nuove tendenze ed esigenze dei consumatori propri e dei competitor attraverso l’utilizzo di Zero Party Data.