Perché configurare un OCR per leggere gli scontrini? Spesso per partecipare ad un concorso a premi è previsto l’invio di una prova di acquisto. E dato che si parla di moltissimi documenti da esaminare, nella maggior parte dei casi ci si affida ad un software specializzato che legge e salva i dati presenti: l’OCR (sigla che sta per optical character recognition).
Come automatizzare questo processo? Affidandolo ad un OCR dotato di un’intelligenza artificiale perchè comporta un grande risparmio di risorse. Se prima era un operatore a occuparsi di verificare i dati di ogni singola entry al fine di convalidare la partecipazione, con un ingente impiego di tempo, grazie al software l’intervento umano va sempre più a scomparire. Il processo di analisi dei dati si velocizza e questo permette di spingersi oltre la semplice validazione della giocata: lo scontrino è una miniera di informazioni sulle abitudini di consumo dell’utente che lo invia. In passato accedervi sarebbe stato eccessivamente time consuming, ma adesso questi dati sono a portata di clic e ignorarli significherebbe rinunciare ad un importante vantaggio competitivo.
In questo articolo vedremo quindi come configurare un OCR dotato di Intelligenza Artificiale e quali sono le caratteristiche che rendono questo software un prezioso alleato anche per il marketing aziendale.
PARTIAMO DALL’INIZIO APP PROPRIETARIA: SI O NO?
La prima scelta è scegliere se far utilizzare un’app specifica per la partecipazione al concorso per rendere più facili alcune operazioni di elaborazione del materiale ricevuto. All’interno dell’applicazione si può infatti inserire una fotocamera dalle funzioni “più intelligenti” ai fini dell’acquisizione rispetto a quella stock. Ad esempio, si può prevedere uno scatto già in greyscale, inserire un mirino per aiutare l’utente ad inquadrare soltanto lo scontrino, impostare il preset più adatto a fotografare un documento scritto.
D’altra parte, chiedere all’utente di scaricare una nuova app per partecipare ad un concorso potrebbe non essere la scelta migliore: smartphone con la memoria piena, il traffico dati agli sgoccioli, il semplice fastidio di dover installare l’ennesima applicazione da usare una volta sola… Permettere di giocare semplicemente accedendo ad un link sul browser (magari accessibile in modo rapido tramite un QR code) significa dover affrontare qualche elaborazione in più lato server, ma elimina un potenziale deterrente per l’utente, ripercuotendosi positivamente sul livello di partecipazione.
POI BISOGNA INIZIARE A CONFIGURARE UN OCR: LA PRE ELABORAZIONE
Scontrini stropicciati, inquadrati parzialmente o coperti da dita, immagini sfocate, troppo scure o troppo chiare, scattate sugli sfondi più improbabili: i problemi con le foto ricevute sono inevitabili. Come dobbiamo quindi configurare un OCR per facilitare l’operazione di lettura dei dati? Gli interventi di elaborazione più comuni consistono nella conversione dell’immagine da RGB a scala di grigi e nella riduzione del rumore, problema frequente soprattutto nelle foto scattate con smartphone datati o in condizioni di scarsa luminosità. Si può intervenire anche per correggere la prospettiva di un’immagine in cui lo scontrino non è stato fotografato perpendicolarmente, ma con un’inclinazione diversa.
LE INFORMAZIONI DA IDENTIFICARE PER CONFIGURARE UN OCR
Siamo arrivati al cuore del tema affrontato in questo articolo: come configurare un OCR dotato di intelligenza artificiale per ottenere le informazioni necessarie a convalidare la partecipazione al concorso? L’elaborazione non dovrà solo essere corretta, ma anche veloce. Soprattutto se si tratta di un contest del tipo instant win, si hanno a disposizione pochi secondi per comunicare l’esito della giocata, prima che l’utente si spazientisca o inizi a pensare che c’è qualcosa che non va. La prima cosa da definire è se l’oggetto fotografato sia davvero uno scontrino, dopo di che bisogna capire se effettivamente si tratta di uno scontrino che abilita a partecipare al contest, e non un documento a caso inviato nel tentativo di ingannare il sistema. Bisogna assicurarsi che:
-Lo scontrino sia stato emesso da un punto vendita che partecipa all’iniziativa. Per cui occorrerà configurare l’OCR per riconoscere e registrare il retailer che appare sul documento.
-Lo scontrino sia stato emesso nel periodo di validità del concorso, bisognerà quindi identificare la data e l’ora presenti sul documento.
-Lo stesso scontrino non sia già stato utilizzato.
-Se il concorso lo prevede, che lo scontrino abbia raggiunto l’importo necessario per poter partecipare al gioco. Ci sarà dunque bisogno di isolare la spesa totale.
-Se il concorso lo prevede, che all’interno dello scontrino compaia il prodotto il cui acquisto era vincolante per la partecipazione al concorso.
Individuare quest’ultima informazione può rivelarsi particolarmente problematico: infatti tutti i retailer utilizzano il nome o l’abbreviazione del nome del prodotto di una determinata industry in modo totalmente diverso, moltiplicando in modo significativo il numero delle possibili chiavi di ricerca, la chiave di ricerca peraltro non può essere troppo generica per non rischiare di riconoscere un prodotto che non appartenga affatto al promotore. In questo caso, come vedremo nel prossimo paragrafo, sarà necessario l’intervento di un operatore umano nel corso della fase di addestramento dell’intelligenza artificiale dell’OCR.
Oltre alle informazioni necessarie per convalidare o meno la giocata, vale la pena configurare l’OCR anche per raccogliere gli altri dati presenti sullo scontrino, meno rilevanti ai fini del contest, ma importantissimi dal punto di vista del marketing. Per esempio? Si possono raccogliere informazioni sul contenuto del carrello e quindi su tipo di prodotti scelti e brand preferiti. Per non appesantire le operazioni da eseguire in tempo reale al momento della giocata, si può configurare l’OCR per individuare in prima istanza solo le informazioni essenziali per confermare la partecipazione e salvare l’immagine per una successiva analisi più approfondita. L’insieme di tutti i dati raccolti permette di effettuare una profilazione anche molto dettagliata dei partecipanti al contest e conoscere in ogni istante i prodotti acquistati rendendo le manifestazioni a premio una fonte inesauribile di informazioni strategiche e non solo un sistema per aumentare le vendite o riconoscere un premio ai clienti fedeli.
COME CONFIGURARE UN OCR: L’INTERVENTO UMANO
Naturalmente, soprattutto nella prima fase di apprendimento dell’intelligenza artificiale, si dovrà ricorrere al supporto di un operatore umano. L’operatore umano interverrà anche in tutti quei casi in cui il software non riuscirà a leggere correttamente il testo da una foto di cattiva qualità, oppure ad individuare un dato perché non si trova nella posizione prevista. O, come già accennato, si riscontreranno difficoltà nell’identificare una certa referenza di prodotto, perché codificata in modo diverso da un retailer all’altro. Come configurare un OCR per affrontare questi inevitabili problemi? Lato client, è possibile utilizzare una modalità di inserimento manuale dei dati da parte dell’utente, oppure, in alternativa è possibile per le prime letture assistere la giocata del consumatore in modo da consentirgli di giocare e contestualmente addestrare il server alla nuova referenza attraverso dinamiche di mechanical turk. In questo modo si consente comunque di effettuare la giocata. Quindi si otterrà il duplice risultato di fare giocare il consumatore e di caricare il naming della referenza sicuramente corretto.