.st0{fill:#FFFFFF;}

Strumenti analisi dati

Data cleaning Excel: pulire dati

 Febbraio 25, 2020

By  Damiano Causale

  • Home
  • Data cleaning Excel: pulire dati

Hai mai sentito parlare di data cleaning Excel? E se invece ti dicessi pulizia dei dati?

La pulizia dei dati è una delle attività più importanti di Excel. È quella che quotidianamente svolgiamo, talvolta senza nemmeno renderci conto di farla.

Per Excel, i dati rappresentano l’alimento quotidiano. Qualsiasi analisi eseguita in Excel coinvolge i dati. E quando si lavora con i dati, sai benissimo che ci sono un sacco di cose che non potrebbero andare per il verso giusto.

Probabilmente, almeno una volta, ti sarà capitato di ricevere in Excel dei dati esportati da altri software e, nella maggior parte dei casi, questi dati non vengono importati in modo corretto. Mi riferisco ai casi in cui i dati contengono spazi extra, celle vuote oppure una formattazione differente (date o numeri interpretati come testo), o ancora casi in cui è necessario manipolare le stringhe di testo.

Per avere successo con Excel e lavorare in modo efficiente, devi imparare a fare la pulizia dei dati.

In questo articolo ti mostrerò alcune delle tecniche di pulizia dati in Excel. Quelle che di seguito ti propongo, sono quelle che preferisco e che utilizzo più di frequente.

Cancella la formattazione

Cancellare la formattazione delle celle è utile per ripulire i dati e applicare la propria formattazione.

È possibile eliminare tutta la formattazione attraverso un utile comando.

Seleziona l’intervallo di dati.

Vai sulla scheda Home e fai un clic sul comando  Cancella presente nel gruppo Modifica. Successivamente seleziona il comando Cancella formati dal menu.

Cancella la formattazione Excel

Oltre i formati, potrai anche cancellare solo il contenuto, i commenti o i collegamenti ipertestuali.

Data cleaning Excel: elimina gli spazi extra

Ecco una delle più importanti operazioni di data cleaning Excel.

Individuare gli spazi extra nelle celle è un’operazione piuttosto difficile. In modo particolare quando si tratta di individuare gli spazi finali. Mentre individuare gli spazi extra tra parole o numeri potrebbe risultare più semplice; individuare  gli spazi extra finali è spesso, o forse sarebbe meglio dire sempre, un’operazione ardua in quanto non sono visibili.

Ecco una semplice soluzione per sbarazzarti di questi spazi extra: la funzione ANNULLA.SPAZI.

Data cleaning Excel: elimina gli spazi extra

Questa funzione ti consente di rimuovere gli spazi iniziali,  gli spazi aggiuntivi tra le parole (tranne gli spazi singoli) e gli spazi finali.

Utilizza il comando Trova e sostituisci per pulire i dati in Excel

Il comando Trova e sostituisci è uno strumento indispensabile quando si tratta di pulizia dei dati.

Utilizza il comando Trova e sostituisci per pulire i dati in Excel

Grazie a questo strumento potrai, ad esempio:

  • modificare i riferimenti nelle formule;
  • trovare e modificare la formattazione
  • rimuovere tutti gli zeri, ecc.

Selezionare ed eliminare tutte le celle vuote

Spesso la presenza di celle vuote all’interno di un intervallo di dati crea un po’ di problemi quando si lavora con i report o le dashboard.

In questi casi potresti semplicemente evidenziare le celle vuote oppure inserire un testo riempitivo. Eseguire questa operazione manualmente potrebbe richiedere ore. Per fortuna, Excel mette a disposizione un modo per selezionare tutte le celle vuote contemporaneamente.

Ecco come.

Seleziona l’intervallo di dati. Premi il tasto funzione F5. A questo punto Excel ti mostra la finestra di dialogo Vai a.

Selezionare ed eliminare tutte le celle vuote in Excel

Fai clic sul pulsante Speciale… presente in basso a sinistra. Comparirà la finestra di dialogo Vai a formato speciale. A questo punto seleziona l’opzione Celle vuote e fai clic su OK.

Finestra di dialogo Vai a formato speciale Excel

In questo modo potrai selezionare tutte le celle vuote presenti all’interno del tuo intervallo di dati.

Qualora volessi inserire un carattere riempitivo o una scritta, digita il testo desiderato e successivamente premi la seguente combinazione di tasti.

combinazione di tasti Excel

Fai attenzione! Se preme solo il tasto Invio, il valore verrà inserito solo nella cella attiva.

Prima di passare al prossimo metodo, ti suggerisco un ulteriore modalità per evidenziare le celle vuote.

Grazie allo strumento della Formattazione condizionale potrai mettere in evidenza queste celle.

Seleziona i dati e vai sulla scheda Home. All’interno del gruppo Stili, fai un clic su Formattazione condizionale.

Dal menu seleziona la voce Nuova regola e successivamente seleziona la regola Formatta solo le celle che contengono. Infine, dal menu a tendina seleziona Valore vuoto.

Strumento della Formattazione condizionale Excel

Ora, sceglie il tipo di formato da applicare e fai un clic su OK. Tutte le celle con valori vuoti verranno evidenziate.

Regole di Formattazione condizionale Excel

Convertire i numeri memorizzati come testo in numeri

Son sicuro che ti sarà capitato di ritrovarti all’interno del tuo foglio di lavoro, dei numeri che vengono memorizzati come testo.

Questo capita quanto si importano dati da file di testo o da database esterni.

Ti ritrovi pertanto ad avere dei problemi quando vuoi utilizzare queste celle nei calcoli.

Ecco perché voglio suggerirti un piccolo trucco per convertire i numeri memorizzati come testo in numeri.

Ti assicuro che è un metodo infallibile!

Seleziona una cella vuota all’esterno del tuo intervallo di dati. Ora digita il numero 1 e premi la combinazione di tasti CTRL + Invio.

Premi la combinazione di tasti CTRL + C per copiare.

Ora seleziona la cella o l’intervallo che desideri convertire in numeri.

Fai un clic su Incolla e poi su Incolla speciale.

Nella finestra di dialogo Incolla speciale, seleziona l’opzione Moltiplica all’interno del gruppo Operazione.

Convertire i numeri memorizzati come testo in numeri in Excel

Fai un clic su OK. A questo punto noterai che converte tutti i numeri in formato testo saranno convertiti in numeri.

Data cleaning Excel: rimuovere i duplicati in Excel

All’interno del tuo file potrebbero essere presenti dei dati duplicati. Se vuoi eliminare le righe duplicate in un foglio allora potrai farlo in due modi.

Il primo è evidenziare le celle contenenti dati duplicati.

Il secondo è eliminare le celle con i duplicati.

Evidenziare i duplicati

Nel primo caso potrai utilizzare la Formattazione condizionale Excel.

Dopo aver selezionato i dati vai sulla scheda Home.

All’interno del gruppo Stili, fai un clic su Formattazione condizionale.

Dal menu seleziona la voce Regole evidenziazione celle e successivamente scegli Valori duplicati.

A questo punto potrai scegliere il tipo di formato da applicare ai valori duplicati. Infine, tutti i valori duplicati verranno evidenziati.

Data cleaning Excel | Evidenziare i duplicati Excel

Eliminare i duplicati

La seconda modalità che puoi utilizzare in presenza di valori duplicati è utilizzare il comando Rimuovi duplicati.

Questo comando potrai trovarlo all’interno del gruppo Strumenti dati nella scheda Dati.

Data cleaning Excel | Rimuovere i duplicati in Excel

Se i tuoi dati contengono le intestazioni, assicurati che la casella di controllo Dati con intestazioni, presente in alto a destra, sia selezionata.

Applica la spunta sulle colonne da cui desideri rimuovere i duplicati e infine fai un clic su OK.

A questo punto i tuoi dati non conterranno valori duplicati.

Suddividere il contenuto di una cella di testo in colonne distinte

Importare i dati da un file di testo spesso comporta che i dati vengano inseriti in una cella.

A questo punto è necessario suddividere il contenuto di una cella di testo in colonne distinte.

Per compiere questa operazione puoi utilizzare il comando Testo in colonne presente nel gruppo Strumenti dati della scheda Dati.

Suddividere il contenuto di una cella di testo in colonne distinte in Excel

Innanzitutto, seleziona le celle contenenti il testo da suddividere.

Fai un clic sulla scheda Dati e fai un clic sul comando Testo in colonne.

Excel mostrerà una finestra di dialogo con una procedura guidata.

Nel Passaggio 1 di 3, seleziona il tipo di dati: Delimitato o Larghezza fissa.

Comando Testo in colonne Excel

Qualora i dati fossero separati da caratteri come virgola, punto e virgola, trattino, punto, selezionare la voce Delimitato. Successivamente fai un clic su Avanti.

Nel Passaggio 2 di 3, seleziona il carattere che separa i dati (Delimitatore). Qualora il carattere non fosse presente tra i delimitatori elencati, potrai utilizzare l’opzione Altro.

Comando Testo in colonne Excel

Infine, nel Passaggio 3 di 3, seleziona il formato dei dati e specifica la cella di destinazione.

Comando Testo in colonne Excel

Se la cella di destinazione non viene selezionata, la cella contenente i dati verrà sovrascritta.

Convertire il testo in maiuscolo, minuscolo o le iniziali maiuscole

Dopo aver importato i dati da file di testo, capita spesso che alcuni parti del testo non siano corrette ad esempio i nomi ed i cognomi non contengono i caratteri iniziali in maiuscolo. Oppure potresti avere la necessità di scrivere tutto il testo in caratteri maiuscoli. In tutti questi casi puoi utilizzare le seguenti funzioni di testo:

  • MAIUSC
  • MINUSC
  • INIZ

La funzione MAIUSC di Excel (in inglese nota come funzione UPPER) converte una stringa di testo da minuscolo a maiuscolo.

La funzione MINUSC di Excel (in inglese nota come funzione LOWER), converte le lettere contenute in una stringa di testo da maiuscole a minuscole.

La funzione MAIUSC.INIZ di Excel (in inglese nota come funzione PROPER), converte in maiuscolo la prima lettera di ciascuna parola in una stringa di testo e converte le altre in minuscolo.

Data cleaning Excel: evidenziare gli errori in Excel

Il controllo degli errori è fondamentale.

Per individuare gli eventuali errori presenti nel tuo foglio di lavoro puoi utilizzare due modalità.

  • Le regole di Formattazione condizionale.
  • Il comando Vai a formato speciale.

Evidenziare gli errori con le regole di Formattazione condizionale

Seleziona i dati e vai sulla scheda Home. Fai un clic su Formattazione condizionale e seleziona Nuova regola.

Evidenziare gli errori con le regole di Formattazione condizionale Excel

Nella finestra di dialogo Nuova regola di formattazione, seleziona la regola Formatta solo le celle che contengono. Poi seleziona Errori dal menu a discesa.

Nuova regola di Formattazione condizionale Excel

Imposta il formato desiderato e fai un clic su OK.

A questo punto, qualsiasi errore nell’intervallo di dati sarà evidenziato.

Evidenziare gli errori con il comando Vai a formato speciale

La seconda modalità per evidenziare gli errori in Excel è utilizzare il comando Vai a formato speciale presente nel gruppo Modifica della scheda Home.

Evidenziare gli errori con il comando Vai a formato speciale Excel

Dopo aver selezionato i dati fai un clic sul comando Vai a formato speciale. In alternativa, premi il tasto funzione F5.

In entrambi i casi verrà mostrata la relativa finestra di dialogo.

Seleziona l’opzione Formule e deseleziona tutte le opzioni tranne Errori. Infine, fai un clic su OK.

Finestra di dialogo Vai a formato speciale

Questo ti consentirà di selezionare tutte le celle con un errore. Ora potrai applicare un colore di riempimento alle celle, modificare o eliminare il contenuto.

Effettuare il controllo ortografico in Excel

Ultimo, ma non per importanza è il controllo ortografico del testo. Un file senza errori di ortografia è un indicatore sul tuo grado di attenzione e di cura per i dettagli.

Per effettuare il controllo ortografico puoi utilizzare il comando Controllo ortografia presente all’interno del gruppo Strumenti di correzione della scheda Revisione.

Effettuare il controllo ortografico in Excel

In alternativa, utilizza la scorciatoia da tastiera attraverso il tasto funzione F7.

 

Ora sicuramente sarai in grado di applicare alcune delle principali tecniche di data cleaning Excel.

Qual’è la tecnica che preferisci? Ci sono altre tecniche che usi a lavoro?

Se lo desideri, lascia un commento. Buon lavoro!

Damiano Causale


Mi chiamo Damiano Causale, istruttore Microsoft certificato, per lavoro aiuto aziende e privati nell'utilizzo di Excel.

Damiano Causale

Your email address will not be published. Required fields are marked

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}