Hai mai sentito parlare di data cleaning Excel? E se invece ti dicessi pulizia dei dati?
La pulizia dei dati è una delle attività più importanti di Excel. È quella che quotidianamente svolgiamo, talvolta senza nemmeno renderci conto di farla.
Per Excel, i dati rappresentano l’alimento quotidiano. Qualsiasi analisi eseguita in Excel coinvolge i dati. E quando si lavora con i dati, sai benissimo che ci sono un sacco di cose che non potrebbero andare per il verso giusto.
Probabilmente, almeno una volta, ti sarà capitato di ricevere in Excel dei dati esportati da altri software e, nella maggior parte dei casi, questi dati non vengono importati in modo corretto. Mi riferisco ai casi in cui i dati contengono spazi extra, celle vuote oppure una formattazione differente (date o numeri interpretati come testo), o ancora casi in cui è necessario manipolare le stringhe di testo.
Per avere successo con Excel e lavorare in modo efficiente, devi imparare a fare la pulizia dei dati.
In questo articolo ti mostrerò alcune delle tecniche di pulizia dati in Excel. Quelle che di seguito ti propongo, sono quelle che preferisco e che utilizzo più di frequente.
Cancella la formattazione
Cancellare la formattazione delle celle è utile per ripulire i dati e applicare la propria formattazione.
È possibile eliminare tutta la formattazione attraverso un utile comando.
Seleziona l’intervallo di dati.
Vai sulla scheda Home e fai un clic sul comando Cancella presente nel gruppo Modifica. Successivamente seleziona il comando Cancella formati dal menu.
Oltre i formati, potrai anche cancellare solo il contenuto, i commenti o i collegamenti ipertestuali.
Data cleaning Excel: elimina gli spazi extra
Ecco una delle più importanti operazioni di data cleaning Excel.
Individuare gli spazi extra nelle celle è un’operazione piuttosto difficile. In modo particolare quando si tratta di individuare gli spazi finali. Mentre individuare gli spazi extra tra parole o numeri potrebbe risultare più semplice; individuare gli spazi extra finali è spesso, o forse sarebbe meglio dire sempre, un’operazione ardua in quanto non sono visibili.
Ecco una semplice soluzione per sbarazzarti di questi spazi extra: la funzione ANNULLA.SPAZI.
Questa funzione ti consente di rimuovere gli spazi iniziali, gli spazi aggiuntivi tra le parole (tranne gli spazi singoli) e gli spazi finali.
Utilizza il comando Trova e sostituisci per pulire i dati in Excel
Il comando Trova e sostituisci è uno strumento indispensabile quando si tratta di pulizia dei dati.
Grazie a questo strumento potrai, ad esempio:
- modificare i riferimenti nelle formule;
- trovare e modificare la formattazione
- rimuovere tutti gli zeri, ecc.
Selezionare ed eliminare tutte le celle vuote
Spesso la presenza di celle vuote all’interno di un intervallo di dati crea un po’ di problemi quando si lavora con i report o le dashboard.
In questi casi potresti semplicemente evidenziare le celle vuote oppure inserire un testo riempitivo. Eseguire questa operazione manualmente potrebbe richiedere ore. Per fortuna, Excel mette a disposizione un modo per selezionare tutte le celle vuote contemporaneamente.
Ecco come.
Seleziona l’intervallo di dati. Premi il tasto funzione F5. A questo punto Excel ti mostra la finestra di dialogo Vai a.
Fai clic sul pulsante Speciale… presente in basso a sinistra. Comparirà la finestra di dialogo Vai a formato speciale. A questo punto seleziona l’opzione Celle vuote e fai clic su OK.
In questo modo potrai selezionare tutte le celle vuote presenti all’interno del tuo intervallo di dati.
Qualora volessi inserire un carattere riempitivo o una scritta, digita il testo desiderato e successivamente premi la seguente combinazione di tasti.
Fai attenzione! Se preme solo il tasto Invio, il valore verrà inserito solo nella cella attiva.
Prima di passare al prossimo metodo, ti suggerisco un ulteriore modalità per evidenziare le celle vuote.
Grazie allo strumento della Formattazione condizionale potrai mettere in evidenza queste celle.
Seleziona i dati e vai sulla scheda Home. All’interno del gruppo Stili, fai un clic su Formattazione condizionale.
Dal menu seleziona la voce Nuova regola e successivamente seleziona la regola Formatta solo le celle che contengono. Infine, dal menu a tendina seleziona Valore vuoto.
Ora, sceglie il tipo di formato da applicare e fai un clic su OK. Tutte le celle con valori vuoti verranno evidenziate.
Convertire i numeri memorizzati come testo in numeri
Son sicuro che ti sarà capitato di ritrovarti all’interno del tuo foglio di lavoro, dei numeri che vengono memorizzati come testo.
Questo capita quanto si importano dati da file di testo o da database esterni.
Ti ritrovi pertanto ad avere dei problemi quando vuoi utilizzare queste celle nei calcoli.
Ecco perché voglio suggerirti un piccolo trucco per convertire i numeri memorizzati come testo in numeri.
Ti assicuro che è un metodo infallibile!
Seleziona una cella vuota all’esterno del tuo intervallo di dati. Ora digita il numero 1 e premi la combinazione di tasti CTRL + Invio.
Premi la combinazione di tasti CTRL + C per copiare.
Ora seleziona la cella o l’intervallo che desideri convertire in numeri.
Fai un clic su Incolla e poi su Incolla speciale.
Nella finestra di dialogo Incolla speciale, seleziona l’opzione Moltiplica all’interno del gruppo Operazione.
Fai un clic su OK. A questo punto noterai che converte tutti i numeri in formato testo saranno convertiti in numeri.
Data cleaning Excel: rimuovere i duplicati in Excel
All’interno del tuo file potrebbero essere presenti dei dati duplicati. Se vuoi eliminare le righe duplicate in un foglio allora potrai farlo in due modi.
Il primo è evidenziare le celle contenenti dati duplicati.
Il secondo è eliminare le celle con i duplicati.
Evidenziare i duplicati
Nel primo caso potrai utilizzare la Formattazione condizionale Excel.
Dopo aver selezionato i dati vai sulla scheda Home.
All’interno del gruppo Stili, fai un clic su Formattazione condizionale.
Dal menu seleziona la voce Regole evidenziazione celle e successivamente scegli Valori duplicati.
A questo punto potrai scegliere il tipo di formato da applicare ai valori duplicati. Infine, tutti i valori duplicati verranno evidenziati.
Eliminare i duplicati
La seconda modalità che puoi utilizzare in presenza di valori duplicati è utilizzare il comando Rimuovi duplicati.
Questo comando potrai trovarlo all’interno del gruppo Strumenti dati nella scheda Dati.
Se i tuoi dati contengono le intestazioni, assicurati che la casella di controllo Dati con intestazioni, presente in alto a destra, sia selezionata.
Applica la spunta sulle colonne da cui desideri rimuovere i duplicati e infine fai un clic su OK.
A questo punto i tuoi dati non conterranno valori duplicati.
Suddividere il contenuto di una cella di testo in colonne distinte
Importare i dati da un file di testo spesso comporta che i dati vengano inseriti in una cella.
A questo punto è necessario suddividere il contenuto di una cella di testo in colonne distinte.
Per compiere questa operazione puoi utilizzare il comando Testo in colonne presente nel gruppo Strumenti dati della scheda Dati.
Innanzitutto, seleziona le celle contenenti il testo da suddividere.
Fai un clic sulla scheda Dati e fai un clic sul comando Testo in colonne.
Excel mostrerà una finestra di dialogo con una procedura guidata.
Nel Passaggio 1 di 3, seleziona il tipo di dati: Delimitato o Larghezza fissa.
Qualora i dati fossero separati da caratteri come virgola, punto e virgola, trattino, punto, selezionare la voce Delimitato. Successivamente fai un clic su Avanti.
Nel Passaggio 2 di 3, seleziona il carattere che separa i dati (Delimitatore). Qualora il carattere non fosse presente tra i delimitatori elencati, potrai utilizzare l’opzione Altro.
Infine, nel Passaggio 3 di 3, seleziona il formato dei dati e specifica la cella di destinazione.
Se la cella di destinazione non viene selezionata, la cella contenente i dati verrà sovrascritta.
Convertire il testo in maiuscolo, minuscolo o le iniziali maiuscole
Dopo aver importato i dati da file di testo, capita spesso che alcuni parti del testo non siano corrette ad esempio i nomi ed i cognomi non contengono i caratteri iniziali in maiuscolo. Oppure potresti avere la necessità di scrivere tutto il testo in caratteri maiuscoli. In tutti questi casi puoi utilizzare le seguenti funzioni di testo:
- MAIUSC
- MINUSC
- INIZ
La funzione MAIUSC di Excel (in inglese nota come funzione UPPER) converte una stringa di testo da minuscolo a maiuscolo.
La funzione MINUSC di Excel (in inglese nota come funzione LOWER), converte le lettere contenute in una stringa di testo da maiuscole a minuscole.
La funzione MAIUSC.INIZ di Excel (in inglese nota come funzione PROPER), converte in maiuscolo la prima lettera di ciascuna parola in una stringa di testo e converte le altre in minuscolo.
Data cleaning Excel: evidenziare gli errori in Excel
Il controllo degli errori è fondamentale.
Per individuare gli eventuali errori presenti nel tuo foglio di lavoro puoi utilizzare due modalità.
- Le regole di Formattazione condizionale.
- Il comando Vai a formato speciale.
Evidenziare gli errori con le regole di Formattazione condizionale
Seleziona i dati e vai sulla scheda Home. Fai un clic su Formattazione condizionale e seleziona Nuova regola.
Nella finestra di dialogo Nuova regola di formattazione, seleziona la regola Formatta solo le celle che contengono. Poi seleziona Errori dal menu a discesa.
Imposta il formato desiderato e fai un clic su OK.
A questo punto, qualsiasi errore nell’intervallo di dati sarà evidenziato.
Evidenziare gli errori con il comando Vai a formato speciale
La seconda modalità per evidenziare gli errori in Excel è utilizzare il comando Vai a formato speciale presente nel gruppo Modifica della scheda Home.
Dopo aver selezionato i dati fai un clic sul comando Vai a formato speciale. In alternativa, premi il tasto funzione F5.
In entrambi i casi verrà mostrata la relativa finestra di dialogo.
Seleziona l’opzione Formule e deseleziona tutte le opzioni tranne Errori. Infine, fai un clic su OK.
Questo ti consentirà di selezionare tutte le celle con un errore. Ora potrai applicare un colore di riempimento alle celle, modificare o eliminare il contenuto.
Effettuare il controllo ortografico in Excel
Ultimo, ma non per importanza è il controllo ortografico del testo. Un file senza errori di ortografia è un indicatore sul tuo grado di attenzione e di cura per i dettagli.
Per effettuare il controllo ortografico puoi utilizzare il comando Controllo ortografia presente all’interno del gruppo Strumenti di correzione della scheda Revisione.
In alternativa, utilizza la scorciatoia da tastiera attraverso il tasto funzione F7.
Ora sicuramente sarai in grado di applicare alcune delle principali tecniche di data cleaning Excel.
Qual è la tecnica che preferisci? Ci sono altre tecniche che usi a lavoro?
Se lo desideri, lascia un commento. Buon lavoro!