Università degli studi di RomaTre

Approfondimento per corso di Basi di dati (solo le slide)

" QUALITÀ DEI DATI "

a cura dello studente

Gianluca Di Tomassi

 

ANNO ACCADEMICO 1997/98

 

La qualità delle informazioni che circolano in un azienda dipende dalla loro affidabilità ed integrità.

Migliorare la qualità dei dati permette di migliorare tutto il sistema produttivo.

Domande :

 

Quali sono i reparti interni all’azienda che se ne devono preoccupare ?

 

Qualità dei dati vista dal punto di vista legislativo

I dati devono essere :

 

Esistono prodotti che consentono di ottenere un’eccellente qualità dei dati ?

Esistono allo stato attuale dei prodotti software che permettono di controllare, gestire e migliorare la qualità dei dati dei sistemi sia gestionali che di "data warehouse" di tutta l'impresa.

Questi prodotti permettono di identificare e quantificare i difetti di qualità dei dati e di tenere sotto controllo l'andamento degli "indici di qualità" definiti, consentendo quindi di informare gli utenti sull'effettiva affidabilità dei dati che stanno utilizzando per l'analisi. Affrontare il problema della qualità dei dati all'inizio del ciclo di sviluppo del sistema warehouse permette di risparmiare tempo e denaro e di ottenere risultati più affidabili.

 

Cosa comporta una scadente qualitá dei dati ?

Qualità scadente dei dati Þ Bassa soddisfazione del cliente

Þ Costi alti e non necessari

Þ Minore soddisfazione nel lavoro e generazione di diffidenza nell’azienda

Þ Difficile soddisfare strategie a lungo termine

Þ Impedimento alla re-engineering

 

 

SISTEMA DI QUALITÁ

Insieme di strutture organizzative, responsabilità, procedure, procedimenti e risorse, messi in atto nella conduzione aziendale per la qualità dei dati

Si istituisce un sistema qualità per avere un'azienda più solida ed efficace

 

 

É destinato alle aziende produttrici e distributrici di servizi.

 

  1. Pianificazione degli obiettivi aziendali globali in modo da motivare e stimolare l'azienda nel suo insieme;
  2. Gestione organizzativa ed operativa globale di tutte le funzioni aziendali ottimizzate;
  3. Risoluzione definitiva dei problemi aziendali;
  4. Impresa flessibile alle variazioni del mercato (e/o delle tendenze) e capace di produrre qualità (nel senso più ampio del termine) in ogni suo settore (gestione del personale, gestione del processo, gestione del servizio post- vendita, ...);

 

La norma UNI EN ISO 9004 fornisce una guida per la costituzione del sistema qualità ai fini interni e tratta dell'influenza dei diversi fattori tecnici, gestionali, umani che intervengono nella determinazione della qualità finale della produzione

 

  1. Formulazione di uno strumento (metodo) che permetta mediante l'applicazione di adeguate regole il raggiungimento degli obiettivi prefissati;
  2. Il metodo è fornito con la stesura del manuale della qualità, ma il suo cieco utilizzo non può portare certamente alla meta.

 

  1. Definizione degli obiettivi e dei mezzi per raggiungerli: organizzazione aziendale;
  2. Gruppo di lavoro definito con la partecipazione di tutti i settori dell'azienda;
  3. Sviluppo di una cultura della qualità;
  4. Schematizzazione del/i processo/i mediante diagrammi di Ishikawa (causa- effetto);
  5. Descrizione del/i processo/i;
  6. Formulazione dei documenti (glossario, processo, ...);
  7. Controllo di processo (controllo statistico di processo, essenziale per predire possibili variazioni nei prodotti finali in funzione delle caratteristiche della materia prima);
  8. Determinazione procedure generali (personale,acquisti, ...);
  9. Verifica della conformità della manualistica con il processo reale;
  10. Redazione del manuale qualità (certificazione).

 

STRATEGIE PER MIGLIORARE L’ACCURATEZZA DEI DATI

Una buona qualità dei dati prevede di soddisfare i seguenti criteri :

  1. Ci si deve concentrare sul dato più importante;
  2. Si deve essere "guidati dal cliente";
  3. I costi devono essere sostenibili;
  4. Il piano strategico deve definire chiaramente le responsabilità dei vari reparti.

Un programma gestionale per la qualità dei dati deve quindi avere quattro componenti correlati :

  1. Direzione degli affari con obiettivi chiari;
  2. Un infrastruttura per l’amministrazione che assegna le responsabilità per i dati e che assicura ai responsabili gli strumenti necessari per avere successo;
  3. Un piano operativo per il miglioramento, che specifica quali metodi di miglioramento devono essere applicati ad un determinato dato;
  4. Amministrazione del programma.

Definizione: " Un dato o una collezione di dati X ha una qualità migliore di Y se soddisfa meglio i bisogni del cliente."

La qualitá é soggettiva ed é misurata dal cliente.

Cosa vogliono i clienti dai dati ?

Si é soliti raggruppare le misure di qualità in quattro categorie :

  1. IMPORTANZA;
  2. ACCURATEZZA;
  3. PRESENTAZIONE DEI DATI;
  4. INFORMATION TECCHNOLOGY (IT).

 

Ciclo di vita di un dato

Dati importanti possono avere un ciclo di vita molto lungo, per esempio il luogo e la data di nascita durano tutta la vita.

É difficile prevedere se un dato sarà utile in futuro, per questo motivo c’é la tendenza da parte delle aziende a conservare tutti i dati.

Piano operativo che migliori la qualitá Þ conoscenza dettagliata del problema

Come migliorare la qualitá dei dati ?

  1. Ispezione e ristrutturazione;.
  2. Controllo del processo e miglioramento;.
  3. Process Design.

 

METODI PER LA RIVELAZIONE E LA CORREZIONE DI ERRORI

  1. Confrontare il valore dei dati con i rispettivi nel mondo reale. (molto costoso ed efficace solo se fatto su dei campioni);
  2. Database bashing. Si effettua il confronto tra i record di due o più' database, i dati OK si assume che siano corretti mentre i dati che non sono OK sono marcati con un flag per successive investigazioni e correzioni.

Vantaggi del Database Bashing :

  1. Semplice da amministrare
  2. Costi iniziali spesso ragionevoli.

Svantaggi del Database Bashing :

  1. Che il dato che soddisfi il confronto sia corretto non é sempre garantito;
  2. I dati usati per confrontare i record possono essere essi stessi sbagliati rendendo difficile il confronto;
  3. Non previene errori futuri.

 

Miglioramenti

Utilizzo di Data Edits che sono delle routine computerizzate che verificano se i valori dei dati e/o le loro rappresentazioni soddisfano condizioni predeterminate; queste condizioni sono spesso chiamate Business rules, e possono essere semplici o sofisticate :

  1. Basate su un singolo campo. Ad esempio il valore dei dati deve essere un elemento del dominio {0,1,2,3,....,10};
  2. Basate su più di un campo. Ad esempio il codice fiscale e la città dove si é nati non devono entrare in conflitto;
  3. Basate sulla Probabilità. Ad esempio se una persona é di sesso femminile ed é alta due metri allora dovrebbe essere marcata.
Per qualsiasi chiarimento