Business Intelligence - Parte 1
Software GPL / Open Source per gestire la Business Intelligence di una azienda.
Introduzione
Mi è stato chiesto di informarmi su possibili software GPL / Open Source
per gestire la Business Intelligence di una azienda.
Avendo solo sentito parlare di Business Intelligence (BI), e non avendo alcuna
reale competenza in merito, mi sono sentito in dovere di documentarmi prima di
esaminare qualsiasi soluzione.
Questa prima fase di raccolta informazioni, pur rischiando di fornire dati già
conosciuti, è stata qui riportata per completezza.
Ho raccolto informazioni unicamente attraverso internet, partendo dalla classica
ricerca su Wikipedia.org
in lingua inglese, per poi seguire i link e i documenti più interessanti.
Molte fonti saranno omesse per pura brevità.
Business Intelligence: raccolta informazioni
La Business
Intelligence (termine coniato da Howard Dresner, analista del Gartner, nei
primi anni ‘90) è un insieme di modelli, metodi e strumenti rivolti:
A) alla raccolta sistematica del patrimonio di informazioni generate da un’azienda;
B) alla loro aggregazione e analisi;
C) alla loro presentazione in forma semplice.
Questa conoscenza è utilizzabile in processi decisionali e di analisi
da parte dei cosiddetti knowledge workers (termine coniato da Peter Drucker nel
1959: si dice di una persona che lavora principalmente con l’informazione,
o che sviluppa e usa conoscenza nel suo spazio lavorativo).
I dati generati dai vari sistemi (contabilità, produzione, R&D (Research
& Development), CRM (Customer Relationship Management)) vengono archiviati
in sistemi di basi di dati.
Il termine Business Intelligence (a volte abbreviato con BI) può riferirsi
a:
A) Un insieme di processi di business;
B) la tecnologia utilizzata in tali processi;
C) le informazioni ottenute da tali processi.
Un processo di business è una ricetta per ottenere un risultato commerciale.
Ogni processo ha degli input, dei metodi, e degli output. Gli input sono prerequisiti
che devono sussistere per l’applicazione del metodo, a cui poi seguono come
risultati gli output.
Vengono spesso utilizzati i Key
Performance Indicators (KPI), conosciuti anche come Key Success Indicators
(KSI).
Si tratta di metriche, finanziarie e non, usate per riflettere i fattori critici
di successo di una organizzazione. Aiutano a misurare il progresso verso gli obiettivi
organizzativi.
Lo scopo di un software che supporta la Business Intelligence è di aiutare
le persone a prendere decisioni migliori, rendendo disponibili, in maniera accurata
e rilevante, le informazioni giuste quando necessario.
Business Intelligence: strumenti utilizzabili
Sono stati sviluppati strumenti che facilitano il lavoro della BI, specialmente
nei confronti di grandi quantità di dati da raccogliere, normalizzare e
analizzare.
I principali strumenti comprendono:
1) OLAP (On Line Analytical Processing) basati sulla analisi dimensionale
e sul concetto di ipercubo (OLAP è stato coniato da E.F. Codd & Associates
in un paper del 1994);
Dal paper del 1994 di Codd è emersa la necessità di organizzare
i dati in array, per permettere una analisi più veloce. Questi array sono
chiamati “cubi”.
Tale organizzazione permette di evitare le limitazioni di un normale database
relazionale, che di solito non è indicato per l’analisi immediata
di grandi quantità di dati, mentre è più adatto a creare
record da una serie di transazioni (OLTP: On Line Transaction Processing).
Nonostante esistano molti software di report per database relazionali, la loro
lentezza limita la dimensione massima dei dati analizzati.
I cubi OLAP possono essere immaginati come delle estensioni degli array bidimensionali
di un foglio di calcolo.
Per esempio, una compagnia può voler analizzare i dati finanziari per prodotto,
per periodo di tempo, per città, per tipo di guadagno e costo, e comparando
i dati con il budget stabilito.
Questi metodi addizionali di analisi dei dati sono conosciuti come “dimensioni”.
Dato che possono esserci più di tre dimensioni in un sistema OLAP, il termine
“hypercube” (ipercubo) viene talvolta usato.
2) Scorecarding (letterale: segnapunti)
Nel 1992 Robert S. Kaplan e David Norton hanno introdotto la “balanced
scorecard” (BSC), un metodo per misurare le attività di una azienda
in termini di visione e strategie. Fornisce ai manager una visuale completa delle
prestazioni di un business.
Lo “scorecarding” è un sistema di gestione strategica che
forza i manager a focalizzare la loro attenzione sulle metriche di prestazione
che portano al successo. Equilibra la prospettiva finanziaria col cliente, il
processo interno, e le prospettive di apprendimento e di crescita.
Il sistema consiste in quattro processi:
1. Tradurre la visione in obiettivi operativi;
2. Comunicare la visione e collegarla a prestazioni individuali;
3. Pianificare del business;
4.Ottenere feedback, e conseguente apprendimento e aggiustamento della strategia.
5.
3) Dashboarding (letterale: cruscotto)
Presentazione dei dati attraverso interfacce grafiche modellate ad hoc. Ecco
alcuni esempi:
[Esempio 1]
[Esempio 2]
[Esempio 3]
4) Information Visualization (visualizzazione dati)
La visualizzazione
dati è un’area di ricerca complessa. Si basa su teorie di information
design, computer graphic, interazione uomo-macchina, scienze cognitive.
L’applicazione pratica della visualizzazione dati coinvolge la selezione,
la trasformazione e la rappresentazione di dati astratti in una forma che facilita
l’interazione con l’uomo per la sua esplorazione e comprensione. Forme
dinamiche di visualizzazione, come le animazioni didattiche, hanno il potenziale
di migliorare la comprensione di sistemi che cambiano col tempo.
Tecniche particolari permettono all’utente di modificare la visualizzazione
in tempo reale, permettendo una percezione migliore dei campioni e delle relazioni
strutturali tra i dati in oggetto. Infine, non ci si limita solamente ad aspetti
visivi, ma anche uditivi.
5) Data Modeling (modellazione dati)
Nella creazione di sistemi informativi, il Data
Modeling è l’analisi e il design della informazione all’interno
del sistema, incentrata sulle entità logiche e le dipendenze logiche tra
di esse.
E’ una attività astratta in cui i dettagli dei valori delle singole
osservazioni di dati sono ignorati in favore delle strutture, relazioni, nomi
e formati dei dati di interesse, nonostante una lista di valori validi è
solitamente inclusa. Il modello dei dati non deve solo definire la struttura dei
dati, ma anche la semantica (il significato) degli stessi.
Nononstante un termine comune per questa attività sia “analisi
dei dati”, essa è più collegata alla sintesi (mettere insieme)
dei dati stessi, dato che l’attività si sforza di unire le strutture
dati di interesse in un “tutto” coesivo, inseparabile, eliminando
tutte le ridondanze non necessarie e collegando le strutture dati con delle relazioni.
6) Strumenti per definire la Logica del Business
La logica del business si riferisce alla logica che incarna le business rules
(regole del business) anziché la visualizzazione o l’immagazzinamento
dei dati. E’ un termine usato nella programmazione software per intendere
uno strumento che effettua certi tipi di operazioni su dati passati attraverso
di esso.
La business
logic è solitamente associata con una architettura software three-tier
(a tre strati).
7) Strumenti per definire le Regole del Business
Le regole
del business, molto semplicemente, descrivono le operazioni, definizioni e
costrizioni che si applicano in una organizzazione nella realizzazione dei suoi
obiettivi.
8) Data Warehouse (magazzino dati)
Un magazzino dati (data
warehouse) contiene tutte le informazioni passate di una azienda, immagazzinate
in un Database disegnato per favorire efficienti analisi dei dati e reporting
dei dati. Non è inteso per gestire dati correnti.
I magazzini dati solitamente conservano grandi quantità di informazioni
che vengono talvolta suddivise in unità logiche più piccole, chiamate
“Dependent Data Mart”.
Solitamente, due idee di base guidano la creazione di un magazzino dati:
Integrazione dei dati da database distribuiti e strutturati diversamente, il che
facilita una visione globale e una analisi complessiva.
Separazione dei dati utilizzati nelle operazioni giornaliere dai dati (questi
ultimi presenti nel magazzino dati) usati per reporting, supporto decisionale,
analisi e controllo.
Periodicamente si importano dati da sistemi ERP (Enterprise Resource
Planning) e altri sistemi software collegati al business dell’azienda.
9) Document Warehouse (magazzino documenti; la traduzione letterale è
un po’ infelice)
Un Document Warehouse contiene informazioni sui motivi (“why things have
happened”) per cui certe cose sono successe, invece di avere informazioni
su cosa sia successo (“what happened”) come nel caso del data warehouse.
Tali informazioni possono essere combinate insieme per avere uno strumento davvero
utile.
Spesso sono accompagnati da vari software adatti ad analizzare ed utilizzare tali
dati.
10) Data mining (estrazione di dati)
Il Data
Mining (estrazione dei dati), conosciuto anche come KDD (Knowledge Discovery
in Databases) consiste nelle tecniche per ricercare automaticamente dei campioni
in grandi archivi di dati, usando tecniche computazionali derivate dalla statistica
e dal pattern recognition (riconoscimento di modelli).
<<< Altri articoli di: Approfondimenti
Pubblicato il: 04/10/2006
AUTORE TESTO
Simone Brunozzi
http://simpler.wordpress.com/
|