Software GPL / Open Source per gestire la Business Intelligence di una azienda.
Introduzione
Mi è stato chiesto di informarmi su possibili software GPL / Open Source
per gestire la Business Intelligence di una azienda.
Avendo solo sentito parlare di Business Intelligence (BI), e non avendo alcuna
reale competenza in merito, mi sono sentito in dovere di documentarmi prima di
esaminare qualsiasi soluzione.
Questa prima fase di raccolta informazioni, pur rischiando di fornire dati già
conosciuti, è stata qui riportata per completezza.
Ho raccolto informazioni unicamente attraverso internet, partendo dalla classica
ricerca su Wikipedia.org
in lingua inglese, per poi seguire i link e i documenti più interessanti.
Molte fonti saranno omesse per pura brevità.
Business Intelligence: raccolta informazioni
La Business
Intelligence (termine coniato da Howard Dresner, analista del Gartner, nei
primi anni ‘90) è un insieme di modelli, metodi e strumenti rivolti:
A) alla raccolta sistematica del patrimonio di informazioni generate da un’azienda;
B) alla loro aggregazione e analisi;
C) alla loro presentazione in forma semplice.
Questa conoscenza è utilizzabile in processi decisionali e di analisi da parte dei cosiddetti knowledge workers (termine coniato da Peter Drucker nel 1959: si dice di una persona che lavora principalmente con l’informazione, o che sviluppa e usa conoscenza nel suo spazio lavorativo).
I dati generati dai vari sistemi (contabilità, produzione, R&D (Research & Development), CRM (Customer Relationship Management)) vengono archiviati in sistemi di basi di dati.
Il termine Business Intelligence (a volte abbreviato con BI) può riferirsi
a:
A) Un insieme di processi di business;
B) la tecnologia utilizzata in tali processi;
C) le informazioni ottenute da tali processi.
Un processo di business è una ricetta per ottenere un risultato commerciale. Ogni processo ha degli input, dei metodi, e degli output. Gli input sono prerequisiti che devono sussistere per l’applicazione del metodo, a cui poi seguono come risultati gli output.
Vengono spesso utilizzati i Key
Performance Indicators (KPI), conosciuti anche come Key Success Indicators
(KSI).
Si tratta di metriche, finanziarie e non, usate per riflettere i fattori critici
di successo di una organizzazione. Aiutano a misurare il progresso verso gli obiettivi
organizzativi.
Lo scopo di un software che supporta la Business Intelligence è di aiutare le persone a prendere decisioni migliori, rendendo disponibili, in maniera accurata e rilevante, le informazioni giuste quando necessario.
Business Intelligence: strumenti utilizzabili
Sono stati sviluppati strumenti che facilitano il lavoro della BI, specialmente
nei confronti di grandi quantità di dati da raccogliere, normalizzare e
analizzare.
I principali strumenti comprendono:
1) OLAP (On Line Analytical Processing) basati sulla analisi dimensionale e sul concetto di ipercubo (OLAP è stato coniato da E.F. Codd & Associates in un paper del 1994);
Dal paper del 1994 di Codd è emersa la necessità di organizzare i dati in array, per permettere una analisi più veloce. Questi array sono chiamati “cubi”.
Tale organizzazione permette di evitare le limitazioni di un normale database
relazionale, che di solito non è indicato per l’analisi immediata
di grandi quantità di dati, mentre è più adatto a creare
record da una serie di transazioni (OLTP: On Line Transaction Processing).
Nonostante esistano molti software di report per database relazionali, la loro
lentezza limita la dimensione massima dei dati analizzati.
I cubi OLAP possono essere immaginati come delle estensioni degli array bidimensionali
di un foglio di calcolo.
Per esempio, una compagnia può voler analizzare i dati finanziari per prodotto,
per periodo di tempo, per città, per tipo di guadagno e costo, e comparando
i dati con il budget stabilito.
Questi metodi addizionali di analisi dei dati sono conosciuti come “dimensioni”.
Dato che possono esserci più di tre dimensioni in un sistema OLAP, il termine
“hypercube” (ipercubo) viene talvolta usato.
2) Scorecarding (letterale: segnapunti)
Nel 1992 Robert S. Kaplan e David Norton hanno introdotto la “balanced scorecard” (BSC), un metodo per misurare le attività di una azienda in termini di visione e strategie. Fornisce ai manager una visuale completa delle prestazioni di un business.
Lo “scorecarding” è un sistema di gestione strategica che forza i manager a focalizzare la loro attenzione sulle metriche di prestazione che portano al successo. Equilibra la prospettiva finanziaria col cliente, il processo interno, e le prospettive di apprendimento e di crescita.
Il sistema consiste in quattro processi:
1. Tradurre la visione in obiettivi operativi;
2. Comunicare la visione e collegarla a prestazioni individuali;
3. Pianificare del business;
4.Ottenere feedback, e conseguente apprendimento e aggiustamento della strategia.
5.
3) Dashboarding (letterale: cruscotto)
Presentazione dei dati attraverso interfacce grafiche modellate ad hoc. Ecco alcuni esempi:
[Esempio 1]
[Esempio 2]
[Esempio 3]
4) Information Visualization (visualizzazione dati)
La visualizzazione dati è un’area di ricerca complessa. Si basa su teorie di information design, computer graphic, interazione uomo-macchina, scienze cognitive.
L’applicazione pratica della visualizzazione dati coinvolge la selezione, la trasformazione e la rappresentazione di dati astratti in una forma che facilita l’interazione con l’uomo per la sua esplorazione e comprensione. Forme dinamiche di visualizzazione, come le animazioni didattiche, hanno il potenziale di migliorare la comprensione di sistemi che cambiano col tempo.
Tecniche particolari permettono all’utente di modificare la visualizzazione in tempo reale, permettendo una percezione migliore dei campioni e delle relazioni strutturali tra i dati in oggetto. Infine, non ci si limita solamente ad aspetti visivi, ma anche uditivi.
5) Data Modeling (modellazione dati)
Nella creazione di sistemi informativi, il Data
Modeling è l’analisi e il design della informazione all’interno
del sistema, incentrata sulle entità logiche e le dipendenze logiche tra
di esse.
E’ una attività astratta in cui i dettagli dei valori delle singole
osservazioni di dati sono ignorati in favore delle strutture, relazioni, nomi
e formati dei dati di interesse, nonostante una lista di valori validi è
solitamente inclusa. Il modello dei dati non deve solo definire la struttura dei
dati, ma anche la semantica (il significato) degli stessi.
Nononstante un termine comune per questa attività sia “analisi dei dati”, essa è più collegata alla sintesi (mettere insieme) dei dati stessi, dato che l’attività si sforza di unire le strutture dati di interesse in un “tutto” coesivo, inseparabile, eliminando tutte le ridondanze non necessarie e collegando le strutture dati con delle relazioni.
6) Strumenti per definire la Logica del Business
La logica del business si riferisce alla logica che incarna le business rules
(regole del business) anziché la visualizzazione o l’immagazzinamento
dei dati. E’ un termine usato nella programmazione software per intendere
uno strumento che effettua certi tipi di operazioni su dati passati attraverso
di esso.
La business
logic è solitamente associata con una architettura software three-tier
(a tre strati).
7) Strumenti per definire le Regole del Business
Le regole del business, molto semplicemente, descrivono le operazioni, definizioni e costrizioni che si applicano in una organizzazione nella realizzazione dei suoi obiettivi.
8) Data Warehouse (magazzino dati)
Un magazzino dati (data
warehouse) contiene tutte le informazioni passate di una azienda, immagazzinate
in un Database disegnato per favorire efficienti analisi dei dati e reporting
dei dati. Non è inteso per gestire dati correnti.
I magazzini dati solitamente conservano grandi quantità di informazioni
che vengono talvolta suddivise in unità logiche più piccole, chiamate
“Dependent Data Mart”.
Solitamente, due idee di base guidano la creazione di un magazzino dati:
Integrazione dei dati da database distribuiti e strutturati diversamente, il che
facilita una visione globale e una analisi complessiva.
Separazione dei dati utilizzati nelle operazioni giornaliere dai dati (questi
ultimi presenti nel magazzino dati) usati per reporting, supporto decisionale,
analisi e controllo.
Periodicamente si importano dati da sistemi ERP (Enterprise Resource Planning) e altri sistemi software collegati al business dell’azienda.
9) Document Warehouse (magazzino documenti; la traduzione letterale è
un po’ infelice)
Un Document Warehouse contiene informazioni sui motivi (“why things have
happened”) per cui certe cose sono successe, invece di avere informazioni
su cosa sia successo (“what happened”) come nel caso del data warehouse.
Tali informazioni possono essere combinate insieme per avere uno strumento davvero
utile.
Spesso sono accompagnati da vari software adatti ad analizzare ed utilizzare tali
dati.
10) Data mining (estrazione di dati)
Il Data Mining (estrazione dei dati), conosciuto anche come KDD (Knowledge Discovery in Databases) consiste nelle tecniche per ricercare automaticamente dei campioni in grandi archivi di dati, usando tecniche computazionali derivate dalla statistica e dal pattern recognition (riconoscimento di modelli).