Uwe Haneke, Stephan Trahasch, Tobias Hagen et al.
Open Source Business Intelligence (OSBI)
Möglichkeiten, Chancen und Risiken quelloffener BI-Lösungen
OPEN SOURCE BUSINESS INTELLIGENCE
2
Impressum
5
Inhalt
6
Vorwort
10
1 Einführung
12
1.1 Warum Open Source Business Intelligence?
13
1.1.1 Business Intelligence
13
1.1.2 Open Source Business Intelligence
14
1.1.3 Zum Aufbau des Buches
16
1.1.4 Ziele und Zielgruppen des Buches
17
1.2 Business Intelligence: Überblick und aktuelle Trends
19
1.2.1 Der technische BI-Begriff als Sammelbezeichnung für multidimensional speichernde Informationssysteme und deren Werkzeuge
19
1.2.2 Werkzeuge der Datensammlung und -verteilung
21
1.2.3 Werkzeuge der Informationsaufbereitung und -bereitstellung
24
1.2.4 Werkzeuge der Analyse und Präsentation der Informationen
31
1.2.5 Metadatenmanagement
38
1.2.6 Die Referenzarchitektur als Zusammenfassung technischer BI-Elemente
38
1.2.7 Die betriebswirtschaftliche BI-Anwendung als kontinuierlicher Anreiz zur technischen Innovation
40
1.2.8 BI-Architekturen und ihre technische Evolution
41
1.2.9 BI-Industrialisierung durch allgemeinen IT-Fortschritt
44
1.3 Open Source
46
1.3.1 Historische Wurzeln
46
1.3.2 Lizenzmodelle und ihre Grenzen
48
1.3.3 Open Content
51
1.3.4 Open-Source-Software als Innovationsmotor
52
1.3.5 Sicherheit von Open-Source-Software
53
1.3.6 Wirtschaftliche Bedeutung von Open Source
54
1.3.7 Quellen für Open-Source-Software
56
1.3.8 Open Source im kommerziellen Einsatz
58
2 Architekturen und Kosten
60
2.1 BI-Strategie
61
2.1.1 Aspekte der BI-Strategie
61
2.1.2 Open Source als Teil der IT- bzw. BI-Strategie
66
2.2 BI-Architektur: Anforderungen und Ausprägungen
68
2.2.1 „BI Light“: Berichte und Analysen ohne Data Warehouse
70
2.2.2 Data Warehouse und Enterprise Data Warehouse
72
2.2.3 Sonderfall Planungs- und Budgetierungsprozesse
77
2.2.4 BI und Enterprise Content Management
78
2.2.5 Serviceorientierte Architekturen (SOA) und BI
81
2.2.6 Cloud Computing und OSBI
83
2.2.7 Architektur als Erfolgsfaktor
83
2.3 Vorgehensmodelle
84
2.3.1 Projektphasen
84
2.3.2 Top-down- vs. Bottom-up-Vorgehen
88
2.3.3 Vorgehensmodelle des Software Engineering
89
2.3.4 Spezielle BI-Vorgehensmodelle
95
2.3.5 Aktueller Trend: Agile BI
96
2.3.6 Auswahl eines Vorgehensmodells
99
2.4 TCO – Kosten für Skalierbarkeit und Performance bei OSBI
100
2.4.1 TCO-Berechnung in BI-Projekten und ihre Grenzen
101
2.4.2 Kostenvergleichskalkulation OSBI-Stack vs. Closed-Source-Stack
105
2.4.3 Checkliste: Wann lohnt sich der Umstieg?
110
2.4.4 Zusammenfassende Empfehlungen
112
3 OSBI-Lösungen in der Praxis
114
3.1 Open-Source-BI-Tools
115
3.1.1 ETL – Extract, Transform, Load
116
3.1.2 Relationale Open-Source-Datenbanksysteme
118
3.1.3 Reporting
121
3.1.4 On-Line Analytical Processing (OLAP)
123
3.1.5 Data Mining
125
3.1.6 All in One – BI-Suiten
127
3.1.7 OSBI-Angebote heute
129
3.2 Talend Open Studio
130
3.2.1 Über Talend Open Studio
130
3.2.2 Installation und erster Start
130
3.2.3 Der Anwendungsfall: Kaffeehaus Expresso
131
3.2.4 Der Arbeitsbereich
132
3.2.5 Der erste ETL-Job
134
3.2.6 Typische Fehlerquellen und Fehlerbehandlung
139
3.2.7 Kontexte für unterschiedliche Zielsysteme
140
3.2.8 Export
140
3.2.9 Dokumentation
141
3.2.10 Modellierung von Business-Prozessen
141
3.2.11 Talend on Demand
142
3.2.12 Community und Hilfe im Internet
142
3.2.13 Ausblick auf die kommerziellen Versionen und Services
143
3.3 OSBI-Suiten im Vergleich – eine strukturelle Analyse
148
3.3.1 Installation
148
3.3.2 Architektur der OSBI-Suiten
155
3.3.3 Informationsangebote
156
3.3.4 Kostenpflichtiger Support
157
3.3.5 Feature-Vergleich
159
3.3.6 Zusammenfassender Vergleich
160
3.4 Jaspersoft
161
3.4.1 Schnittstellen und Aufteilung der Komponenten
161
3.4.2 Beschreibung der Komponenten
162
3.4.3 Datenaustausch zwischen Komponenten
164
3.4.4 ETL-Prozess
166
3.4.5 OLAP-Analyse und Reporting
167
3.4.6 Multi-User und Benutzergruppen
174
3.4.7 Entwicklerkomponenten, Open Source, Erweiterbarkeit
175
3.4.8 Service, Support, Dokumentation
176
3.4.9 Zusammenfassende Beurteilung
176
3.5 Pentaho
178
3.5.1 Das Unternehmen und seine Produkte
178
3.5.2 Komponenten der Pentaho Community Edition
180
3.5.3 Voraussetzungen und Installation
181
3.5.4 BI Platform
182
3.5.5 ETL mit Pentaho Data Integration
183
3.5.6 Metadaten
185
3.5.7 Analyse
186
3.5.8 Berichtswesen
190
3.5.9 Bewertung
193
3.6 Palo Suite
195
3.6.1 Komponenten: Beschreibung und Aufteilung
195
3.6.2 Datenmodellierung
199
3.6.3 Dateneingabe/-import
208
3.6.4 OLAP-Analyse und Reporting
211
3.6.5 Administration
212
3.6.6 Service, Support, Dokumentation
212
3.6.7 Zusammenfassende Beurteilung
212
3.7 Data Mining mit dem RapidMiner
215
3.7.1 Was ist Data Mining?
215
3.7.2 Ziele
215
3.7.3 Typische Anwendungsgebiete
216
3.7.4 Wichtige Typen von Data-Mining-Aufgabenstellungen
217
3.7.5 Data-Mining-Verfahren
219
3.7.6 Fallstricke im Data Mining
219
3.7.7 Betrieblicher Einstieg ins Data Mining
221
3.7.8 Data Mining mit Werkzeugen von Rapid-I
222
3.7.9 Zusammenfassende Empfehlungen
232
3.8 Anwendungsszenarien
233
3.8.1 Szenario 1: OLAP-Analyse bestehender Tabelle
234
3.8.2 Szenario 2: Unternehmensplanung mit Palo
238
3.8.3 Szenario 3: Auslesen von Daten aus SAP-Systemen
240
3.8.4 Szenario 4: Ablösung einer programmierten Reporting-Lösung
242
3.8.5 Szenario 5: Datenqualität
244
3.8.6 Zusammenfassung
247
4 Der Markt und seine Trends
248
4.1 Marktphänomen Open-Source-BI – ernstzunehmende Alternative zu traditionellen Angeboten?
249
4.1.1 Hauptakteure des OSBI-Marktes
249
4.1.2 Abdeckung von BI-Aufgaben durch OSBI-Produkte
253
4.1.3 Vor- und Nachteile des Einsatzes von OSBI-Produkten
257
4.1.4 Die aktuelle Marktsituation für OSBI
259
4.2 Geschäftsmodelle von Open-Source-BI-Anbietern
260
4.2.1 Struktur von Geschäftsmodellen
260
4.2.2 Open-Source-Geschäftsmodelle
261
4.2.3 Geschäftsmodelle der Anbieter von Open-Source-BI-Software
264
4.2.4 Entwicklungen und Trends
270
4.3 Einsatzszenarien für OSBI
272
4.3.1 Community versus Enterprise oder Professional: Open Source oder Commercial Open Source?
273
4.3.2 Das Dilemma der Anbieter: Ohne Lizenzen keine Kontrolle?
274
4.3.3 Das Problem und das Potenzial der Download-Zahlen
275
4.3.4 KMU als Zielgruppe für OSBI
276
4.3.5 Mögliche Szenarien für den Einsatz von OSBI
280
4.3.6 Resümee
284
4.4 OSBI trifft Forschung: GPUs als parallele Coprozessoren für OLAP-Aggregationen
286
4.4.1 Multidimensionale Aggregation
286
4.4.2 GPGPU
289
4.4.3 GPU-Computing im Palo OLAP Server
291
4.4.4 Innovation und OSBI
296
Die Autoren
297
Danksagung
299
Abkürzungsverzeichnis
300
Literaturverzeichnis
301
Register
316
An den Anfang
2
© 2009-2024 ciando GmbH