Please disable Adblockers and enable JavaScript for domain CEWebS.cs.univie.ac.at! We have NO ADS, but they may interfere with some of our course material.
VU Business Intelligence I (050136)
Erster Termin: 08.10.2014, Letzter Termin: 21.01.2015.
MI wtl. von 08.10.2014 bis 21.01.2015 08:00 - 11:00
Ort: HS2, Währinger Straße 29 1.OG
Inhalte
Die zentrale Fragstellung von Business Intelligence ist die Gewinnung von Information aus Geschäftsprozessdaten, die eine bessere operative Umsetzung von strategischen Unternehmensziele erlaubt, und damit Management in seinen Entscheidungen unterstützt. Dabei müssen Daten unterschiedlichster Herkunft (von internen strukturierten Informationssystemen über Daten der Geschäftsprozessorganisation bis hin zu semistrukturierten Daten aus dem Internet) und unterschiedlichster Struktur (von quantitativer Information bis zu textuellen Daten) zielgerichtet zusammengeführt und in Analysen verwendet werden. Die Nutzung dieser Informationsquellen setzt Kenntnisse über fortgeschrittene Methoden des Data Management, über Business Process Management und über analytische Methoden des Data Mining voraus.
Die Lehrveranstaltung Business Intelligence I gibt eine Einführung in grundlegende Methoden und Modellierungstechniken.
In den Abschnitten: Analysemethoden für Querschnittsdaten werden klassischen Algorithmen des Data Mining vorgestellt und die Lösung von Fragestellung mit R behandelt.
In den Abschnitten: Analysemethoden für Prozessdaten werden Algorithmen des Process Mining vorgestellt und die Lösung von Fragestellung mit ProM behandelt.
Themen für die Präsentationen: OLAP-Tools, Visualisierung, Textmining, Talend (Data Quality Management)
Im zweiten Teil des Moduls im Sommersemester 2015 wird ein umfangreicheres BI-Projekt durchgeführt.
Termine
8.10.2014: Vorbesprechung
15.10.2014: Einführung in Business Intelligence
22.10.2014: Modellierungstechniken der Business Intelligence 1
29.10.2014: Präsentation Übung 1
05.11.2014: Modellierungstechniken der Business Intelligence 2
12.11.2014: Datenmodellierung 1
19.11.2014: Datenmodellierung 2
26.11.2014: Analysemethoden für Querschnittsdaten (Data Mining 1), Besprechung Übung 2
03.12.2014: Analysemethoden für Querschnittsdaten (Data Mining 2)
10.12.2014: Analysemethoden für Querschnittsdaten (Data Mining 3)
17.12.2014: Analysemethoden für Prozessdaten (Process Mining 1), ACHTUNG: gemeinsamer Teil endet um 9.30; von 9.30 - 11.00 Arbeitszeit für Übungblatt 3
07.01.2015: Analysemethoden für Prozessdaten (Process Mining 2)
14.01.2015: Conformance Checking, Besprechung Übung 3
22.01.2015: 8.00 - 9.30: schriftliche Prüfung in HS1
28.01.2015: Besprechung von Übung 4
Handouts Vorlesung
-
- !!Achtung: Abbildung zu Heuristic Miner, Folie 42, wurde ersetzt.
Daten und Beispiele
=== Unterlagen zur Lehrveranstaltung
==== Handouts Vorlesung
* [file:BusinessIntelligence__1_Einleitung.pdf|1. Einführung in Business Intelligence]
* [file:BI_models (neu).pdf|2. Modellierungstechniken 1]
* [file:BI_models2.pptx|3. Modellierungstechniken 2]
* [file:BusinessIntelligence_Data_WS12113_I_print.pdf|4. Data (komplett)]
* [file:BI_Analysen1.pdf|5. Analysetechniken - Klassifikation 1 ]
* [file:BI_Analysen2.pdf|5. Analysetechniken - Klassifikation 2 ]
* [file:BI_Analysen_cluster.pdf|6. Analysetechniken - Clustering]
* [file:BI-Analysen_Apriori.pdf|7. Analysetechniken - Assoziationsanalyse]
* [file:BusinessIntelligence_ProcessDiscovery_WS1213.pdf|8. Process Discovery]
* [file:BusinessIntelligence_WS1213_FurtherMining.pdf|9. Further Process Mining Techniques]
==== R-Beispiele für Analysetechniken
* [file:NaiveBayes1.R|Naive Bayes mit R]
* [file:irisSVM.r|Support Vector Machines mit R]
* [file:logistic1.R|Logistische Regression mit R]
* [file:ClassificationTrees.R|Classification Trees mit R]
* [file:Boosting.R|Boosting mit R]
* [file:Clustering.R|Clusteranalyse mit R]
* [file:Apriori.R|Assoziationsanalyse mit R]
* [http://kdd.ics.uci.edu/ |Daten:UCI Machine Learnin Repository]
* [file:TibetSkull.txt|Daten zu logistischen Regression]
* [file:Citydat-1.txt|Daten zu Clusteranalyse]
==== Ergänzende Materialien
* [file:BPMN2_0_Poster_DE.pdf|BPMN2_0_Poster]
* [file:Worksheet_HigherEducation.pdf|Worksheet_HigherEducation]
* [file:Woksheet_Health.pdf|Worksheet_Health]
* [file:08 Data Quality for Analytics Intro - UniWien 20121031.pdf|Vortrag Dr. Svolba, Data Quality]
* [file:Trends HPA und DQFA - Uni Wien 20121031.pdf|Vortrag Dr. Svolba, Trends High Performance Analytics]
=== Literatur
The Top Ten Algorithms in Data Mining
Editor(s): Xindong Wu, University of Vermont, Burlington, USA; Vipin Kumar, University of Minnesota, Minneapolis, USA
Series: Chapman & Hall/CRC Data Mining and Knowledge Discovery Series
[Alst11] Wil M. P. van der Aalst: Process Mining - Discovery, Conformance and Enhancement of Business Processes. Springer 2011: I-XVI, 1-352
"Spielregeln" Übungen
- Bearbeitung in Teams von bis zu 3 Personen (Festlegung der Teams im CEWebS)
- Abgabe über die CeWebs Homepage
- Präsentation in der Veranstaltung
Übungen:
- Übung 1: Recherche und Bewertung existierenden Open Source Tools für Business Intelligence Uebung1
- Übung 2: Data Integration and Transformation Uebung2
- Datenquelle 1 SQL Skript
- Datenquelle 2 Excel File
- Übung 3: Beispiele zum Supervised Learning
- Übung 4: Process Mining
- Achtung Übung 4 wurde am 2015-1-14, 15:09 aktualisiert (traces in Aufgabe 3)
- Grund: Eine Klasse von traces enthält einen Aktivität, die nicht im Modell abgebildet ist (Aufgabe 4-3). Gemäß [Aalst11, S. 200f] wird dieser Fall behandelt, indem man dies Aktivität aus den traces "ausblendet" und die Conformance der in dieser Weise "projizierten" traces bestimmt. Da dies nicht explizit besprochen wurde, wurde der Fall entfernt.
- Weitere Anmerkung conformance checking: Man muss in einem letzten Schritt das token auf der "Endstelle" ebenfalls vom "environment" (siehe [Aalst11]) konsumieren lassen. Eigentlich sollten sich insgesamt 7 konsumierte tokens im Bsp der Folien ergeben. In den Folien ist dieser Schritt nicht auf einer expliziten Folie abgebildet.
- Anmerkung alpha-Algorithmus, Ableitung Petrinetz: Sie können (müssen aber nicht) mit silent transitions zu Strukturierungszwecken arbeiten.
- Conformance checking: Folie 34: conformance für das Log in der Mitte beträgt ca 0.99 (statt 0.955)
* Datenmodellierung und -integration
** Thema 1: Recherchearbeit
** Thema 2:Pentaho
** Thema 3:Talend
* Data Mining
** Thema 4: Recherchearbeit
** Thema 5: R
** Thema 6: Weka
** Thema 7: RapidMiner
* Process Analysis:
** Thema X: Recherchearbeit
** Thema: ProM
**
* Visualization, Visual Mining
** Thema: Recherchearbeit
** Thema: ggplot2
** Thema: Tableau
** Thema: Google Charts,Gapminder
* Text Mining
** Thema: Recherchearbeit
=== Zeitplan Abschlussgespräche am 30.01.2013 (in PC 2):
10:45 - 11.15: Team 1
11.15 - 11.45: Team 2
11.45 - 12.15: Team 3
12.15 - 12.45: Team 4
Benotung
Die Leisungsbewertung dieser LV setzt sich aus 3 Teilen zusammen: Bearbeitung der Übungsaufgaben (45%), schriftliche Prüfung (45%) und Mitarbeit (10%).
Letzte Änderung: 20.01.2015, 08:48 | 976 Worte