Please disable Adblockers and enable JavaScript for domain CEWebS.cs.univie.ac.at! We have NO ADS, but they may interfere with some of our course material.

Aufgaben

Aufgaben sind im Team zu erledigen. Parallel zu den Aufgaben dokumentieren Sie bitte alles genau im Tagebuch.

Teilaufgabe 1

Arbeiten mit den HEP-Daten (Teams 1 und 2)

Extrahieren der Daten
- Ueberlegungen zum konzeptionellen Datenmodell
Import in Pentaho
- «http://community.pentaho.com/», Community Version, Download
Formulieren von Fragestellungen (Data Mining und Process Mining)
Vorüberlegungen zur Extraktion von Prozessen (Process Mining)

Aufbau eines Text Corpus zum Text Mining (Team 3)
- Zwei Datenquellen: Twitter und DieZeit oder andere OnlineZeitungen die Gratisdownload erlauben
  - R-package twitterR provides an interface to the Twitter web API
- Ziel ist Opinion Mining zu einem selbst gewählten Thema
- Extrahieren Sie jeweils einen wohldefinierten Datensatz aus den beiden Quellen und erstellen Sie eine integrierte und bereinigte Datenbasis (Text Corpus).
- Formulieren Sie Fragestellungen für das Text Mining.

Teilaufgabe 2

Data Mining: Team 2, Tools R
Process Mining: Team 1, Tools ProM
Text Mining: Team 3, Tovek

Tools:

«ProM Process Mining Software»
- Machen Sie sich auch mit den in ProM verwendeten Formaten MXML, XES sowie den angebotenenen Importfunktionalitäten und Tools vertraut.
«R Software»
Tovek is installed in the student lab (6th floor, Währingerstraße 29), Manual available there. Please inform Mr. Hellerschmid or W. Grossmann in advance

Letzte Änderung: 13.03.2013, 13:50 | 193 Worte

Business Intelligence II (PR)

Aufgaben

Teilaufgabe 1

Teilaufgabe 2

Tools: