g1t1

Materialien

Präsentation vom 30.03.2011 - Ergebnisse Extraktion, Konzeptuelles Datenmodell 
Präsentation vom 13.04.2011 - Datenintegration in Pentaho 
Präsentation vom 11.05.2011 - Fehleranalyse, Fragestellungen, Toolevaluierung, Process Mining, Data Mining 
Präsentation vom 22.06.2011 - Endpräsentation  
«Youtube Video Social Mining » 
 
DatabaseUtils.props Properties-datei von weka um Variablentypen von SQL zu mappen  
Erklärung: Datei im JAR-Archiv weka.jar unter /weka/experiment ersetzen. Nun beherrst weka das Mapping von int, bigint, decimal, timestamp, …  

Arbeitsaufwand Gruppe

Datum: 19.03.2011  
Uhrzeit: 11:00 Uhr  
Aufwand: je 3 Stunden  
Teilnehmer: komplettes Team 
Aufgabenstellung: Festlegung der CSV-Strukturen  
Ergebnis: Alle benötigten CSV-Dateien inkl. Spalten wurden definiert  
 
Datum: 22.03.2011  
Uhrzeit: 16:00 Uhr  
Aufwand: je 3 Stunden  
Teilnehmer: komplettes Team 
Aufgabenstellung: Designen des Datenbankmodells  
Ergebnis: Definiertes Datenbankmodell auf Papier fertig designed 
 
Datum: 06.04.2011  
Uhrzeit: 9:00 Uhr  
Aufwand: je 3 Stunden  
Teilnehmer: Armin, Johannes, e-Tutor und Prof Grossmann 
Aufgabenstellung: Evaluieren des geeigneten Integrationsansatzes 
Ergebnis: Entscheidung für Dimension-Tables wie in Pentaho Tutorial demonstriert 
 
Datum: 09.04.2011  
Uhrzeit: 10:00 Uhr  
Aufwand: je 5 Stunden  
Teilnehmer: komplettes Team 
Aufgabenstellung: Erste Transformationen mit Pentaho erstellen und einarbeiten 
Ergebnis: Erste CSV-Transformationen abgeschlossen. Grundlage für weiter individuelle Arbeit geschaffen. 
 
Datum: 12.04.2011  
Uhrzeit: 15:00 Uhr  
Aufwand: je 5 Stunden  
Teilnehmer: komplettes Team 
Aufgabenstellung: Zusammenführen der individuellen Transformationen. Erstellen der Präsentation 
Ergebnis: Komplette Integratin abgeschlossen, Präsentation wurde erstellt. 
 
Datum: 04.05.2011 
Uhrzeit: 9:00 Uhr 
Aufwand: je 4 Stunden 
Teilnehmer: komplettes Team 
Aufgabenstellung: Vertrautmachen mit XEsame, Nitro, weka und deren Kompatibilität zu Pentaho. 
Ergebnis: XEsame macht Probleme die Datenbankverbindung aufzubauen. Nitro hat in der Triallizenz Beschränkungen. Hier werden wir eine Studentenlizenz anfordern um damit arbeiten zu können. Brainstorming über mögliche Fragestellungen für Process- und Datamining 
 
Datum: 10.05.2011 
Uhrzeit: 9:00 Uhr 
Aufwand: je 4 Stunden 
Teilnehmer: Armin, Johannes 
Aufgabenstellung: Besprechung der gefundenen Fehler im Datenmodell; Erstellen eines Fehlerdokuments und weiterer Überprüfungen; Erstellen der Präsentation 
Ergebnis: einzelne Fehler wurden nochmals reproduziert; Klassifizierungsbeispiel in Weka erstellt.  
 
Datum: 10.05.2011 
Uhrzeit: 15:00 Uhr 
Aufwand: je 5 Stunden 
Teilnehmer: Armin, Johannes 
Aufgabenstellung: Erheben von Fragestellungen; Erstellen der Präsentation für Aufgabe 2;  
Ergebnis: Klassifizierung von Fehlern in den Daten; Process- und Datamining Beispiel erstellt; Präsentation erstellt. 
 
Datum: 25.05.2011 
Uhrzeit: 9:00 
Aufwand: je 5 Stunden 
Teilnehmer: Armin, Johannes, Michael 
Aufgabenstellung: Klassifizierungsvariablen bestimmen, Process Mining, Vorbereitung der Dabenbank fürs Data Mining. 
Ergebnis: Vorbereitungen für Data und Process Mining für weitere Aufgaben abgeschlossen. 
 
Datum: 31.05.2011 
Uhrzeit: 13:00 
Aufwand: je 4 Stunden 
Teilnehmer: Armin, Johannes 
Tasks: Ergebnisse für Präsentation aufbereiten, weiter ProcessMining Cases aufbereiten 
 
Datum: 08.06.2011 
Uhrzeit: 09:00 
Aufwand: je 5 Stunden 
Teilnehmer: Johannes, Michael 
Tasks: Besprechen von Process Mining und Interpretation der Ergebnisse, Aufbereiten des Outputs 
 
Datum: 15.06.2011 
Uhrzeit: 10:00 
Aufwand: je 4 Stunden 
Teilnehmer: Armin, Johannes, Michael 
Tasks: Besprechen von Social Mining und Interpretation der Ergebnisse, Besprechen von Data Mining 
 
Datum: 18.06.2011 
Uhrzeit: 10:00 
Aufwand: je 6 Stunden 
Teilnehmer: Armin, Johannes, Michael 
Tasks: Besprechen der Ergebnisse, Besprechen des Endpräsentationsaufbaus 
 
Datum: 21.06.2011 
Uhrzeit: 09:00 
Aufwand: je 4 Stunden 
Teilnehmer: Armin, Johannes 
Tasks: Erstellen der Präsentationsfolien. 
 
Datum: 21.06.2011 
Uhrzeit: 18:00 
Aufwand: je 1 Stunde 
Teilnehmer: Armin, Johannes, Michael 
Tasks: Besprechung der Abschlusspräsentation. 
 

Armin

Datum: 23.03.2011 
Uhrzeit: 20:00 Uhr 
Auwand: 1 Stunde 
Teilnehmer: Armin 
Aufgabenstellung: Datenmodell in Toad Desigener abbilden 
Ergebnis: Entitäten wurden abgebildet, ein paar logische Fehler mit den Foreign-keys gilt es noch zu lösen 
 
Datum: 25.03.2011 
Uhrzeit: 20:00 Uhr 
Aufwand: 3 Stunden 
Teilnehmer: Armin 
Aufgabenstellung: Installation von Pentaho in einer VM 
Ergebnis: Pentaho wurde installiert und auf Datenintegration begutachtet. 
 
Datum: 29.03.2011 
Uhrzeit: 17:00 Uhr 
Auwand: 2 Stunden 
Teilnehmer: Armin 
Aufgabenstellung: Fertigstellen des konzeptuellen Datenmodells, Daten der Sollabgabe in CSV-Files parsen 
Ergebnis: Modell in Visio erstellt; Sollabgaben CSV erstellt 
 
Datum: 03.04.2011 
Uhrzeit: 10:00 Uhr 
Auwand: 8 Stunden 
Teilnehmer: Armin 
Aufgabenstellung: restlichen XML Dateien parsen und auf Parsingfehler kontrollieren 
Ergebnis: Bis auf zwei Bereiche wurde alle CSV-Dateien erstellt, Wechsel der Programmiersprache von Java auf Perl 
 
Datum: 05.04.2011 
Uhrzeit: 19:00 Uhr 
Auwand: 4 Stunden 
Teilnehmer: Armin 
Aufgabenstellung: restlichen XML Dateien parsen und auf Parsingfehler kontrollieren 
Ergebnis: Alle CSV-Dateien wurden erstellt. 
 
Datum: 09.04.2011 
Uhrzeit: 12:00 Uhr 
Auwand: 5 Stunden 
Teilnehmer: Armin 
Aufgabenstellung: Transformationen in Pentaho Spoon erstellen und überprüfen 
Ergebnis: Alle Transformationen wurden erstellt, jedoch noch nicht in die Datenbank eingespielt. Dies wird in der Gruppe geschehen, da sonst Namenskonflikte auftauchen können. 
 
Datum: 12.04.2011 
Uhrzeit: 10:00 Uhr 
Auwand: 2 Stunden 
Teilnehmer: Armin 
Aufgabenstellung: Ausbessern von Fehlern in den Transformationen 
Ergebnis: Transformationen wurden an die Namenskonventionen der Gruppe angepasst. 
 
Datum: 04.05.2011 
Uhrzeit: 20:00 
Aufwand: 4h 
Teilnehmer: Armin 
Aufgabenstellung: Anbindung der in Pentaho erstellten Datenbank an Weka. 
Ergebnis: Per ODBC/JDBC Bridge konnte die DB an weka angebunden werden. Queries konnten abgesetzt werden und es kamen Rückgabewerte an. Diese konnten aufgrund von Fehlermeldungen jedoch nicht weiter verwendet werden. 
 
Datum: 06.05.2011 
Uhrzeit: 19:00 
Aufwand: 2h 
Teilnehmer: Armin 
Aufgabenstellung: Fehler- und Literatursuche für weka und MySQL Datenbanken. 
Ergebnis: Ahnung woran der Fehler liegt. Wird für die Gruppe aufbereitet und bearbeitet. 
 
Datum: 30.05.2011 
Uhrzeit: 19:00 
Aufwand: 4h  
Teilnehmer: Armin 
Aufgabenstellung: Zusammenführen von Logs aus der Sicht einer Person 
Ergebnis: Unvollständige Datumsdaten mussten korrigiert werden. Merge der einzelnen Logs ist schwieriger als angenommen. Werte zur statistischen Auswertung gesammelt. 
 
Datum: 05.06.2011 
Uhrzeit: 18:00 
Aufwand: 3 h 
Teilnehmer: Armin 
Aufgabenstellung: Einführung ins Social Mining 
Ergebnis: verschiedene Logs erstellt und mit unterschiedlichen SocialMiner versucht. 
 
Datum: 12.06.2011 
Uhrzeit: 15:00 
Aufwand: 5 h 
Teilnehmer: Armin 
Aufgabenstellung: Screencasting des Social Miners 
Ergebnis: Video wurde erstellt; Vorbereitung der Daten für Endpräsentation 
 
Datum: 20.06.2011 
Uhrzeit: 19:00 
Aufwand: 2 h  
Teilnehmer: Armin 
Aufgabenstellung: weitere Dateninterpretation aus dem Social Mining 
Ergebnis: Aktiviätetn der Lektoren und Tutoren wurden abgehandelt 

Johannes

Datum: 20.03.2011  
Uhrzeit: 10:00 Uhr  
Aufwand: 7 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Daten vom Forum in CSV-Files parsen, die unseren festgelegten Strukturen vom 19.03.2011 entsprechen 
Ergebnis: Zwei CSV-Files (Ist-Forum; Forum aus Personensicht) 
 
Datum: 27.03.2011  
Uhrzeit: 12:00 Uhr  
Aufwand: 4 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Daten der Registrierung in CSV-Files parsen, die unseren festgelegten Strukturen vom 19.03.2011 entsprechen 
Ergebnis: Zwei CSV-Files (Studenten-Register; Soll-Registration) 
 
Datum: 29.03.2011  
Uhrzeit: 21:00 Uhr  
Aufwand: 1 Stunde  
Teilnehmer: Johannes 
Aufgabenstellung: Präsentationsfolien für den 30.03.2011 erstellen 
Ergebnis: Präsentationsfolien 
 
Datum: 01.04.2011  
Uhrzeit: 15:00 Uhr  
Aufwand: 3 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Die verschiedenen Pentaho-Pakete nach diversen Anleitungen aus dem Internet in einer virtuellen Maschine installieren, erste Erkenntnisse über Funktionsweise sammeln. 
Ergebnis: Pentaho-Programme sind installiert und voll einsatzfähig. Erstes Verständnis der Funktionsweise ist vorhanden. 
 
Datum: 04.04.2011  
Uhrzeit: 09:00 Uhr  
Aufwand: 3 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Fundierte Einarbeitung in den Pentaho Data Integrator (Literaturrecherche, Ansehen der Videotutorials) 
Ergebnis: Tiefer gehendes Verständnis der Funktionsweise und der Möglichkeiten von Pentaho Data Integrator ist vorhanden. 
 
Datum: 09.04.2011  
Uhrzeit: 20:00 Uhr  
Aufwand: 1 Stunde  
Teilnehmer: Johannes 
Aufgabenstellung: Einige Änderungen an meinen CSV-Files vornehmen, die im Gruppentreffen vereinbart wurden. 
Ergebnis: Geringfügige Änderungen an meinen CSV-Files sind umgesetzt. 
 
Datum: 10.04.2011  
Uhrzeit: 12:00 Uhr  
Aufwand: 5 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Transformationen in Pentaho Spoon erstellen und überprüfen. 
Ergebnis: Alle Transformationen wurden erstellt, jedoch noch nicht in die Datenbank eingespielt. Dies wird in der Gruppe geschehen, da sonst Namenskonflikte auftauchen können. 
 
Datum: 08.05.2011  
Uhrzeit: 15:00 Uhr  
Aufwand: 3 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Potentielle Fehler im Datensatz überlegen und auf Vorkommen überprüfen. 
Ergebnis: Potentielle Fehler hinsichtlich der Aspekte Inhalt, Mapping und eigenartige Wertausprägungen überlegt. Auf tatsächliches Vorkommen im Datensatz/DB überprüft. Die gefundenen Fehler dokumentiert. 
 
Datum: 27.05.2011  
Uhrzeit: 08:00 Uhr  
Aufwand: 7 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Einarbeitung in Theorie bezüglich der relevanten Data Mining-Operationen. Evaluierung geeigneter Berechnungen und Methoden. 
Ergebnis: Genaue Vorstellung, welche Berechnungen im Rahmen der von uns erhobenen Daten möglich sinnvoll sind. 
 
Datum: 29.05.2011  
Uhrzeit: 10:00 Uhr  
Aufwand: 7 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Durchführung von Data Mining Operationen. 
Ergebnis: Erste Klassifikationen durchgeführt und dokumentiert. 
 
Datum: 06.06.2011  
Uhrzeit: 15:00 Uhr  
Aufwand: 3 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Weitere Fragestellung im Rahmen des Data Minings bearbeiten. 
Ergebnis: Geeignete Variablen aufbereitet, Klassifikationen mit verschiedenen Algorithmen durchgeführt und Ergebnisse interpretiert. 
 
Datum: 11.06.2011  
Uhrzeit: 15:00 Uhr  
Aufwand: 4 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Weitere Fragestellung im Rahmen des Data Minings bearbeiten. 
Ergebnis: Geeignete Variablen aufbereitet, Klassifikationen mit verschiedenen Algorithmen durchgeführt und Ergebnisse interpretiert. 
 
Datum: 16.06.2011  
Uhrzeit: 15:00 Uhr  
Aufwand: 3 Stunden  
Teilnehmer: Johannes 
Aufgabenstellung: Vorbereitungen für Präsentationsfolien durchführen. 
Ergebnis: Geeignete Darstellung der Data Mining Erkenntnisse überlegt und erster Entwurf fürs nächste Gruppentreffen erstellt. 
 

Michael

Datum: 20.03.2011  
Uhrzeit: 10:00 Uhr  
Aufwand: 3 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Aufbau des Java-Programms um durchloopen der Ordner und XML Files  
Ergebnis: Erste Class-Datei zum herausholen von person.xml Daten 
 
Datum: 23.03.2011  
Uhrzeit: 13:00 Uhr  
Auwand: 3 Stunde  
Teilnehmer: Micheal 
Aufgabenstellung: Auslesen der person.xml Daten und des Code Verzeichnisses 
Ergebnis: person.csv mit allen Daten als einzelne Zeilen, codes.csv mit Inhalt der Verzeichnisstrukturen inkls. Änderungsdatum der Files in allen Unterordnern 
 
Datum: 27.03.2011  
Uhrzeit: 14:00 Uhr  
Aufwand: 4 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Installieren einer Oracle-DB und einlesen der CSV-Dateien mit automatischer Tabellengenerierung 
Ergebnis: Code und Person Tabelle mit allen ausgelesenen Daten 
 
Datum: 07.04.2011  
Uhrzeit: 14:00 Uhr  
Aufwand: 3 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Erste Datenanalyse und vorbereiten der PL/QL-Funktionen zum überarbeiten der Daten in eine final gemergte Tabelle 
Ergebnis: Funktionen zum auslesen der Pfade, IDs 
 
Datum: 08.04.2011  
Uhrzeit: 17:00 Uhr  
Aufwand: 2 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Auslesen der description.xml's und einfügen in die Oracle-Tabelle desc, Funktionen erweitert um Kurs-IDs den entsprechenden Ordnern zuzuweisen 
Ergebnis: desc-Tabelle, sowie Erweiterung der Funktionen 
 
Datum: 10.04.2011  
Uhrzeit: 11:00 Uhr  
Aufwand: 10 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Erstellen der fertigen CSV-Files 
Ergebnis: Mittels Funktionen neue Tabellen persons, mails, codes befüllt. Diese beinhalten die finalen Werte für Pentaho. CSV mittels Oracle APEX-Exporter in entsprehcende CSV-Files exportiert. 
 
Datum: 12.04.2011  
Uhrzeit: 09:00 Uhr  
Aufwand: 6 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Fehlende Results in codes.csv hinzufügen, Files in Pentaho einbinden 
Ergebnis: Alle resUnit.xml ausgelesen, in Oracle-Tabelle result importiert, Funktionen zum Übernehmen in die codes-Tabelle geschrieben, CSV exportiert, Pentaho installiert, persons.ktr, codes.ktr und mails.ktr erstellt. 
 
Datum: 06.05.2011  
Uhrzeit: 14:00 Uhr  
Aufwand: 5 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: MySQL-DB fertig eingerichtet, sowie phpmyadmin installiert, um Zugriff auf gemeinsame DB zu ermöglichen, Kontaktaufnahme mit fluxicon, erste Process Mining-Analysen 
Ergebnis: Gemeinsame DB verwendbar, Nitro freigeschaltet und Daten transformiert, ProM6 getestet und erste Auswertungen durchgeführt. 
 
Datum: 08.05.2011  
Uhrzeit: 14:00 Uhr  
Aufwand: 2 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Auswertungen mit ProM 
Ergebnis: Herumspielen der Eingabeparameter, Analysieren des Ergebnisses 
 
Datum: 10.05.2011  
Uhrzeit: 18:00 Uhr  
Aufwand: 2 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: SQL-Abfragen basteln, Screenshots für ProM-Analysen erstellt 
Ergebnis: Material für Präsentationsfolien bereitgestellt 
 
Datum: 27.05.2011  
Uhrzeit: 18:00 Uhr  
Aufwand: 4 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Server konfigurieren 
Ergebnis: Aufsetzen einer neuen Serverversion, einspielen der MySQL Daten, Zugriff für alle Teamteilnehmer ermöglicht 
 
Datum: 30.05.2011  
Uhrzeit: 23:00 Uhr  
Aufwand: 2 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Daten aufbereiten für Process Mining 
Ergebnis: Forums und Codeabgabedaten in Einklang gebracht und als CSV exportiert 
 
Datum: 16.06.2011  
Uhrzeit: 22:00 Uhr  
Aufwand: 3 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Aufbereiten der zusätzlichen Daten per Views in SQL für Datamining 
Ergebnis: Views generiert 
 
Datum: 17.06.2011  
Uhrzeit: 18:00 Uhr  
Aufwand: 4 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Aufbereiten zusätzliche Daten für Datamining, Optimierung von Abfrage 
Ergebnis: Views erstellt, Performance zu schlecht wegen zu vielen outer joins, da es statische Daten sind, die sich nicht ändern, befüllen einer Tabelle mit Hilfe des erstellten Views, Befüllen kostet viel Zeit, dafür ist die Abfrage bei der Auswertung schnell 
 
Datum: 20.06.2011  
Uhrzeit: 23:00 Uhr  
Aufwand: 3 Stunden  
Teilnehmer: Michael 
Aufgabenstellung: Folienaufbereitung für Process Mining 
Ergebnis: Folien für Abgabepräsentation erstellt 
Letzte Änderung: 10.10.2011, 20:55 | 1949 Worte