g1t1
Materialien
Erklärung: Datei im JAR-Archiv weka.jar unter /weka/experiment ersetzen. Nun beherrst weka das Mapping von int, bigint, decimal, timestamp, …
Arbeitsaufwand Gruppe
Datum: 19.03.2011
Uhrzeit: 11:00 Uhr
Aufwand: je 3 Stunden
Teilnehmer: komplettes Team
Aufgabenstellung: Festlegung der CSV-Strukturen
Ergebnis: Alle benötigten CSV-Dateien inkl. Spalten wurden definiert
Datum: 22.03.2011
Uhrzeit: 16:00 Uhr
Aufwand: je 3 Stunden
Teilnehmer: komplettes Team
Aufgabenstellung: Designen des Datenbankmodells
Ergebnis: Definiertes Datenbankmodell auf Papier fertig designed
Datum: 06.04.2011
Uhrzeit: 9:00 Uhr
Aufwand: je 3 Stunden
Teilnehmer: Armin, Johannes, e-Tutor und Prof Grossmann
Aufgabenstellung: Evaluieren des geeigneten Integrationsansatzes
Ergebnis: Entscheidung für Dimension-Tables wie in Pentaho Tutorial demonstriert
Datum: 09.04.2011
Uhrzeit: 10:00 Uhr
Aufwand: je 5 Stunden
Teilnehmer: komplettes Team
Aufgabenstellung: Erste Transformationen mit Pentaho erstellen und einarbeiten
Ergebnis: Erste CSV-Transformationen abgeschlossen. Grundlage für weiter individuelle Arbeit geschaffen.
Datum: 12.04.2011
Uhrzeit: 15:00 Uhr
Aufwand: je 5 Stunden
Teilnehmer: komplettes Team
Aufgabenstellung: Zusammenführen der individuellen Transformationen. Erstellen der Präsentation
Ergebnis: Komplette Integratin abgeschlossen, Präsentation wurde erstellt.
Datum: 04.05.2011
Uhrzeit: 9:00 Uhr
Aufwand: je 4 Stunden
Teilnehmer: komplettes Team
Aufgabenstellung: Vertrautmachen mit XEsame, Nitro, weka und deren Kompatibilität zu Pentaho.
Ergebnis: XEsame macht Probleme die Datenbankverbindung aufzubauen. Nitro hat in der Triallizenz Beschränkungen. Hier werden wir eine Studentenlizenz anfordern um damit arbeiten zu können. Brainstorming über mögliche Fragestellungen für Process- und Datamining
Datum: 10.05.2011
Uhrzeit: 9:00 Uhr
Aufwand: je 4 Stunden
Teilnehmer: Armin, Johannes
Aufgabenstellung: Besprechung der gefundenen Fehler im Datenmodell; Erstellen eines Fehlerdokuments und weiterer Überprüfungen; Erstellen der Präsentation
Ergebnis: einzelne Fehler wurden nochmals reproduziert; Klassifizierungsbeispiel in Weka erstellt.
Datum: 10.05.2011
Uhrzeit: 15:00 Uhr
Aufwand: je 5 Stunden
Teilnehmer: Armin, Johannes
Aufgabenstellung: Erheben von Fragestellungen; Erstellen der Präsentation für Aufgabe 2;
Ergebnis: Klassifizierung von Fehlern in den Daten; Process- und Datamining Beispiel erstellt; Präsentation erstellt.
Datum: 25.05.2011
Uhrzeit: 9:00
Aufwand: je 5 Stunden
Teilnehmer: Armin, Johannes, Michael
Aufgabenstellung: Klassifizierungsvariablen bestimmen, Process Mining, Vorbereitung der Dabenbank fürs Data Mining.
Ergebnis: Vorbereitungen für Data und Process Mining für weitere Aufgaben abgeschlossen.
Datum: 31.05.2011
Uhrzeit: 13:00
Aufwand: je 4 Stunden
Teilnehmer: Armin, Johannes
Tasks: Ergebnisse für Präsentation aufbereiten, weiter ProcessMining Cases aufbereiten
Datum: 08.06.2011
Uhrzeit: 09:00
Aufwand: je 5 Stunden
Teilnehmer: Johannes, Michael
Tasks: Besprechen von Process Mining und Interpretation der Ergebnisse, Aufbereiten des Outputs
Datum: 15.06.2011
Uhrzeit: 10:00
Aufwand: je 4 Stunden
Teilnehmer: Armin, Johannes, Michael
Tasks: Besprechen von Social Mining und Interpretation der Ergebnisse, Besprechen von Data Mining
Datum: 18.06.2011
Uhrzeit: 10:00
Aufwand: je 6 Stunden
Teilnehmer: Armin, Johannes, Michael
Tasks: Besprechen der Ergebnisse, Besprechen des Endpräsentationsaufbaus
Datum: 21.06.2011
Uhrzeit: 09:00
Aufwand: je 4 Stunden
Teilnehmer: Armin, Johannes
Tasks: Erstellen der Präsentationsfolien.
Datum: 21.06.2011
Uhrzeit: 18:00
Aufwand: je 1 Stunde
Teilnehmer: Armin, Johannes, Michael
Tasks: Besprechung der Abschlusspräsentation.
Armin
Datum: 23.03.2011
Uhrzeit: 20:00 Uhr
Auwand: 1 Stunde
Teilnehmer: Armin
Aufgabenstellung: Datenmodell in Toad Desigener abbilden
Ergebnis: Entitäten wurden abgebildet, ein paar logische Fehler mit den Foreign-keys gilt es noch zu lösen
Datum: 25.03.2011
Uhrzeit: 20:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Armin
Aufgabenstellung: Installation von Pentaho in einer VM
Ergebnis: Pentaho wurde installiert und auf Datenintegration begutachtet.
Datum: 29.03.2011
Uhrzeit: 17:00 Uhr
Auwand: 2 Stunden
Teilnehmer: Armin
Aufgabenstellung: Fertigstellen des konzeptuellen Datenmodells, Daten der Sollabgabe in CSV-Files parsen
Ergebnis: Modell in Visio erstellt; Sollabgaben CSV erstellt
Datum: 03.04.2011
Uhrzeit: 10:00 Uhr
Auwand: 8 Stunden
Teilnehmer: Armin
Aufgabenstellung: restlichen XML Dateien parsen und auf Parsingfehler kontrollieren
Ergebnis: Bis auf zwei Bereiche wurde alle CSV-Dateien erstellt, Wechsel der Programmiersprache von Java auf Perl
Datum: 05.04.2011
Uhrzeit: 19:00 Uhr
Auwand: 4 Stunden
Teilnehmer: Armin
Aufgabenstellung: restlichen XML Dateien parsen und auf Parsingfehler kontrollieren
Ergebnis: Alle CSV-Dateien wurden erstellt.
Datum: 09.04.2011
Uhrzeit: 12:00 Uhr
Auwand: 5 Stunden
Teilnehmer: Armin
Aufgabenstellung: Transformationen in Pentaho Spoon erstellen und überprüfen
Ergebnis: Alle Transformationen wurden erstellt, jedoch noch nicht in die Datenbank eingespielt. Dies wird in der Gruppe geschehen, da sonst Namenskonflikte auftauchen können.
Datum: 12.04.2011
Uhrzeit: 10:00 Uhr
Auwand: 2 Stunden
Teilnehmer: Armin
Aufgabenstellung: Ausbessern von Fehlern in den Transformationen
Ergebnis: Transformationen wurden an die Namenskonventionen der Gruppe angepasst.
Datum: 04.05.2011
Uhrzeit: 20:00
Aufwand: 4h
Teilnehmer: Armin
Aufgabenstellung: Anbindung der in Pentaho erstellten Datenbank an Weka.
Ergebnis: Per ODBC/JDBC Bridge konnte die DB an weka angebunden werden. Queries konnten abgesetzt werden und es kamen Rückgabewerte an. Diese konnten aufgrund von Fehlermeldungen jedoch nicht weiter verwendet werden.
Datum: 06.05.2011
Uhrzeit: 19:00
Aufwand: 2h
Teilnehmer: Armin
Aufgabenstellung: Fehler- und Literatursuche für weka und MySQL Datenbanken.
Ergebnis: Ahnung woran der Fehler liegt. Wird für die Gruppe aufbereitet und bearbeitet.
Datum: 30.05.2011
Uhrzeit: 19:00
Aufwand: 4h
Teilnehmer: Armin
Aufgabenstellung: Zusammenführen von Logs aus der Sicht einer Person
Ergebnis: Unvollständige Datumsdaten mussten korrigiert werden. Merge der einzelnen Logs ist schwieriger als angenommen. Werte zur statistischen Auswertung gesammelt.
Datum: 05.06.2011
Uhrzeit: 18:00
Aufwand: 3 h
Teilnehmer: Armin
Aufgabenstellung: Einführung ins Social Mining
Ergebnis: verschiedene Logs erstellt und mit unterschiedlichen SocialMiner versucht.
Datum: 12.06.2011
Uhrzeit: 15:00
Aufwand: 5 h
Teilnehmer: Armin
Aufgabenstellung: Screencasting des Social Miners
Ergebnis: Video wurde erstellt; Vorbereitung der Daten für Endpräsentation
Datum: 20.06.2011
Uhrzeit: 19:00
Aufwand: 2 h
Teilnehmer: Armin
Aufgabenstellung: weitere Dateninterpretation aus dem Social Mining
Ergebnis: Aktiviätetn der Lektoren und Tutoren wurden abgehandelt
Johannes
Datum: 20.03.2011
Uhrzeit: 10:00 Uhr
Aufwand: 7 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Daten vom Forum in CSV-Files parsen, die unseren festgelegten Strukturen vom 19.03.2011 entsprechen
Ergebnis: Zwei CSV-Files (Ist-Forum; Forum aus Personensicht)
Datum: 27.03.2011
Uhrzeit: 12:00 Uhr
Aufwand: 4 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Daten der Registrierung in CSV-Files parsen, die unseren festgelegten Strukturen vom 19.03.2011 entsprechen
Ergebnis: Zwei CSV-Files (Studenten-Register; Soll-Registration)
Datum: 29.03.2011
Uhrzeit: 21:00 Uhr
Aufwand: 1 Stunde
Teilnehmer: Johannes
Aufgabenstellung: Präsentationsfolien für den 30.03.2011 erstellen
Ergebnis: Präsentationsfolien
Datum: 01.04.2011
Uhrzeit: 15:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Die verschiedenen Pentaho-Pakete nach diversen Anleitungen aus dem Internet in einer virtuellen Maschine installieren, erste Erkenntnisse über Funktionsweise sammeln.
Ergebnis: Pentaho-Programme sind installiert und voll einsatzfähig. Erstes Verständnis der Funktionsweise ist vorhanden.
Datum: 04.04.2011
Uhrzeit: 09:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Fundierte Einarbeitung in den Pentaho Data Integrator (Literaturrecherche, Ansehen der Videotutorials)
Ergebnis: Tiefer gehendes Verständnis der Funktionsweise und der Möglichkeiten von Pentaho Data Integrator ist vorhanden.
Datum: 09.04.2011
Uhrzeit: 20:00 Uhr
Aufwand: 1 Stunde
Teilnehmer: Johannes
Aufgabenstellung: Einige Änderungen an meinen CSV-Files vornehmen, die im Gruppentreffen vereinbart wurden.
Ergebnis: Geringfügige Änderungen an meinen CSV-Files sind umgesetzt.
Datum: 10.04.2011
Uhrzeit: 12:00 Uhr
Aufwand: 5 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Transformationen in Pentaho Spoon erstellen und überprüfen.
Ergebnis: Alle Transformationen wurden erstellt, jedoch noch nicht in die Datenbank eingespielt. Dies wird in der Gruppe geschehen, da sonst Namenskonflikte auftauchen können.
Datum: 08.05.2011
Uhrzeit: 15:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Potentielle Fehler im Datensatz überlegen und auf Vorkommen überprüfen.
Ergebnis: Potentielle Fehler hinsichtlich der Aspekte Inhalt, Mapping und eigenartige Wertausprägungen überlegt. Auf tatsächliches Vorkommen im Datensatz/DB überprüft. Die gefundenen Fehler dokumentiert.
Datum: 27.05.2011
Uhrzeit: 08:00 Uhr
Aufwand: 7 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Einarbeitung in Theorie bezüglich der relevanten Data Mining-Operationen. Evaluierung geeigneter Berechnungen und Methoden.
Ergebnis: Genaue Vorstellung, welche Berechnungen im Rahmen der von uns erhobenen Daten möglich sinnvoll sind.
Datum: 29.05.2011
Uhrzeit: 10:00 Uhr
Aufwand: 7 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Durchführung von Data Mining Operationen.
Ergebnis: Erste Klassifikationen durchgeführt und dokumentiert.
Datum: 06.06.2011
Uhrzeit: 15:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Weitere Fragestellung im Rahmen des Data Minings bearbeiten.
Ergebnis: Geeignete Variablen aufbereitet, Klassifikationen mit verschiedenen Algorithmen durchgeführt und Ergebnisse interpretiert.
Datum: 11.06.2011
Uhrzeit: 15:00 Uhr
Aufwand: 4 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Weitere Fragestellung im Rahmen des Data Minings bearbeiten.
Ergebnis: Geeignete Variablen aufbereitet, Klassifikationen mit verschiedenen Algorithmen durchgeführt und Ergebnisse interpretiert.
Datum: 16.06.2011
Uhrzeit: 15:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Johannes
Aufgabenstellung: Vorbereitungen für Präsentationsfolien durchführen.
Ergebnis: Geeignete Darstellung der Data Mining Erkenntnisse überlegt und erster Entwurf fürs nächste Gruppentreffen erstellt.
Michael
Datum: 20.03.2011
Uhrzeit: 10:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Michael
Aufgabenstellung: Aufbau des Java-Programms um durchloopen der Ordner und XML Files
Ergebnis: Erste Class-Datei zum herausholen von person.xml Daten
Datum: 23.03.2011
Uhrzeit: 13:00 Uhr
Auwand: 3 Stunde
Teilnehmer: Micheal
Aufgabenstellung: Auslesen der person.xml Daten und des Code Verzeichnisses
Ergebnis: person.csv mit allen Daten als einzelne Zeilen, codes.csv mit Inhalt der Verzeichnisstrukturen inkls. Änderungsdatum der Files in allen Unterordnern
Datum: 27.03.2011
Uhrzeit: 14:00 Uhr
Aufwand: 4 Stunden
Teilnehmer: Michael
Aufgabenstellung: Installieren einer Oracle-DB und einlesen der CSV-Dateien mit automatischer Tabellengenerierung
Ergebnis: Code und Person Tabelle mit allen ausgelesenen Daten
Datum: 07.04.2011
Uhrzeit: 14:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Michael
Aufgabenstellung: Erste Datenanalyse und vorbereiten der PL/QL-Funktionen zum überarbeiten der Daten in eine final gemergte Tabelle
Ergebnis: Funktionen zum auslesen der Pfade, IDs
Datum: 08.04.2011
Uhrzeit: 17:00 Uhr
Aufwand: 2 Stunden
Teilnehmer: Michael
Aufgabenstellung: Auslesen der description.xml's und einfügen in die Oracle-Tabelle desc, Funktionen erweitert um Kurs-IDs den entsprechenden Ordnern zuzuweisen
Ergebnis: desc-Tabelle, sowie Erweiterung der Funktionen
Datum: 10.04.2011
Uhrzeit: 11:00 Uhr
Aufwand: 10 Stunden
Teilnehmer: Michael
Aufgabenstellung: Erstellen der fertigen CSV-Files
Ergebnis: Mittels Funktionen neue Tabellen persons, mails, codes befüllt. Diese beinhalten die finalen Werte für Pentaho. CSV mittels Oracle APEX-Exporter in entsprehcende CSV-Files exportiert.
Datum: 12.04.2011
Uhrzeit: 09:00 Uhr
Aufwand: 6 Stunden
Teilnehmer: Michael
Aufgabenstellung: Fehlende Results in codes.csv hinzufügen, Files in Pentaho einbinden
Ergebnis: Alle resUnit.xml ausgelesen, in Oracle-Tabelle result importiert, Funktionen zum Übernehmen in die codes-Tabelle geschrieben, CSV exportiert, Pentaho installiert, persons.ktr, codes.ktr und mails.ktr erstellt.
Datum: 06.05.2011
Uhrzeit: 14:00 Uhr
Aufwand: 5 Stunden
Teilnehmer: Michael
Aufgabenstellung: MySQL-DB fertig eingerichtet, sowie phpmyadmin installiert, um Zugriff auf gemeinsame DB zu ermöglichen, Kontaktaufnahme mit fluxicon, erste Process Mining-Analysen
Ergebnis: Gemeinsame DB verwendbar, Nitro freigeschaltet und Daten transformiert, ProM6 getestet und erste Auswertungen durchgeführt.
Datum: 08.05.2011
Uhrzeit: 14:00 Uhr
Aufwand: 2 Stunden
Teilnehmer: Michael
Aufgabenstellung: Auswertungen mit ProM
Ergebnis: Herumspielen der Eingabeparameter, Analysieren des Ergebnisses
Datum: 10.05.2011
Uhrzeit: 18:00 Uhr
Aufwand: 2 Stunden
Teilnehmer: Michael
Aufgabenstellung: SQL-Abfragen basteln, Screenshots für ProM-Analysen erstellt
Ergebnis: Material für Präsentationsfolien bereitgestellt
Datum: 27.05.2011
Uhrzeit: 18:00 Uhr
Aufwand: 4 Stunden
Teilnehmer: Michael
Aufgabenstellung: Server konfigurieren
Ergebnis: Aufsetzen einer neuen Serverversion, einspielen der MySQL Daten, Zugriff für alle Teamteilnehmer ermöglicht
Datum: 30.05.2011
Uhrzeit: 23:00 Uhr
Aufwand: 2 Stunden
Teilnehmer: Michael
Aufgabenstellung: Daten aufbereiten für Process Mining
Ergebnis: Forums und Codeabgabedaten in Einklang gebracht und als CSV exportiert
Datum: 16.06.2011
Uhrzeit: 22:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Michael
Aufgabenstellung: Aufbereiten der zusätzlichen Daten per Views in SQL für Datamining
Ergebnis: Views generiert
Datum: 17.06.2011
Uhrzeit: 18:00 Uhr
Aufwand: 4 Stunden
Teilnehmer: Michael
Aufgabenstellung: Aufbereiten zusätzliche Daten für Datamining, Optimierung von Abfrage
Ergebnis: Views erstellt, Performance zu schlecht wegen zu vielen outer joins, da es statische Daten sind, die sich nicht ändern, befüllen einer Tabelle mit Hilfe des erstellten Views, Befüllen kostet viel Zeit, dafür ist die Abfrage bei der Auswertung schnell
Datum: 20.06.2011
Uhrzeit: 23:00 Uhr
Aufwand: 3 Stunden
Teilnehmer: Michael
Aufgabenstellung: Folienaufbereitung für Process Mining
Ergebnis: Folien für Abgabepräsentation erstellt
Letzte Änderung: 10.10.2011, 20:55 | 1949 Worte