Diese Website ist seit dem Ende des Studiengangs Informationswissenschaft
im Juni 2014 archiviert und wird nicht mehr aktualisiert.
Bei technischen Fragen: Sascha Beck - s AT saschabeck PUNKT ch
Drucken

InfoWissWiki-Visualisierungen

Das Wiki der Fachrichtung Informationswissenschaft ist in den letzten Wochen und Monaten munter weiter gewachsen, nicht zuletzt dank der vielen Studierenden, die im Rahmen verschiedener Seminare neue Inhalte eingestellt und bestehende Artikel aufgeräumt/überarbeitet haben. Das Wiki stellt mittlerweile eine Art Weiterführung des so genannten „Terminosaurus Rex“ dar, der seit vielen Jahren die Terminologie der Informationswissenschaft „hütete“. Zum Abschluss des Semesters suchten wir nach einer Möglichkeit, die semantischen Beziehungen zwischen den einzelnen Artikeln auch in graphischer Form anschaulich darzustellen. Viele Wiki-Einträge sind bereits durch Relationen wie „broader„, „narrower“ und „related“ semantisch angereichert und verknüpft. Diese semantischen Beziehungen im Wiki bieten somit eine ideale Möglichkeit zur Visualisierung der Beziehungen zwischen verschiedenen Einträgen in Form von gerichteten und ungerichteten Graphen. Die bisherigen Visualisierungen sind innerhalb weniger Stunden aus einer gewissen Experimentierfreude heraus entstanden und sind dementsprechend noch recht rohe Testversionen. An vorderster Front kam das GraphViz-Paket zum Einsatz, aber auch im Web verfügbare Flash- und Java-Module wurden in den Test eingebunden. Die optimale Lösung stellen aber alle Ansätze noch nicht dar, angesichts der üppigen Datenmengen rechnet vor allem „dot“ aus dem GraphViz-Paket mehr als zwei Stunden auf meinem aktuellen „Core 2“-PC um eine möglichst kollisionsfreie Abbildung zu erzeugen. Für Technik-Interessierte: Erzeugt wurden die Graph-Rohdaten für „dot“ (und die anderen Visualisierungsformen) über ein einfaches PHP-Skript, welches die PHP RDF-API nutzt, um mittels SPARQL-Abfragen den RDF-Dump des InfoWissWikis auszuwerten. Wer sich die bisherigen (noch nicht ganz fehlerfreien) Ergebnisse der kurzen Entwicklungs-Phase anschauen will, kann dies dort tun. Insbesondere die Repräsentation in Form einer Flash-Anwendung (basierend auf dem RelationBrowser von Moritz Stefaner) hat sich als sehr ansprechend erwiesen und es ist geplant, dieses Flash-Modul mittelfristig direkt in das InfoWissWiki zu integrieren. Ideen/Anregungen für andere Visualisierungsmethoden sind herzlich willkommen — ebenso sachdienliche Hinweise, wie man eine PNG-Datei mit 35.000×9.000 Pixel möglichst geschickt ausdrucken könnte 😉

4 Responses

  1. Sebastian Boell sagt:

    Die Idee den IWWI zu visualisieren ist Großartig. Die erstellten Karten sind allerdings immens und etwas unübersichtlich, vor allem auch weil die Navigation auf meiner Maschine etwas schweerfällig abläuft.

    Vielleicht wäre es ja eine Idee einen Grenzwert bei der Visualisierung einzuführen um die Komplexität zu reduzieren. Wäre interessant zu sehen wie die Karte aussieht, wenn ihr Begriffe die nur über ein oder zwei Kanten verbunden sind weglasst. Nach einem ersten Blick vermute ich, dass davon vor allem Synonymeinträge betroffen sind. Dass Ergebinss spiegelt dann zwar nicht mehr den kompletten IWWI wieder, aber brigt eventuell die Struktur des IWWI besser zum vorschein.

  2. Hallo Sascha!

    Du hast Dich richtig in’s Zeug gelegt. Echt klasse!

    Meine noch sehr ursprüngliche Version möchte ich Dir zur Einsicht/Nutzung/Inspiration sowie allen anderen Interessierten freigeben. Wer mitprogrammieren möchte und Python kennt ist natürlich eingeladen.

    Hat jemand noch Ideen oder Verbesserungsvorschläge?

  3. Noch eine kurze Erklärung zu meinem vorherigen Kommentar.

    1. Weil die Eingabe einer URL im Text des Kommentars zu einem Verarbeitungsabbruch führt, kann man die URL zum SVN-Repository unter meinem Namen finden.

    2. Anders als beim Sascha ist mein Skript eher als „Webtracker“ gedacht. Es analysiert die Zugriffs-Logs (access log file) und stellt zunächst eine Lister aller IPs/Addressen. Nachdem eine von Ihnen ausgewählt worden ist, wird ein Graph nur für Zugriffe von dieser IP erstellt: Externe Referer sind eckig, fehlerhafte Seiten rot, jeder Klick auf eine htm* oder php-Seite mit Datum+Uhrzeit und Richtung versehen. So kann man erkennen von wo jemand kam und wie er durch die Seite navigiert hat.

  4. Sascha Beck sagt:

    @Robert: Wie äußert sich dieser „Verarbeitungsabbruch“ bei der Eingabe einer URL?

Leave a Reply