| |
WebLoupe dient zur Analyse, Visualisierung und Exploration von Webseiten und ihren Verknüpfungen.
Dabei werden öffentliche Internetseiten oder lokal gespeicherte Seiten mittels grafischer Benutzeroberfläche
als Baumstruktur in verschiedenen Arten und tabellarisch dargestellt.
Die Visualisierung repräsentiert die Vernetzung von Webseiten und ihre Inhalte. Dadurch bekommt der Anwender
einen Überblick über die Vernetzung beliebiger Webseiten, den er sonst beim normalen Surfen nicht bekommen würde.
Sitemaps sind nicht auf vielen Webseiten zu finden, und zeigen auch nur die interne, oft unvollständige Struktur einer Seite.
Die Visualisierungen und Informationen, die WebLoupe bereitstellt, stellen vor allem eine Navigationshilfe
für Anwender dar, die sich besser auf einer Webseite bzw. im Internet zurechtzufinden wollen,
können aber auch für Website-Administratoren sehr nützlich sein.
Dazu bietet WebLoupe eine einfache Benutzeroberfläche für die freundliche Handhabung. Des Weiteren besteht WebLoupe
aus einem sog. Crawler, der die Webseiten durchsucht und herunterlädt, und den verschiedenen Visualisierungsmodulen,
welche die Vernetzung gefundener Seiten visuell darstellen, als Bild abspeichern, oder das GraphXML Format zur
Verwendung mit einem Java Applet generieren.
Folgende Einstellungen können vorgenommen werden, bevor der Crawler gestartet wird:
- online/offline Suche (bei der offline Suche ist die Startseite des Crawlvorgangs lokal gespeichert)
- max. Anzahl der Seiten
- max. Suchtiefe
- Einschränkung der Domäne
- max. Dateigrösse
- max. Zeit für einen Verbindungsaufbau
- Einschränkung des Mime Typs
- Angabe von Schlüsselwörtern, nach denen gesucht werden soll
Während des Crawlvorgangs werden gefundene Seiten dynamisch in einer hierarchischen
Baumstruktur mit Seitentitel und URL dargestellt. Nach dem Ende des Vorgangs wird zusätzlich eine
Tabellenübersicht dargestellt, in der weitere Informationen zu den einzelnen Seiten angezeigt werden:
- Titel
- URL
- HTTP Response Code
- Mime Typ
- Dateigrösse
- Anzahl der Bilder
- Anzahl der Buchstaben
- gefundene Schlüsselwörter
- Status (Discovered, Fetched, Parsed, FetchError, ParseError, MalformedUrl, ContentLengthOversized, MimeTypeExcluded, Timeout)
Eventuell vorhandene tote Links (Broken Links) werden farblich in der Baumansicht hervorgehoben,
die oberhalb der Tabelle angezeigt wird. Wird dort eine Seite ausgewählt, wird sie auch in der Tabelle ausgewählt.
Klickt man doppelt auf eine Seite in der Baumansicht, öffnet sich der Standardbrowser mit der URL der Seite.
Die Visualisierung als Baumstruktur ist auch in einer alternativen, flexibleren Form möglich. Dazu wurde das open-source Visualisierungstool
Touchgraph in WebLoupe integriert. Er zeigt die Seitenstruktur interaktiv mit Hilfe von Knoten und Kanten an,
wobei in den Knoten die Seitentitel angezeigt werden.
Eine Zommfunktion verhilft dabei, den Graphen zu verkleinern oder zu vergrößern. Ebenso kann der Graph rotiert werden, oder
einzelne Knoten mit ihren Kanten ein oder ausgeblendet werden, um die Komplexität der
Struktur bei einer grösseren Anzahl von Seiten zu reduzieren. Die einzelnen Knoten lassen sich auch verschieben.
Die Visualisierung des Graphen kann als Bild im PNG-Format abgespeichert werden. Außerdem kann eine GraphXML Datei generiert werden, die mit dem
mitgelieferten Applet in einem Browser angezeigt werden kann. Diese Funktion wurde auf Basis des open-source Programms
HyperGraph realisiert.
In einer nachfolgenden Version von WebLoupe sollen weitere Funktionen eingebaut werden, wie beispielsweise zur
Speicherung von Projektdateien oder heruntergeladenen Dateien.
Nähere Informationen über die Bedienung von WebLoupe können Sie der
Benutzerdokumentation
entnehmen.
|
|