| World Wide Web Hausarbeit |
|
Das World Wide Web Als der Grundstein für das Internet gelegt wurde, hatte niemand mit den durchschlagenden Erfolg 20 Jahre später gerechnet. So wird sich der Erfinder heute wohl ärgern, dass er sich seine Idee nicht patentieren lassen hat. Schaut man sich die Gegenwart an, sind Netzwerke und gerade das Internet nicht mehr wegzudenken. Ohne sie würde die Geschäftswelt heute nicht mehr funktionieren, weil die Wirtschaft sich der schnellen Datenübertragung dermaßen angepasst hat, dass sie jetzt von ihr abhängig sind. Daraus folgt auch das man, wenn man langfristig überleben möchte, seine Firmenabläufe (Prozesse) mit einem geeigneten Netzwerk koppeln muss.
ich stelle euch hier zunächst die Grundkomponenten des World-Wide-Web vor. Danach werden wesentliche Merkmale von Intranet und Extranet charakterisiert. Weiter sollen auch noch Begriffe wie Web Content, Webportal und Webservice erläutert werden. Zum Schluss wird die meist genutzte Anwendung der Webbrowser und seine Architektur erklärt.
Grundkomponenten des World Wide Web (WWW) Hypermedia und HypertextDie Basis des World-Wide-Web bildet das Prinzip des Hypertextes. Hypertextdokumente sind Textdokumente, die über Schlüsselwörter, die so genannten Hyperlinks, die im Volksmund auch kurz „Links“ genannt werden, verbunden sind. Klickt nun ein Anwender auf einen Hyperlink, verzweigt das Programm (z.B. Browser) automatisch zu dem verlinktem Dokument und stellt dieses dar. Der Ort an dem dieses Dokument gespeichert ist, kann überall sein so lange der Speicherort mit dem Internet verbunden ist. Hypermediadokumente haben zusätzlich zu den Textdateien auch Verzweigungen zu Ton, Bild und Videodateien. Der richtige Mix und die richtige Aufbereitung der beiden Formate macht eine intuitive Steuerung durch den Anwender möglich und sichert so eine effiziente Informationsvermittlung möglich. (vgl. KYAS 2001, S. 211f)  Funktionsweise und ArchitekturDie Architektur des WWW basiert grundlegend auf drei Kernstandards, dass sind HTML (Hyper Text Markup Language), URL (Uniform Resource Locator) und HTTP (Hyper Text Transport Protokoll). In den folgenden Unterpunkten werden diese Standards noch genauer Beschrieben. Die Arbeitsweise des WWW beruht auf dem Client-Server Prinzip. Leistungsfähige Computersysteme die mit geeigneten Softwareapplikationen ausgestattet sind dienen als Serversysteme. Auf diese Computersystemen werden die HTML-Dokumente gespeichert und auf sie können WWW-Clients zugreifen. Webbrowser dienen als Clients die unter Gliederungspunkt 6. näher betrachteten werden. Immens erweitert wurde der Funktionsumfang des WWW noch durch zusätzlich Spezifikationen wie VRML, DHTML, CGI, Java und viele andere. Im WWW eröffnen sich auch heute noch Tag für Tag neue Möglichkeiten (vgl. KYAS 2001, S. 216).
HTML – Hyper Text Markup Languagedas Format und der Aufbau der für das WWW charakteristischen Hypertextdokumente (HTML-Dokument) ist durch HTML spezifiziert– HTML ist also die Beschreibungssprache, in der Dokumente für das WWW erstellt werden. Das Prinzip von „Markup-Systemen“ ist, dass jeder Textpassage mit Hilfe eines Speziellen Formatbefehls (Tag, Markup) ein bestimmtes Format zugeordnet wird. Geeignete Systeme interpretieren diese Befehle wodurch ein Text im gewünschten Format dargestellt werden kann. Der Inhalt einer HTML-Seite besteht nur aus reinem ASCII-Text, der dann durch eine Interpretation eines Web-Browser als ansehnliches Grafik-dokument dargestellt wird. Die Übertragung von HTML-Dokumenten geht rasch vor sich wenn keine Grafiken enthalten sind, da lediglich die ASCII-Zeichen übertragen werden müssen. Sind jedoch Hyperlinks zu Grafikdateien (bzw. Audio- oder Videodateien) enthalten, werden diese nach der Übertragung des Textes ebenfalls übertragen. Die Ladezeit eines reinen Textes dauert nur ein Bruchteil der Zeit die benötigt wird um eine kleine Grafik zu übertragen. Mit einer ganzen Reihe von speziellen HTML-Editoren und HTML-Konverterprogramme ist das rasche und effiziente erstellen von HTML-Dokumente kein Problem mehr. Man kann sie auch mit einem einfachen Texteditor erstellen, wobei hier die zahlreichen HTML-Befehle per Hand eingegeben werden müssen (vgl. KYAS 2001, S. 219-221). Â
URL – Uniform Resource LocatorDie Adressierung von Objekten im WWW erfolgt durch das URL-Format. Die URL besteht aus mindestens drei Komponenten, welche für eine eindeutige Lokalisierung eines Objektes im Internet benötigt werden: · das Protokoll, dass den Zugriff auf das entsprechende Objekt regelt · die Internetadresse und Portnummer des Serversystems · der Pfad und der Dateiname des Objekts Es können auch nicht HTML-Dateien adressiert werden, sondern auch jedes andere beliebige Datei-format. das URL-Format dient nicht nur der reinen Adressierung von Internet-Objekten sondern stellt außerdem die Syntax dar, mit der Daten vom Client zum Server übertragen werden können. Auf diese Art und Weise werden beispielsweise Daten, die in Formulare die in einer HTML Seite integriert sind, eingegeben werden übertragen (vgl. KYAS 2001, S. 221f).
HTTP – Hyper Text Transport ProtokollHTTP ist das Kommunikationsprotokoll, das für die Übertragung von HTML-Daten im Internet benötigt wird. Es ist ein simples, zustandsloses (stateless) Protokoll, dass auf den Kommunikationspfade von TCP/IP aufsitzt. Als zustandslos bezeichnet man es deshalb, weil die Übertragungen der einzelnen Datenpakete zwischen Sender und Empfänger unabhängig von einander erfolgt. Das bedeutet, dass nach erfolgreicher Datenübertragung die Verbindung zwischen den beiden Kommunikationspartnern nicht aufrechterhalten wird. Sollen nun mehrere Daten übertragen werden muss jeweils eine neue Verbindung aufgebaut werden. Der Vorteil dieses Protokolltypes ist im Wesentlichen das das Serversystem keine Daten über bestehende oder im Aufbau befindliche Verbindungen speichern oder mehrere zeitgleich bestehende Verbindungen aufrechterhalten muss. Diese Protokollarchitektur ermöglicht WWW-Server eine mit hoher Geschwindigkeit statt findender gleichzeitiger Verarbeitung von einer großen Anzahl HTTP-Anforderungen Nachteilig ist jedoch die erschwerte Implementierung von interaktiven Client-Server-Anwendungen. Viele der Abläufe bestehen aus mehrenden aufeinander folgenden und zusammenhängenden Schritten. Um die Abläufe zu verdeutlichen wird nun anhand eines Beispieles gezeigt wie es funktioniert. Beispiel: Überprüfung der Berechtigung eines Benutzers vor dem Zugriff auf den Server.
Zunächst sendet der Client seine Benutzerdaten (Login, Passwort) mittels eines HTML-Formulars an den Web-Server. Dieser speichert die Daten in seiner Daten-bank, bestätigt den Eintrag mit einer Rückmeldung und beschleißt gleichzeitig die HTTP-Verbindung. Wenn nun der Client (ohne besondere Vorkehrungen der Server-HTTP-Applikation) versucht, mit einer weiteren HTTP-Verbindung vom Server Daten abzurufen, gewährt der Server (trotz vorhergegangener Verifikation) keinen Zugriff. Das Server-HTTP-Protokoll speichert ja schließlich keinerlei Informationen über vorhergegangene Verbindungen. Um dieses Problem zu umgehen muss nun eine „virtuelle“ Verbindung zwischen Client und Server über mehrere HTTP-Verbindungen aufrecht erhalten werden, d.h. es muss nach der Überprüfung der Benutzerdaten in der Server-Datenbank mit der Bestätigung des Web-Servers in einem sog. „versteckten“ Element der HTML-Antwortseite das Benutzerpasswort des Clients wieder an eben diesen zurückgesendet werden. Dieser wiederum benutzt dann dieselbe Seite dazu, seine Anforderung zu formulieren, und sendet sie wieder an den Server. Dieser kann jetzt anhand des in der HTML-Seite versteckten Passworts erkennen, ob die Anfrage von einem berechtigten Benutzer stammt (vgl. KYAS 2001, S. 223).
Merkmale des Intranets und des Extranets IntranetIntranet nennt man Netzwerke die nur innerhalb eines beschränkten Raums verfügbar sind wie z.B. in sich geschlossene Netzwerke von Organisationen oder Firmen, auf diese haben nur Mitarbeiter einen Zugriff. Da sie auf der Basis von TCP/IP arbeiten ist es möglich alle Dienste die man vom Internet kennt auch im Intranet zu nutzen. So kann eine Organisation ihre Daten nicht nur per Datei-Server Speichern und zur Verfügung stellen, sondern interne Informationen mit Hilfe der benutzerfreundlichen Mechanismen des World-Wide-Web im Intranet verfügbar machen. Daraus folgt das es kein welt-weites Netz sein muss, es kann sich auch lediglich um ein lokales Firmen-Netzwerk (LAN) handeln. Große Sparpotentiale eröffnen sich auch wenn man den interessanten Bereich der Telefonie bzw. Videokommunikation innerhalb eines Intranet betrachtet. (vgl. LAUER 1999, S. 80). Im folgendem werden 2 Ausbaustufen von Intranets erläutert:
Ein LAN ist relativ erschwinglich und ist einfach zu installieren. Zu beachten ist, wenn man das Netzwerk mit dem Internet koppeln möchte, dass dadurch mögliche Sicherheitsprobleme entstehen. Möchte man diese beheben sollte man eine Firewall etablieren die unbefugte Zugriffe von außerhalb verhindern kann. Die Firewall kontrollieren den Übergang zwischen dem LAN (→ hohes Vertrauen) und dem Internet (→ kein Vertrauen). · komplexe Ausbaustufe: mehrere (via WAN oder Internet) miteinander verbundene lokale Netze Sollen mehrere Intranets die räumlich weit getrennt sind zu einem zusammengefasst werden, muss entschieden werden wie dies geschehen soll und welche Möglichkeit am besten zum Unternehmen passt. Grundsätzlich gibt es zwei Möglichkeiten: Entweder werden die einzelnen LANs an das Internet angeschlossen das dann als Kommunikationskanal fungiert oder man verbindet sie mit Hilfe von Weitverkehrsverbindungen, zu einem Wide Area Network (WAN), die man selbst installieren kann oder einfach anmietet. Diese Variante ist wesentlich teurer und aufwendiger als die über das Internet, dafür ist sie jedoch wesentlich sicherer. Die meisten Unternehmen wählen aber eher die einfache und billigere Lösung über das Internet. Besonders wo es hierfür auch schon Lösungen mit hohen Sicherheitsstandards gibt, z.B. Virtual Private Network (VPN). (vgl. LAUER 1999, S. 146f).
ExtranetEin Extranet ist die erweiterte Form des Intranets. Hier ist es auch Externen, dass können Unternehmen, Kunden oder Partnern sein, ganz oder teilweise erlaubt auf das Intranet zu zugreifen. Sie können dann beispielsweise auf Preislisten, Produktinfos und ähnliches zugreifen. Für die Öffentlichkeit ist das Extranet allerdings nicht zugänglich. Um dies zu gewährleisten zu können muss der Zugriff durch geeignete Maßnahmen kontrolliert werden. (vgl. LAUER 1999, S. 149).
Suchmaschinen Erste Lösungsansätze für Suchmaschinen gab es schon kurz nachdem das Web seinen weltweiten Siegeszug angetreten hatte. Ziel ist es gewesen eine Leistungsfähige Anwendung zu schaffen die bei der Recherche von Dokumenten helfen sollte. Das Ergebnis ist ein heutzutage extrem häufig genutzten Hilfsmittel gewesen das anscheinend fast mühelos unendlich viele Suchergebnisse liefert von Dateien die auf Computer oder in einem Computernetzwerk wie eben beispielsweise dem WWW gespeichert sind. Die heute bestehenden Angebote sind fast alle kostenlos. (vgl. LAUER 1999, S. 659). Eine Suchmaschine besteht aus unvorstellbar großen Datenbanken, deren Inhalt in der Regel mit Hilfe von automatischen Suchprogrammen ermittelt werden. Diese Suchprogramme, auch Robots genannt, haben die Aufgabe das World-Wide-Web systematisch zu durchsuchen. Von den gefundenen Hypertexten werden dann die wichtigsten Schlagwörter und die Erreichbarkeit speichert. Mit Hilfe einer Arbeitsoberfläche ist es dann Möglich in ihnen nach Schlagwörtern zu suchen und die entsprechenden Ergebnisse übersichtlich darzustellen. Die Ergebnisse werden meistens in einer Liste mit den dazugehörigen URLs präsentiert. (vgl. KYAS 2001, S. 448). Es gibt mehrere Faktoren die die Qualität und Effizienz von Suchmaschinen beeinflussen. Hauptsächlich aber von der Leistungsfähigkeit der eingesetzten Robot-Programme (Spiders, Worms, Web Crawlers, ...) ab. Einige Suchmaschinen, mit sehr hoher Computerleistung und viel Speicherplatz, können sogar den gesamten Text zu jedem URL speichern. Sie sind dann in der Lage, eine Volltextsuche über alle registrierten Dokumente durchzuführen. Diese liefert aber nicht immer die gewünschten Resultate, hier werden oft Suchresultate angezeigt die zwar die gesuchten Elemente enthalten, aber oft eine andere Thematik behandeln. Mit intelligenteren Robots wurde versucht dem entgegen zuwirken. Sie nutzen z.B. komplexere Algorithmen (z.B. kombiniert mit Wortstatistikberechnungen) um die tatsächlich relevanten Stichworte herauszufiltern und der betreffenden URL zuzuordnen (vgl. KYAS 2001, S. 453f).  Architekturen von Webbrowsern Webbrowser sind interaktive Programme, mit deren Hilfe Benutzer die gewünschten bzw. ausgewählten Informationen aus dem Web lesen kann. In der Regel enthalten diese Informationen weitere wählbare Elemente die zu weiteren Informationen führen. (Comer 2002, S. 489). Der Webbrowser wickelt den größten Anteil der Arbeit beim Einlesen und Anzeigen von Dokumenten aus dem WWW ab. Ein Browser erweckt den Anschein ein nahtloser Dienst zu sein, aber er beinhaltet mehrer umfangreiche Softwarekomponenten die ineinander greifen. Hauptbestandteile eines Browsers sind Controller, einer Reihe von Clients und Interpretern. Kernstück des Browsers ist der Controller er verwaltet die ganze Struktur. Er interpretiert alle Eingaben des Benutzers und aktiviert die benötigten Komponenten, um die vom User spezifizierte Operation auszuführen. Jeder Webbrowser muss einen HTTP-Client und einem HTML-Interpreter beinhalten, aber zusätzlich kann er auch Komponenten wie beispielsweise ein FTP-Client oder auch ein E-Mail-Client integriert haben. Ein weitere sehr wichtige Funktion ist die des sog. Cache auf dem lokalen Computer. In diesem „Puffer“ werden alle Elemente gespeichert die ein Benutzer im Web aufgerufen hat. Wird nun ein Dokument erneut ausgewählt, kann es direkt aus dem Cache geladen werden. Das hat den Vorteil das es kein erneuten unter umständen langwierigen Ladeprozess gibt. Zu beachten ist allerdings das eben diese Funktion bei sich ständig ändernden Inhalten auch störend ist da der Benutzer jedes mal die Seite manuell aktualisieren lassen muss. (vgl. COMER 2002, S. 498/504). Â
Begriffsbeschreibungen: Web ContentDer Begriff Content kann im Allgemeinen mit Inhalt übersetzt werden, dieser Inhalt kann in den unterschiedlichsten Formen vorliegen, beispielsweise als Text, Bild-, Audio- oder Videodaten. Web Content ist der Kern jeder Webseite, wie erfolgreich diese ist hängt maßgeblich von der Qualität des Inhalts und von der Benutzerfreundlichkeit und des Design ab. Da heutzutage die Website häufig eines der zentralen Instrumente für die Betreuung von Kunden und die Abwicklung von Geschäftsprozessen darstellt ist guter Web Content sehr wichtig. (vgl. KOOP 2001, S. 2f).
WebserviceWebservices sind Anwendungen für Softwaresysteme, die Daten automatisiert austauschen und/oder Funktionen auf entfernten Rechnern aufrufen. Es Gibt drei Grundlegende Standards für Webservices, dass sind die Grundlagenstandards SOAP (ursprünglich für Simple Object Access Protocol), WSDL (Web Services Description Language) und UDDI (Universal Description, Discovery and Integration). · Das XML (Extensible Markup Language) -basierte Protokoll SOAP dient dem standardisierten Informationsaustausch, sprich der Kommunikation – hier wird der eigentliche Aufruf gestartet.
· UDDI ist ein Verzeichnisdienst zur Registrierung – es dient dem Nutzer zum dynamischen Finden von Webservices. UDDI spezifiziert ein Netzwerk von öffentlichen Registrierungsstellen, in denen sich beispielsweise Unternehmen mit einem Verweis auf ihre WDSL-Datei registrieren lassen können – es entsteht eine Art globales Telefonbuch (vgl. SCHERFF 2006, S. 53).
WebportalWebportale sollen als zentraler Einstiegspunkt dienen, meist zu einem bestimmten Themengebiet. Sie verfolgen in der Regel die Integration von Anwendungen, Prozessen und Diensten. Bei Anwendung für geschäftliche Zwecke sind sie dann meist die erste Site die ein User anwählt um dann von dort aus einfach und billig seiner geschäftlichen Tätigkeit nach zugehen. Die Auswahl der Portale ist Geschmackssache des Users. Webportale sind mittlerweile sehr komplex und können personalisiert werden um für den Benutzer attraktiver zu werden. (vgl. LAUER 1999, S. 575f).
 Zusammenfassung Auch wenn der Umgang mit den Netzwerken und speziell mit dem Internet zum Alltag gehört, wissen nur wenige wie komplex das Zusammenspiel der einzelnen Rechner und der Netzwerke ist um uns unseren gewohnten Standard zu bieten. Schaut man nun in die Zukunft wird die Technik sich immer weiter entwickeln und es werden auch darauf aufbauend immer neue Dienste realisiert werden. Dies wird aber auch dazu führen das die Komplexität immer weiter voranschreitet, wenn nicht ein einheitlicher Standard definiert und umgesetzt wird.     Quellenverzeichnis
COMER 2002 COMER, Douglas: Computernetzwerke und Internets. 3. Auflage. München: Pearson Education, 2002
KOOP 2001 KOOP, Hans Jochen; Jäckel, Konrad; van Offern, Anja: Erfolgsfaktor Content Management. Wiesbaden: Friedr. Vieweg & Sohn Verlag, 2001
KYAS 2001 KYAS, Othmar; a Campo, Markus: Internet professionell. 2. Auflage. Bonn: MITP-Verlag, 2001
LAUER 1999 LAUER, Thomas: Internet – Kompedium. München: Markt & Technik, Buch- und Software-Verlag, 1999
SCHERFF 2006 SCHERFF, Jürgen: Grundkurs Computernetze. Wiesbaden: Friedr. Vieweg & Sohn Verlag, 2006   |