1905307

Unter der Haube: So funktionieren Browser

31.08.2014 | 09:34 Uhr |

Für viele Nutzer sind Browser und Internet praktisch identisch. Doch was passiert eigentlich genau, wenn sich eine Webseite öffnet, und wie kommen die Seiten in den Browser?

Webbrowser sind heute die meistgenutzten Programme auf dem PC. Sie liefern Informationen zu beliebigen Themen, dienen der Kommunikation in sozialen Netzwerken und ermöglichen Online- Shopping und Online-Banking. Dass der Browser und mit ihm das Internet eine solche Entwicklung nehmen würden, war vor mehr als 20 Jahren noch nicht absehbar – damals 1989 entstand die Idee des World Wide Web.

Erste Browser und der „Browserkrieg“

Der erste populäre Browser NCSA Mosaic konnte 1993 immerhin bereits Bilder im eigenen Fenster darstellen. Wer hätte gedacht, dass ein derart unscheinbares Programm die zentrale Software auf allen internetfähigen Geräten werden könnte? Ein Jahr später gründete der Leiter des Entwicklerteams die Mosaic Communications Corporation, die kurz darauf in Netscape Communications Corporation umgetauft wurde. Der allererste Browser war Mosaic jedoch nicht: Schon 1990 hatte Tim Berners-Lee am Genfer CERN einen Browser unter dem Namen „Worldwideweb“ veröffentlicht. Der lief jedoch nur auf wenig verbreiteten Next-Step-Rechnern und konnte keine Bilder anzeigen. Der Netscape Navigator blieb der wichtigste Browser, bis Microsoft das Internet entdeckte. Dessen Internet Explorer war zwar miserabel programmiert und missachtete geltende Standards, aber er kam zusammen mit Windows. Für viele Nutzer wurde das blaue „e“ auf dem Desktop der Standardweg ins Web. Zumindest in Deutschland hat aber doch Netscape den „Browserkrieg“ gewonnen, denn hier hat Firefox den größten Marktanteil. Die Mozilla Foundation wurde von Netscape gegründet, und der Netscape-Quellcode bildet die Grundlage für den heutigen Firefox.

Die besten Add-Ons für Firefox

NCSA Mosaic war der erste populäre Browser. An den funktionen hat sich bis heute nichts Grundlegendes geändert. es gibt immer noch eine Adresszeile und ein paar Schaltflächen für die Navigation.
Vergrößern NCSA Mosaic war der erste populäre Browser. An den funktionen hat sich bis heute nichts Grundlegendes geändert. es gibt immer noch eine Adresszeile und ein paar Schaltflächen für die Navigation.

Das World Wide Web als Kommunikationsbasis

Heute öffnen wir Seiten aus aller Welt, laden Dateien herunter und sehen uns Videos an. Solcher Datenaustausch ist jedoch weder trivial noch selbstverständlich: Das weiß jeder, der schon einmal versucht hat, Textdokumente mit dem „falschen“ Programm zu öffnen. Vor ähnlichen Problemen stand in den 90er-Jahren auch Tim Berners-Lee in Genf. Der Datentransfer zwischen den französischen und den Schweizer Laboratorien des CERN war aufgrund der unterschiedlichen Netzwerkinfrastruktur schwierig und stand dem Wissensaustausch im Wege. Es ging Lee aber nicht nur um den Datenaustausch. Er wollte ein frei zugängliches Wissensnetz, in dem alles mit allem verknüpft ist. Und es sollte jedem möglich sein, eigenes Wissen einzubringen.

Für ein derartiges Netzwerk benötigt man folgende Zutaten:

• eine Textauszeichnungssprache, die Informationen strukturiert und verknüpft

• einen Editor, mit dem sich die Texte erstellen lassen • eine Server-Software (Webserver), die Daten im Netz bereitstellt

• eine Client-Software (Browser), die auf jedem PC läuft und Inhalte vom Server abrufen kann

Lee hatte die nötigen Komponenten bald erstellt, zumal er das Rad nicht neu erfinden musste: Eine Textauszeichnungssprache ließ sich auf der Basis von SGML (Standard Generalized Markup Language) entwickeln. (S)GML war schon 1969 für die Strukturierung etwa von Büchern in Kapitel, Überschriften und Abschnitte entstanden. Dabei kommen Elemente in der Form „<elem> … </elem>“ zum Einsatz, die als Tags (Etikett, Markierung) bezeichnet werden. Berners-Lee fügte noch ein Element für Hyperlinks hinzu, über das sich Dokumente und Bilder verknüpfen lassen, und nannte das Ganze deshalb HTML (Hypertext Markup Language). Da HTML in einfachen Textdateien gespeichert wird, gibt es für einen Editor keine besonderen Anforderungen.

Der Server war dagegen schwieriger zu entwickeln, denn zuvor musste erst das Netzprotokoll HTTP (Hypertext Transfer Protocol) definiert werden, das die Kommunikation zwischen HTML/Webserver und Client (Browser) regelt. Ähnliches gab es bereits – und gibt es bis heute – mit dem Namen FTP (File Transfer Protocol) für die Übertragung von Dateien. Zuletzt benötigte Lee nur noch ein Programm, das HTML-Dateien per HTTP vom Webserver abruft und lesbar aufbereitet.

So halten Sie Ihren Browser frei von Adware

Mit dem Blick in den HTML-Quelltext erkunden versierte Webnutzer die innere Struktur einer Webseite. Der Browser setzt die HTML-tags in den spitzen Klammern visuell um.
Vergrößern Mit dem Blick in den HTML-Quelltext erkunden versierte Webnutzer die innere Struktur einer Webseite. Der Browser setzt die HTML-tags in den spitzen Klammern visuell um.

So funktioniert ein Webbrowser

Am grundsätzlichen Aufbau eines Browsers hat sich bis heute wenig geändert. Im Fenster erscheint der Inhalt der Webseite, der Nutzer klickt auf Text- oder Bild-Links und gelangt zu weiteren Webseiten. Mit „Vorwärts“- und „Zurück“-Schaltflächen lässt sich zwischen den aufgerufenen Seiten blättern, und eine Home-Schaltfläche führt zurück zur Startseite. Daher auch der Begriff „Browser“, der sich von „browsen“ ableitet, womit ursprünglich die Navigation in Textdateien über Schaltflächen wie „Vor“ und „Zurück“ bezeichnet wurde.

Der Aufruf einer Seite erfolgt durch Eingabe einer Webadresse in der Form http://www.domain.de (URL, Uniform Resource Locator) in die Adresszeile und Bestätigung mit der Enter-Taste. „http://“ kann man weglassen, weil es der Browser automatisch ergänzt. Wer von einem FTP-Server Dateien herunterladen will stellt ein „ftp://“ voran. Auch das „www.“ ist inzwischen eigentlich entbehrlich, denn unter den meisten Internet-Domains ist ohnehin nur ein Webserver erreichbar. Technisch gesehen handelt es sich bei „www“ um eine Sub-Domain. Das ermöglicht Anbietern, beim Aufruf von „domain.de“ mit „xyz.domain.de“ oder „www.domain. de“ unterschiedliche Seiten auszuliefern.

Was im Hintergrund passiert: Der Aufruf einer Adresse, gleich ob per Klick auf einen Link oder per direkter Eingabe, führt zunächst zu einer Anfrage beim DNS-Server (Domain Name System). Dieser kennt die IPNummer der aufgerufenen Internet-Domain und teilt sie dem PC beziehungsweise dem DSL-Router mit. Nun kann die Kommunikation zwischen Webserver und Browser stattfinden. Der DSL-Router dient dabei als Umsetzer für die öffentliche IP-Nummer, die Sie vom Internet-Provider erhalten, und der IPNummer Ihres PCs im lokalen Netzwerk. Der Browser fordert über das Hypertext Transfer Protocol (HTTP) den Server auf, eine Webseite zu senden. Wurde nur der Domain- Name in der Form „www.domain.de“ angegeben, sendet der Server seine Startseite. Hängt an der URL ein Pfad, beispielsweise „www.domain.de/eindokument.html“, liefert der Server die angeforderte Datei. Ist diese nicht vorhanden, gibt der Server einen 404-Fehler zurück („Seite nicht gefunden“).

Der PC-WELT-Browsercheck - Sind Sie im Web sicher unterwegs?

Der Browser speichert die gelieferte HTML-Datei mit allen Elementen in einem Zwischenspeicher (Cache) auf der Festplatte und lädt sie dann von dort. Mehrfach verwendete Elemente müssen nicht erneut über das Netz geladen werden. Jede HTML-Datei wird von oben nach unten gelesen und die Struktur interpretiert („parsen“). Das Ergebnis ist eine Datenstruktur, die der Browser in Text mit Formatierungen, Farben und Bildern an den richtigen Positionen visuell umsetzt („rendern“).

Heutige Webseiten bestehen jedoch nicht nur aus HTML-Code. Hinzu kommt noch CSS (Cascading Style Sheets). Die HTML-Datei enthält die logische Struktur eines Textes mit Überschriften und Absätzen, CSS sorgt für die Formatierung, also für unterschiedliche Schriftarten und Größen, die Farben und die Positionierung von Textblöcken und Bildern.

Für die Dynamik von Webseiten sorgt Javascript, das der Browser ebenfalls interpretieren muss. Per Javascript lassen sich HTML- oder CSS-Elemente ändern, nachdem der Browser diese bereits dargestellt hat. Das kommt etwa zum Einsatz, wenn Sie auf eine Schaltfläche klicken, im Hintergrund eine Datenbank abgefragt wird und das Ergebnis dann direkt in der Webseite erscheint. Ohne Javascript müsste der Browser die Webseite umständlich neu laden. Diese Technik ermöglicht komplexe Webanwendungen wie Text- oder Fotobearbeitung.

Was Browser selbst nicht können, übernehmen Plug-ins wie Flash, Java oder Adobe Reader. Dabei handelt es sich um externe Programme, an die der Browser die Inhalte nur weiterreicht. Plug-ins sind daher etwas anderes als interne Add-ons oder Erweiterungen, welche die Browser-Funktionen ergänzen.

0 Kommentare zu diesem Artikel
1905307