9 Speichermodell eines Prozesses

Um das Verhalten von C-Programmen besser zu verstehen, ist es hilfreich, eine (vereinfachte) Vorstellung von Programmen und Prozessen zu haben.

Ein Programm (oder ein Teil eines Programmes) kann in mehreren Formen auftreten, unter anderem:

als formfreie oder formalisierte Handlungsanweisung (Algorithmus)
als Quelltext in einer bestimmten Programmiersprache wie C
als Objektcode (das, was ein Compiler aus dem Quelltext produziert)
als ausführbares Programm in Form einer Datei (das Ergebnis des Linkvorgangs)
nach dem Starten (Laden) der Programmdatei als laufendes Programm im Speicher

Die letztere Form, also das Programm während der Ausführung, heißt üblicherweise Prozeß.

Je nach verwendetem Rechnersystem können solche Prozesse unterschiedlich dargestellt werden, aber viele Gemeinsamkeiten lassen sich erkennen, wenn man die Betrachtung weit genug vereinfacht. Im Folgenden beschränke ich mich auf wenige Punkte, die für das Verständnis von C-Programmen wesentlich sind; mehr Einzelheiten sind in allgemeineren Einführungen in die Informatik zu finden.

Ein Prozeß kann nur laufen, wenn eine entsprechende Systemumgebung vorhanden ist:

Arbeitsspeicher (random access memory, RAM) ist ein Speicher für Daten aller Art, die während der Ausführung eines Prozesses vorgehalten werden müssen, also für den auszuführenden Programmcode, die meisten Variablen, Zwischenergebnisse und ähnliches.
Der Arbeitsspeicher, den ein Prozeß sieht, besteht einfach aus einer langen Folge von Werten, die jeweils über eine Adresse angesprochen werden können. Eine solche Adresse ist nichts weiter als eine ganze Zahl zwischen 0 und einer systemabhängigen Obergrenze (typischerweise einige Megabyte bis einige Gigabyte). Eine Adresse ist in C als Wert eines Zeigers darstellbar und kann für alle dem Compiler bekannten Objekte mit Adreßoperator (&) beschafft werden.
Tatsächlich wird bei üblichen Systemen zwischen dem realen und dem virtuellen Speicher unterschieden. Auf den Unterschied wird hier nicht eingegangen; im Zweifelsfall geht es im Folgenden nur um den virtuellen Speicher.
ein Prozessor (central processing unit, CPU), der die Befehle des Programms (die in Maschinensprache vorliegen müssen) in der richtigen Reihenfolge ausführt.
Ein Prozessor hat neben verschiedenen funktionalen Einheiten (Rechenwerke, Steuerwerk etc.) einen Satz von Registern. Das sind sehr schnelle Speicher für Rechenoperanden, Ergebnisse usw.; ihre Anzahl ist begrenzt und sehr klein im Vergleich zum gesamten Prozeß (in der Regel nur für wenige oder maximal einige Dutzend Werte).
Typische Prozessoren haben einige allgemein verwendbare Register für ganze Zahlen, meist auch welche für Gleitkommazahlen, sowie Adreßregister, die zum Ansprechen von Daten im Arbeitsspeicher verwendet werden.
Einige Register haben eine besondere Bedeutung:
- der program counter (meist PC genannt) enthält die Adresse des nächsten auszuführenden Maschinenbefehls.
  Während ein Prozeß läuft, muß sein gesamter Programmcode im Arbeitsspeicher erreichbar sein.
  Bei jedem Laden eines Befehls aus dem Speicher wird der PC um die Länge des gelesenen Befehls automatisch weitergesetzt.
  Nach der Ausführung eines Befehls wird der nächste Befehl anhand des PC aus dem Speicher gelesen.
  Programmsprünge werden durchgeführt, indem dieses Register mit einer anderen Adresse überschrieben wird.
- Der stack pointer (SP, bei Intelprozessoren auch esp genannt) und der frame pointer (FP, bei Intel bp (,,base pointer``) oder ebp genannt) sind zwei eng verwandte Adreßregister, die in den weiter unten beschriebenen Stack zeigen.
sowie viele weitere Dinge, die hier nicht wichtig sind (Hardware, um Daten einzulesen oder auszugeben, ...)

Der Arbeitsspeicher eines Prozesses ist nun zumindest in folgende Bereiche, sogenannte Segmente unterteilt:

Das Codesegment (oft auch Textsegment genannt) enthält nach dem Laden des Programms den gesamten auszuführenden Programmcode (in Maschinensprache); in diesen Bereich zeigt hoffentlich der program counter.
Das Datensegment (data segment) enthält alle Daten, die während des gesamten Programmlaufs genau einmal existieren (alle globalen Variablen sowie die lokalen statischen), soweit sie bei Programmstart initialisiert werden müssen.
Das block storage segment (BSS) enthält analog alle globalen und lokalen statischen Variablen, die nicht initialisiert werden müssen. Die Unterscheidung zwischen initialisierten und nicht initialisierten Variablen wird üblicherweise getroffen, weil initialisierte Daten durch ihre Initialisierungswerte Platz in der Programmdatei belegen, den man sich für nicht initialisierte Variablen sparen kann (es genügt dem Betriebssystem, beim Laden die Gesamtgröße aller BSS-Daten zu kennen).
Der Stack (stack segment) nimmt Daten auf, die dynamisch zur Laufzeit in einer geordneten Reihenfolge entstehen und genau in der umgekehrten Reihenfolge nicht mehr benötigt werden.
Solche Daten sind:
- alle Argumente an aufgerufene Funktionen
- deren automatische Variablen (alle lokalen Variablen, die nicht als static deklariert sind)
- Rücksprungadressen (die Stelle im Programm, an der nach dem Ende einer Funktion fortgefahren werden soll)
- Registerinhalte, die für die Dauer eines Funktionsaufrufs in Sicherheit gebracht werden sollen
- teilweise Platz für Rückgabewerte von Funktionen (in C typischerweise für die Rückgabe von nicht elementaren Datentypen, also Feldern oder Strukturen)
- kurzfristig benötigter Platz für Zwischenergebnisse, beispielsweise bei arithmetischen Ausdrücken
Dazu wird einfach bei Programmstart ein ausreichend großer Bereich im Speicher reserviert (eben der Stack). Der Stack besteht immer aus zwei Teilen: ein zusammenhängender Bereich, der bereits belegt ist (üblicherweise der obere Teil), sowie der gesamte Rest, der noch frei ist.
Der Stackpointer zeigt nun zu jedem Zeitpunkt genau auf die Grenze zwischen dem freien und dem belegten Teil.
Um weitere Werte im Stack abzulegen, wird der Stackpointer um die Länge des Wertes erniedrigt (falls wie üblich der belegte Bereich über dem noch freien liegt), und der zu speichernde Wert an die Stelle kopiert, auf die der SP zeigt.
Der unterste Wert auf dem Stack (und nur dieser) kann freigegeben werden, indem der SP um die richtige Länge erhöht wird.
Der Aufruf einer C-Funktion sieht nun so aus, daß die zu übergebenden Parameter (von rechts her) nacheinander auf dem Stack abgelegt werden, dann werden zu rettende Register (zumindest der program counter und der gleich noch beschriebene frame pointer) abgelegt, und letztlich wird der SP noch um soviele Byte erniedrigt, wie alle automatischen Variablen Platz benötigen.
Wenn eine laufende Funktion a() eine weitere (b()) aufruft, wiederholt sich dieses Spiel: die an b() zu übergebenden Parameter, zu rettende Register und die von b() benötigten Variablen werden unterhalb des bereits belegten Stacks angelegt. Dadurch besteht zu jedem Zeitpunkt der belegte Stack aus eine Folge sogenannter stack frames aller gerade aktiven Funktionen. Ein stack frame einer Funktion enthält also die Parameter an die Funktion, gerettete Register, und lokale automatische Variablen.
Wenn eine aufgerufene Funktion mit ihrem Programmcode beginnt, kann sie nun auf alle ihre automatischen Variablen ebenso wie auf ihre Parameter zugreifen, indem sie zum Wert des SP einen bestimmten Offset addiert (der dem Compiler bereits bekannt ist, weil er die Größen aller Datentypen und damit alle Positionen im stack frame kennt; dieser Mechanismus heißt SP-relative Adressierung).
Während die Funktion aber läuft, wird sie weitere Werte auf dem Stack ablegen (zum Beispiel für Unterprogrammaufrufe) und sie wieder entfernen. Dadurch ändert sich der Wert des SP laufend, und auf ein und dieselbe Variable müßte ständig mit anderen Offsets zugegriffen werden. Um diesen Aufwand zu vermeiden, wird beim Start jeder Funktion der gerade aktuelle Wert des SP in das frame pointer-Register (FP) kopiert; dieses Register bleibt dann während der Abarbeitung der Funktion unverändert, und es kann anstatt SP-relativ über den FP auf automatische Variablen und Parameter zugegriffen werden, während sich der SP durchaus ändern kann.
Wird nun eine weitere Funktion aufgerufen, dann muß logischerweise der Inhalt des FP auf dem Stack gerettet werden, damit nach der Rückkehr wieder die lokalen Variablen korrekt adressiert werden, auch wenn die aufgerufene Funktion den FP zur Adressierung ihrer Variablen benutzt hat.
Der gesamte, nicht von den genannten Segmenten belegte Speicher, steht zur freien Verfügung des Programms, und heißt meistens Heap.
Dieser Heap wird in beliebiger Reihenfolge stückweise reserviert und wieder freigegeben, in C üblicherweise durch malloc() und free().

Alle diese Zusammenhänge sind im Abbildung 4 skizziert.

**Abbildung 4:** Typische Speichersegmente eines Prozesses
$\begin{figure}{\center\epsfxsize =\textwidth\epsffile{bildsegmentesrc.eps} } \end{figure}$

Der dargestellte Quelltext definiert einige Objekte im Speicher (die Einfärbung der einzelnen Elemente entspricht den zugehörigen Speicherbereichen):

zwei globale Variablen: die initialisierte Variable global1 wird im Datensegment liegen, während die nicht initialisierte Variable global2 im BSS untergebracht wird.
up() bekommt zwei Parameter a und b, die beim Aufruf der Funktion auf dem Stack angelegt werden
In up() sind zwei lokale Variablen definiert: summe ist eine automatische Variable, die auf dem Stack angelegt wird, während zaehler als static deklariert ist und bei Programmstart initialisiert wird; deshalb liegt sie Datensegment.
main() wird ebenfalls mit zwei Argumenten aufgerufen (nargs und args), die sich auf dem Stack befinden.
i1 und p sind lokale automatische Variablen im Stacksegment.
Von malloc() wird Speicher im Heap reserviert: die Objekte p[0] bis p[9] sind demnach im Heap (aber p, also die Zeigervariable, die sich die Heapadresse merkt, liegt im Stack!).

AnyWare@Wachtler.de