In der Vorbemerkung wurde schon darauf hingewiesen, daß in dieser Arbeit ein für geistes- und sozialwissenschaftliche Fragestellungen ungewöhnlich stark ausgeprägter technischer, d.h. hier, auf Bedingungen und Folgen der Verwendung von Computerprogrammen bezogener Aspekt zu bearbeiten ist. Das ist unvermeidbar. Einerseits hat ein Computer als Schreibgerät ein wesentlich größeres `Eigenleben' als z.B. ein Bleistift. Andererseits aber hat die Behandlung technischer Vorgänge in der Sprachwissenschaft auch Tradition, z.B. in der Phonetik mit der anatomisch- physiologischen Lautbeschreibung. Für die Beschreibung von Sprache ist die Berücksichtigung der technischen Determinanten ihrer Entstehung unverzichtbar. Brinker und Sager entwickeln diese Position ausführlich für die Gesprächsanalyse, wobei sie m.E. auf jeden anderen Teilbereich der Sprachwissenschaft anzuwenden ist. Demnach kann der Analytiker keine Gespräche hinreichend beschreiben, deren Sprache er nicht beherrscht, deren Wissenskontexte ihm fremd sind, deren Interaktionsnormen er nicht nachvollziehen und deren institutionelle Strukturen er nicht durchschauen kann. Sie fassen zusammen:
``Nur die Gespräche können in methodologischer Hinsicht als befriedigend analysiert gelten, die der Analytiker nach der Untersuchung so oder ähnlich auch selber zu führen imstande wäre.''
Deshalb hat diese Arbeit für mich mit einer grundsätzlichen Einarbeitung in die Computer- und Netzwerktechnologie begonnen; deshalb ist hier auch der Ort für einige grundsätzliche Begriffsklärungen.
Die Funktionsweise eines Computers im Netzwerkbetrieb kann man sich mit einem Ebenenmodell veranschaulichen. Auf der untersten Ebene, der Ebene I, befinden sich lediglich physikalische Binäreinheiten, sog. Bits: Ihre Daseinsweise erschöpft sich im Gegensatz `Strom fließt' oder `Strom fließt nicht', bzw. der Schalter/Transistor steht auf `Ein' oder `Aus'. Bits sind also, abstrakter formuliert, mit `0' oder `1' belegt. Auf Ebene II steht die Maschinensprache, in der die Bits in komplexere Strukturen zusammengefaßt werden. Auf Ebene III liegen die Programmiersprachen, in denen `primäre' Programme und damit v.a. Betriebssysteme geschrieben sind. Die Ebene des Betriebssystems, Ebene IV, ist normalerweise die erste Ebene, die dem Anwender erfahrbar ist. Aufgabe eines Betriebssystems ist es im wesentlichen, natürliche (englische) Sprache in Maschinensprache zu übersetzen und dadurch dem Computer Eingaben des Anwenders `verständlich' zu machen. Außerdem bilden Betriebssysteme die Grundlage für `sekundäre' Programme, die nur auf der Basis von Betriebssystemen funktionieren. Gängige Betriebssysteme im Bereich der Datenfernübertragung sind für (universitäre) Großrechner z.B. UNIX und das sog. Virtual Memory System (VMS); für die verbreiteten Computer, die mit denen der Firma IBM kompatible sind, sind es z.B. LINUX (eine Sonderform von UNIX) und das Operating System 2 (OS/2). Das Betriebssystem DOS der Firma Microsoft ist zunächst nicht für die Datenfernübertragung ausgelegt. Auf die Ebene des Betriebssystems (Ebene IV) folgt die Ebene der Shell (Ebene V). Eine Shell ist im Prinzip ein Programm, das zusätzlich zur Grundleistung des Betriebssystems Elemente natürlicher (englischer) Sprache versteht und nun dem Betriebssystem `übersetzt'. Eine Shell dient dazu, die Arbeit mit dem Betriebsystem einfacher zu machen. Gängigste Shell für UNIX ist die Bourne Again Shell (BASH). Das verbreitete Programm WINDOWS läßt sich als eine zusätzliche Shell für DOS begreifen. Auf Ebene VI stehen nun die sekundären Programme, Anwendungsprogramme. Solche Anwendungsprogramme sind der Newsreader TIN oder das Programm TALK, daneben befinden sich Standardfunktionen wie das File Transfer Protocol (FTP), mit dem sich Dateien von einem Rechner auf einen anderen übertragen lassen. Aber auch die verschiedenen schon genannten Protokollstandards, durch die erst eine Netzwerkverbindung zustande kommt - TCP/IP, NNTP, PPP -, stehen letztlich als Programme auf dieser Ebene. Für diese Arbeit nicht benutzte aber mittlerweile sehr verbreitete Programme sind sog. WWW-Browser wie MOSAIC oder NETSCAPE. Diese Programme stehen als zusätzliche Bedienungshilfen zwischen der Shell auf Ebene V und der eigentlichen Funktion (z.B. FTP), die dann auf Ebene VII verschoben wird. Durch eine graphisch aufwendige Benutzeroberfläche wird die Ausführung von Funktionen für den unerfahrenen Benutzer erleichtert. WWW steht für World Wide Web. Damit ist ein noch in der Entwicklung begriffenes Hypertextsystem bezeichnet, das die Komplexität des beschriebenen Funktionsaufbaus der Computer- und Netzwerktechnologie vergessen machen und durch einfaches `Anklicken' der gewünschten Funktion ersetzen soll.
Das vorliegende Korpus wurde auf einem UNIX-Großrechner im Zentrum für Datenverarbeitung der Mainzer Universität unter Verwendung des Newsreaders TIN erstellt. Die Oberflächendarstellung erfolgte im 7-Bit-ASCII-Modus. In diesem Modus werden die ersten 128 Zeichen des American Standard Code for Information Interchange (ASCII) übertragen, bzw. verarbeitet. Die ersten 7 Bits haben die Werte 1 - 2 - 4 - 8 - 16 - 32 - 64. Wenn sie alle mit `1' belegt sind, ergibt die Summe der Werte 127, woraus sich zusammen mit der `0' die Zahl 128 erklärt. Jedem möglichen Wert ist ein Zeichen zugeordnet. Unter diesen 128 Zeichen befinden sich die Buchstaben des englischen Alphabets, die arabischen Zahlen, Interpunktions- und einige Computersonderzeichen, jedoch nicht die deutschen Umlautzeichen oder `ß'. An ihrer Stelle sind im 7-Bit- ASCII-Modus Lücken im Text. Mittlerweile ist auch der `normale' 8-Bit-ASCII-Modus üblich, der 256 Zeichen verarbeitet, darunter auch die deutschen Umlaute.'ß' hat z.B. den ASCII-Wert 225, `ü' 129 und `Ä' 142. `Normal' deshalb, weil die im Vergleich zum Bit nächsthöhere Struktureinheit, das Byte, 8 Bits mit den Werten 1 - 2 - 4 - 8 - 16 - 32 - 64 - 128 und damit 256 Kombinationsmöglichkeiten umfaßt. Die neueste Entwicklung ist der MIME-Standard (MIME repräsentiert Multipurpose Internet Mail Extensions), der ganz neue Übertragungsmöglichkeiten schafft, sich jedoch noch nicht durchgesetzt hat.
Durch diese unterschiedlichen Standards bekommen Anwender, die das System nicht gut kennen, Probleme, die im vorliegenden Korpus dokumentiert sind:
>> Jedenfalls hat es mir mal so einer von der Kripo erzShlt.
>Ja genau so ist das ... deshalb haben die damit ja auch eine Zeit ganz
>aufgeh”rt, (dann mnssen sich wohl die Dekoderhersteller beschert haben :-(
(a012)
Es ist nunmal so, daá in der heutigen Zeit L"nder sich in der Weltpolitik
oftmal nur profilieren k~nnen, indem sie
ihre Streitm"chte in Kriesengebiete,unter F hrung der UN, schicken.
Frankreich, Italien, Groábritannien sowie
(a124)
ich bin auf der suche nach ein Frontend f=FCr UUCP unter Windows 3.11.Wer kann
mir dabei helfen eins zu finden und wollm=F6glich auch noch
(a188)
In a012 ist <ä>
durch <S>
(erzShlt
), <ö>
durch <÷>
(aufgeh÷rt
) und <ü>
durch <n>
(mnssen) ersetzt. In a124
steht anstelle von <ß>
<á>
(daá
), anstelle von <ä>
<">
(L"nder
), für <ö>
<~>
(k~nnen
) und für <ü>
< >
(F hrung
).
In a188 schließlich wird <ü>
durch <=FC>
(f=FCr
) und <ö>
durch <=F6>
(wollm=F6glich
) vertreten. Die
`Ersatzzeichen' in a188 sind schon beim Schreiben mit
einem Editor im 7-Bit-Modus (wahrscheinlich in TIN oder
PINE) durch die nicht vorgesehene Benutzung der Tasten
für Umlaute entstanden, die mit den angeführten
Zeichenfolgen belegt waren. Eine Korrektur des
Geschriebenen hat dann offensichtlich nicht mehr
stattgefunden. Über die Umwandlung der Zeichen in a012
und a124 kann man nur spekulieren. Vermutlich wurde mit
einem Editor mindestens im 8-Bit-Modus gearbeitet, die
Übertragung erfolgte dann aber streckenweise nur im 7-Bit-
Modus, wodurch die Umlaute und `ß' in Zeichen des 7-Bit-
Zeichensatzes umgewandelt wurden.