In der Vorbemerkung wurde schon darauf hingewiesen, daß in dieser Arbeit ein für geistes- und sozialwissenschaftliche Fragestellungen ungewöhnlich stark ausgeprägter technischer, d.h. hier, auf Bedingungen und Folgen der Verwendung von Computerprogrammen bezogener Aspekt zu bearbeiten ist. Das ist unvermeidbar. Einerseits hat ein Computer als Schreibgerät ein wesentlich größeres `Eigenleben' als z.B. ein Bleistift. Andererseits aber hat die Behandlung technischer Vorgänge in der Sprachwissenschaft auch Tradition, z.B. in der Phonetik mit der anatomisch- physiologischen Lautbeschreibung. Für die Beschreibung von Sprache ist die Berücksichtigung der technischen Determinanten ihrer Entstehung unverzichtbar. Brinker und Sager entwickeln diese Position ausführlich für die Gesprächsanalyse, wobei sie m.E. auf jeden anderen Teilbereich der Sprachwissenschaft anzuwenden ist. Demnach kann der Analytiker keine Gespräche hinreichend beschreiben, deren Sprache er nicht beherrscht, deren Wissenskontexte ihm fremd sind, deren Interaktionsnormen er nicht nachvollziehen und deren institutionelle Strukturen er nicht durchschauen kann. Sie fassen zusammen:
``Nur die Gespräche können in methodologischer Hinsicht als befriedigend analysiert gelten, die der Analytiker nach der Untersuchung so oder ähnlich auch selber zu führen imstande wäre.''
Deshalb hat diese Arbeit für mich mit einer grundsätzlichen Einarbeitung in die Computer- und Netzwerktechnologie begonnen; deshalb ist hier auch der Ort für einige grundsätzliche Begriffsklärungen.
Die Funktionsweise eines Computers im Netzwerkbetrieb
kann man sich mit einem Ebenenmodell veranschaulichen.
Auf der untersten Ebene, der Ebene I, befinden sich
lediglich physikalische Binäreinheiten, sog. Bits: Ihre
Daseinsweise erschöpft sich im Gegensatz `Strom fließt'
oder `Strom fließt nicht', bzw. der Schalter/Transistor
steht auf `Ein' oder `Aus'. Bits sind also, abstrakter
formuliert, mit `0' oder `1' belegt. Auf Ebene II steht
die Maschinensprache, in der die Bits in komplexere
Strukturen zusammengefaßt werden. Auf Ebene III liegen
die Programmiersprachen, in denen `primäre' Programme und
damit v.a. Betriebssysteme geschrieben sind. Die Ebene
des Betriebssystems, Ebene IV, ist normalerweise die
erste Ebene, die dem Anwender erfahrbar ist. Aufgabe
eines Betriebssystems ist es im wesentlichen, natürliche
(englische) Sprache in Maschinensprache zu übersetzen und
dadurch dem Computer Eingaben des Anwenders
`verständlich' zu machen. Außerdem bilden Betriebssysteme
die Grundlage für `sekundäre' Programme, die nur auf der
Basis von Betriebssystemen funktionieren. Gängige
Betriebssysteme im Bereich der Datenfernübertragung sind
für (universitäre) Großrechner z.B. UNIX und das sog.
Virtual Memory System (VMS); für die verbreiteten
Computer, die mit denen der Firma IBM kompatible sind,
sind es z.B. LINUX (eine Sonderform von UNIX) und das
Operating System 2 (OS/2). Das Betriebssystem DOS der
Firma Microsoft ist zunächst nicht für die
Datenfernübertragung ausgelegt. Auf die Ebene des
Betriebssystems (Ebene IV) folgt die Ebene der Shell
(Ebene V). Eine Shell ist im Prinzip ein Programm, das
zusätzlich zur Grundleistung des Betriebssystems Elemente
natürlicher (englischer) Sprache versteht und nun dem
Betriebssystem `übersetzt'. Eine Shell dient dazu, die
Arbeit mit dem Betriebsystem einfacher zu machen.
Gängigste Shell für UNIX ist die Bourne Again Shell
(BASH). Das verbreitete Programm WINDOWS läßt sich als
eine zusätzliche Shell für DOS begreifen. Auf Ebene VI
stehen nun die sekundären Programme, Anwendungsprogramme.
Solche Anwendungsprogramme sind der Newsreader TIN oder
das Programm TALK, daneben befinden sich
Standardfunktionen wie das File Transfer Protocol (FTP),
mit dem sich Dateien von einem Rechner auf einen anderen
übertragen lassen. Aber auch die verschiedenen schon
genannten Protokollstandards, durch die erst eine
Netzwerkverbindung zustande kommt - TCP/IP, NNTP, PPP -,
stehen letztlich als Programme auf dieser Ebene. Für
diese Arbeit nicht benutzte aber mittlerweile sehr
verbreitete Programme sind sog. WWW-Browser wie MOSAIC
oder NETSCAPE. Diese Programme stehen als zusätzliche
Bedienungshilfen zwischen der Shell auf Ebene V und der
eigentlichen Funktion (z.B. FTP), die dann auf Ebene VII
verschoben wird. Durch eine graphisch aufwendige
Benutzeroberfläche wird die Ausführung von Funktionen für
den unerfahrenen Benutzer erleichtert. WWW steht für
World Wide Web. Damit ist ein noch in der Entwicklung
begriffenes Hypertextsystem bezeichnet, das die
Komplexität des beschriebenen Funktionsaufbaus der
Computer- und Netzwerktechnologie vergessen machen und
durch einfaches `Anklicken' der gewünschten Funktion
ersetzen soll.
Das vorliegende Korpus wurde auf einem UNIX-Großrechner im Zentrum für Datenverarbeitung der Mainzer Universität unter Verwendung des Newsreaders TIN erstellt. Die Oberflächendarstellung erfolgte im 7-Bit-ASCII-Modus. In diesem Modus werden die ersten 128 Zeichen des American Standard Code for Information Interchange (ASCII) übertragen, bzw. verarbeitet. Die ersten 7 Bits haben die Werte 1 - 2 - 4 - 8 - 16 - 32 - 64. Wenn sie alle mit `1' belegt sind, ergibt die Summe der Werte 127, woraus sich zusammen mit der `0' die Zahl 128 erklärt. Jedem möglichen Wert ist ein Zeichen zugeordnet. Unter diesen 128 Zeichen befinden sich die Buchstaben des englischen Alphabets, die arabischen Zahlen, Interpunktions- und einige Computersonderzeichen, jedoch nicht die deutschen Umlautzeichen oder `ß'. An ihrer Stelle sind im 7-Bit- ASCII-Modus Lücken im Text. Mittlerweile ist auch der `normale' 8-Bit-ASCII-Modus üblich, der 256 Zeichen verarbeitet, darunter auch die deutschen Umlaute.'ß' hat z.B. den ASCII-Wert 225, `ü' 129 und `Ä' 142. `Normal' deshalb, weil die im Vergleich zum Bit nächsthöhere Struktureinheit, das Byte, 8 Bits mit den Werten 1 - 2 - 4 - 8 - 16 - 32 - 64 - 128 und damit 256 Kombinationsmöglichkeiten umfaßt. Die neueste Entwicklung ist der MIME-Standard (MIME repräsentiert Multipurpose Internet Mail Extensions), der ganz neue Übertragungsmöglichkeiten schafft, sich jedoch noch nicht durchgesetzt hat.
Durch diese unterschiedlichen Standards bekommen Anwender, die das System nicht gut kennen, Probleme, die im vorliegenden Korpus dokumentiert sind:
>> Jedenfalls hat es mir mal so einer von der Kripo erzShlt.
>Ja genau so ist das ... deshalb haben die damit ja auch eine Zeit ganz
>aufgeh”rt, (dann mnssen sich wohl die Dekoderhersteller beschert haben :-(
(a012)
Es ist nunmal so, daá in der heutigen Zeit L"nder sich in der Weltpolitik
oftmal nur profilieren k~nnen, indem sie
ihre Streitm"chte in Kriesengebiete,unter F hrung der UN, schicken.
Frankreich, Italien, Groábritannien sowie
(a124)
ich bin auf der suche nach ein Frontend f=FCr UUCP unter Windows 3.11.Wer kann
mir dabei helfen eins zu finden und wollm=F6glich auch noch
(a188)
In a012 ist <ä>
durch <S>
(erzShlt
), <ö>
durch <÷>
(aufgeh÷rt
) und <ü>
durch <n>
(mnssen) ersetzt. In a124
steht anstelle von <ß>
<á>
(daá
), anstelle von <ä>
<">
(L"nder
), für <ö>
<~>
(k~nnen
) und für <ü>
< >
(F hrung
).
In a188 schließlich wird <ü>
durch <=FC>
(f=FCr
) und <ö>
durch <=F6>
(wollm=F6glich
) vertreten. Die
`Ersatzzeichen' in a188 sind schon beim Schreiben mit
einem Editor im 7-Bit-Modus (wahrscheinlich in TIN oder
PINE) durch die nicht vorgesehene Benutzung der Tasten
für Umlaute entstanden, die mit den angeführten
Zeichenfolgen belegt waren. Eine Korrektur des
Geschriebenen hat dann offensichtlich nicht mehr
stattgefunden. Über die Umwandlung der Zeichen in a012
und a124 kann man nur spekulieren. Vermutlich wurde mit
einem Editor mindestens im 8-Bit-Modus gearbeitet, die
Übertragung erfolgte dann aber streckenweise nur im 7-Bit-
Modus, wodurch die Umlaute und `ß' in Zeichen des 7-Bit-
Zeichensatzes umgewandelt wurden.