-*- coding: utf-8;-*-
## Title

          Converting a website to Gopher

                      by

                  Manu Raster


                 Bitreichcon 3
           Callenberg, 4 August 2019


## Monuments

* latin monēre to remember > german mahnen
 * a monument remembers us about something
 * monument appreciation
 * monument preservation
   * what is worth remembering?

* my website is older than most (1998)
 * it has grown ever since
 * what remains constant?
 * the url is https://www.mediensprache.net/
 * free of third party funding

## document workers

* text producers that care about their own texts (sometimes mess with layout, too)
 * regular authors
 * can work with any text processing tool
   * secretaries use Word but could do better, because ed is the standard
     editor and Donald Knuth taught his secretaries TeX

* document workers that care about both
 * typesetters, technical editors, typographists
 * take full advantage of Unix text processing tools
 * can fully dicriminate between text and layout

## care both: Unix and linguistics

* 1970s, linguistics was the coolest subject
 * related to ai (1st and 2nd waves – and winters)
* Example for Unix news
 * libc          https://www.mediensprache.net/de/news/20190802119880.aspx
 * critical
   * ai
   * systemd 'how to get rid of it in mainstream Linux installs'  https://www.mediensprache.net/de/news/20190501113785.aspx
   * facebook ''  https://www.mediensprache.net/de/news/20190505113790.aspx
 * buzzword analysis e.g. cyber, digital
   * deep learning
   * e-sport       https://www.mediensprache.net/de/news/20190730119875.aspx
* medialinguistics

## market

* Gopher and Http-based text retrieval popularly known as search engines
* specialized indexes for news, songs and scientific articles
 * Shimbun
* beware of buzzwords: harvesting, spidering,

## bad guys

* the whole trade of web design sucks
* it's all broken unless you write HTML by hand
* memory consumption (examples)
 * ulimit
 * dillo, w3m
 * html-pagers, simplistic html-parsing

## good guys

* handwritten HTML
 * Write HTML like LaTeX (like in the beginning when hypertext™ was a buzzword)
* static on the rise (irony: is static™ becoming a new buzzword?)

## file system

* literally, makes CMS obsolete
 * everything is a file
* examples
 * the Aminet directory (bottom-up)
 * library classification schemes
 * Unix file system hierarchy

## least common denominator

* ms-fs.tar.gz

 Mediensprache/
 Mediensprache/Literatur/
 Mediensprache/Literatur/Lexika/
 Mediensprache/Literatur/Korpora/
 Mediensprache/Literatur/Essays/
 Mediensprache/Literatur/Networx/
 Mediensprache/News/

* user management: useradd
 participation of interested readers

## licensing

* alternatives to CC-BY
* GFDL?
* US, EU, German laws
* Open Access
 * pronunciation
 * fuss
   * libraries and tax payers get shafted anyway
 * OA journals tend to lower quality, check the typographical quality
   * good typesetting and multi-column layout is not automatized
        * neither is proofreading

## Basic

* Ecma55 Basic
 http://www.mdpi.com/2073-431X/3/3/69
* Appendix of stories

## Standardbibliothek

GNU veröffentlicht libc 2.30

C ist die von Dennis Ritchie 1972 entwickelte Sprache zum Programmieren
portabler Betriebssysteme und Werkzeuge mit praktischen
Textschnittstellen. Vorgänger von C ist B von Kenneth Thompson (1970). Der
Sprachumfang ist schlank: Ein- und Ausgabefunktionen, Speicherverwaltung und
Zeichenketten (Strings) sind nicht in der Sprache selber, sondern in einer
Standardbibliothek definiert. C wird als problemorientierte, imperative
Programmiersprache der 3. Generation klassifiziert. Das Handbuch widmet Zeichen
(87), Strings (97) und Mustern (239) jeweils ausführliche Kapitel. editieren
[02.08.2019, 10:46 Uhr, Quelle: The GNU C Library Reference Manual]

https://www.mediensprache.net/de/news/20190802119880.aspx

## Programmieren ohne Programmiersprache

Neue pädagogische Angebote für Manager

Nur mit der Maus und graphischen Bauklötzen Computerprogramme zusammenstellen
ohne eine Zeile Code zu schreiben? – Über 200 solcher Low-Code-Baukästen soll es
schon auf dem Markt geben. Klassische pädagogische Einführungen in die Kunst des
Programmierens sind zum Beispiel Logo und Turtle-Grafik. Logo ist von Lisp
beeinflusst und bringt wichtige Konzepte wie Rekursion und Listenverarbeitung
mit. (Die Ausprägung dieser Fähigkeiten unterscheidet den Menschen von
intelligenten Affen, Chomsky et al. 2002: The evolution of the language
faculty.) Bildungsziele scheinen die aktuellen Low-Code-Werkzeuge jedoch keine
zu verfolgen. Sie richten sich auch nicht an Kinder, sondern an
Manager. Kritisch fragt ein Leser in der Diskussion: »Warum Programmierer
ersetzen? Low Management wäre einfacher und günstiger, denn dazu braucht man
keine extra Tools.« Ein anderer bringt eine programmiersprachliche Parallele zur
FLN (faculty of language in the narrow sense) ins Spiel: »Bei dem mistigen
Bloat, den man manchmal präsentiert bekommt, … reicht wohl auch eine Horde
dressierter Affen.« [01.08.2019, 12:24 Uhr, Quelle: Low Code: Brauchen
wir bald keine Programmierer mehr?]

Chomsky/Fitch/Hauser 2002: The Faculty of Language: What Is It, Who Has It, and
How Did It Evolve? (PDF)

https://www.mediensprache.net/de/news/20190801119877.aspx

## Sie nennen es Sport

Sportphilosophische Betrachtungen zum Begriff E-Sport

Seit der Verfügbarkeit schneller DSL-Anschlüsse müssen Computerfans nicht
mehr LAN-Partys organisieren, sondern können sich vernetzen, ohne das Haus zu
verlassen. Zum Schutz vor den negativen Folgen des einsamen Stubenzockens wie
zum Beispiel Bewegungsarmut, motorische Defizite, Schlafmangel, Fehlernährung,
soziale Exklusion und Spielsucht hat Südkorea 2011 das Cinderella-Gesetz
verabschiedet: Kindern unter 16 Jahren ist zwischen Mitternacht und 6 Uhr früh
das Spielen verboten. Sportvereinen, die an neuen jungen Mitgliedern
interessiert sind, und Firmen, die von »E-Sport« reden und Computerspiele
meinen, hält Sportphilosoph Volker Schürmann entgegen, dass der Begriff
»E-Sport« ein Marketingbegriff und »E-Games« proprietäre Handelsgüter
seien. Sport dagegen ist Gemeineigentum. [30.07.2019, 11:50 Uhr,
Quelle: APuZ, Robin Streppelhoff. Second Screen ;)]

https://www.mediensprache.net/de/news/20190730119875.aspx

## Der Teufel ist ein Eichhörnchen

Grundsätzliche Probleme automatischer Objekterkennung

Der Schlüssel zur Analyse von Text ist die Grammatik. Zusammen mit einem Lexikon
können wir so jeden Text verstehen. Bilder und Töne hingegen verstehen wir
ästhetisch und verordnen sie im Bereich der Kunst. Grammatiken und Wörterbüchern
vergleichbare Regelwerke, die Bilder und Musik aufschlüsseln, gibt es
nicht. Vielleicht hat sich bisher niemand dieser Arbeit angenommen, da
Kunstbanausen oder Maschinen keine attraktive Zielgruppe scheinen. Die KI-Szene
hofft indes auf eine crowdgesourcete™ Weltbeschreibung durch den bei
Wikipedianern (diejenigen, die die tollen Artikel schreiben – eine schwindende
Spezies, während die Gruppe der Konsumenten und Bürokraten stetig wächst) wenig
beliebten Aktenschrank Wikidata. Denn Objekte nur mit statistischen Methoden zu
klassifizieren, führt wie bei maschineller Übersetzung auffällig regelmäßig zu
Fehlern... [24.07.2019, 08:12 Uhr, Quelle: "Ist es ein Eichhörnchen
oder doch ein Seelöwe?" – Diskussion zu einer Sammlung regelmäßig falsch
identifizierter Tiere]

Hearst 1999. Untangling Text Data Mining – Überblick von Text- und Nichttextverarbeitungsmethoden

https://www.mediensprache.net/de/news/20190724119867.aspx

## Facegruft

Facebook im Jahre 2070

Als die CSU bei der letzten bayrischen Landtagswahl 160.000 Wähler an die AfD
und 170.000 an die Grünen verlor, stand sie vor der Vexierfrage ihren Kurs in
zwei gegensätzliche Richtungen zu ändern, um die verlorenen Wähler
wiederzugewinnen. Noch gefährlicher ist aber ein Konkurrent, der ihr sogar
240.000 Wähler abnahm, der kein Demokrat ist und gegen den alle PR-Manöver
wirkungslos sind. Der Tod. Es liegt in der Menschennatur den Sensenmann zu
unterschätzen und so überraschen uns manchmal Prognosen, die dies nicht tun, wie
zum Beispiel die des Oxforder Internet Instituts, wonach im Jahre 2070 mehr tote
als lebende Facebook-User registriert sein werden. [05.05.2019,
13:08 Uhr, Quelle: Öhmann / Watson "Death online"]

https://www.mediensprache.net/de/news/20190505113790.aspx


## Systemdfrei

Alternative Init-Systeme

Beim Starten eines Betriebssystems gibt es ein Programm mit der Prozess-ID 1,
das alle grundlegenden Geräte, Dienste und Dämonen startet, bis sich der User
einloggen kann, und während der gesamten Zeit bis zum Ausschalten läuft. Es ist
das Init-Programm, welches in zahlreichen Varianten vorliegt. Auf kleinen
Rechnern, Fritzboxen u.ä. arbeiten zwangsläufig effiziente Inits, aber auf Lap-
und Desktops ist oft das bei Hackern als grotesk angesehene Systemd aus dem
Hause Red Hat vorinstalliert, so dass mittlerweile zahlreiche Anleitungen über
diesen Bruch mit der Unix-Tradition aufklären und Alternativen
vorschlagen. Schon zwei kleine Befehle befreien etwa einen Ubuntu-PC von System:
»apt-get install upstart-sysv sysvinit-utils -y. update-initramfs -u. Reboot
your system so that systemd is no more the init system. Enjoy this and the next
moments with a good drink of your choice.« [01.05.2019, 10:45 Uhr,
Quelle: How to remove systemd]

https://www.mediensprache.net/de/news/20190501113785.aspx

## Ärgerlicher Webrelaunch

Der Preis für fragwürdige Features

Autoverleiher Hertz hat beim Outsourcing-Dienstleister Accenture eine Webseite
bestellt, die mit Corporate Design™ (Uniformierung), Responsive Design™
(unverzüglichen Rückmeldungen), einem schönen Frontend™
(Benutzerschnittstelle) und einer mobilen App aufwarten sollte. Bestellt,
geliefert, doch das an Featureitis erkrankte Produkt gefiel dann auch den
Hertz-Managern nicht, so daß sie nun ihr Geld zurück fordern: 32.000.000 $.
Eine große deutsche Behörde, das Arbeitsamt, hatte vor einigen Jahren sogar
165.000.000 € in einer ähnlichen Projektkonstellation für einen featurevollen
Online-Auftritt ausgeben müssen. [27.04.2019, 08:00 Uhr, Quelle: t3n]

https://www.mediensprache.net/de/news/20190427113781.aspx

## Der kluge Hans und seine Schulmeister

Wärmebilder bringen Licht ins Dunkel

Ähnlich wie der Besitzer des rechnenden Pferdes Kluger Hans wissen auch
heutige Schulmeister höherer und höchster Lehranstalten oft nicht, wie ihre
Intelligenzsimulationen eigentlich funktionieren. Sie haben die Kontrolle über
ihre Daten verloren. Der Umstand, daß die Heuhaufen zu groß seien, um sich im
Detail damit zu beschäftigen, ist Entschuldigung und Werbung zugleich: Big
Data. In den Geisteswissenschaften ist es schwieriger, Aussagen über Texte
zu machen, die man nicht gelesen, sondern nur ihre Wörter gezählt und
kombinatorisch verglichen hat. Eine solche Vorgehensweise wäre unphilologisch,
eine nicht ernst zu nehmende Spielerei. Um wenigstens im Nachhinein etwas
Licht in die dunklen Modelle des Deep Learnings zu bringen, wurde nun eine
Methode vorgestellt, die mit Wärmebildern zeigt, welche Details die Statistik
stärker beschäftigten als andere. Zum Beispiel fand ein aktuelles
KI-Bilderkennungsmodell bei der Erkennung eines Zuges vor allem gerade
verlaufende Gleise relevant, aber nicht den Zug selber oder die
Oberleitungen. [13.03.2019, 10:46 Uhr, Quelle: TU Berlin]

https://www.mediensprache.net/de/news/20190313111735.aspx

## KI im Herbst

Holzwege der statistischen Mustererkennung

Die aktuelle Ausgabe 24/2018 der Computerzeitschrift c't wartet mit drei
kritischen Artikeln zum Thema KI auf: (1) Neuronale Denkfehler – Künstliche
Intelligenz: zu naiv, um schlau zu sein. (2) Irren ist künstlich – Wo
künstliche Intelligenz noch schwächelt. (3) Statistik ist nicht Denken – Wie
sich künstliche Intelligenz von menschlicher unterscheidet. In allen drei
Artikeln geht es um nicht-linguistische Anwendungen wie z.B. Bilderkennung. Zu
den vermeintlichen Fortschritten automatischer Übersetzungssysteme seien noch
einmal die aktuellen Aufsätze und Vorträge von Douglas Hofstadter, zwar nicht
in deutscher Sprache, aber mit deutschen Übersetzungsaufgaben, empfohlen,
deren Fazit lautet: auch die populären App- und Web-Übersetzer sind immer noch
auf dem Stand von 1960 als Bar-Hillel »The Present Status of Automatic
Translation of Languages« mit den Anhängen (1) »Some Linguistic Obstacles to
Machine Translation« und (2) »A Demonstration of the Nonfeasibility of Fully
Automatic, High Quality Translation« verfasste. [13.11.2018, 09:50
Uhr, Quelle: heise.de [A. Trinkwalder]

https://www.mediensprache.net/de/news/20181113103625.aspx

## Die Schachtel war in der Feder

Trāns-fero, trānstulī, trānslātum, trānsferre, von einem Orte zum anderen
tragen, hinüber-, hintragen, -bringen, -setzen, -schaffen. Dies ist die
Etymologie von Translation, wie sie auch in den »Machine Translation«-Diensten
von Google Translate™ und Deepl™ steckt, wenn sie Wörter, Sätze und ganze
Texte von einer Sprache in eine andere übertragen. Wie diese Programme das tun
ist wegen ihrer proprietären Natur nur mittelbar durch Ausprobieren
herauszufinden. Aber schon einfache Tests geben ein ernüchterndes Bild über
die linguistische Qualität, die nach wie vor nicht der klassischen Kritik
(Bar-Hillel 1959) genügt. Neben grundsätzlichen Mängeln (»MT-ness of MT«)
dürften menschliche Übersetzer vor allem über die Verwendung von
Brückensprachen und Plagiaten in den populären Diensten staunen. editieren
[18.08.2018, 16:14 Uhr, Quelle: Hofstadter 2018 "Reflections on Machine
Translation"]

https://www.mediensprache.net/de/news/20180818100532.aspx