Wissenschaftliches Schreiben im Klartext: Markup und Pandoc

Geschrieben am 16.01.2018

„Plain Text” steht für einfache und klare Textdateien. Solche Textdateien werden häufig in Code-Editoren erstellt, wie etwa Atom, Emacs oder auch Notepad+. Im Gegensatz zu den Textverarbeitungen in verbreiteten Office-Systemen wie Microsoft Word oder LibeOffice ist das Schreiben im Plain Text deutlich reduzierter. „Markups” sind in diesem Kontext weit verbreitet und ermöglichen das Formatieren solcher Textdateien, indem sie Auszeichnungen etwa für Aufzählungen, Listen, Überschriften etc. definieren. Pandoc ist eine Software, die solche Markups in eine Vielzahl von Formaten konvertieren kann. Hierdurch wird Plain Text zu einem recht flexiblen Textformat.

Im Netz wird fleißig über die Vor- und Nachteile des wissenschaftlichen Schreiben mit Pandoc gebloggt. Interessant finde ich folgende Überlegungen, die ich z.T. irgendwo gelesen habe:

  • Das Schreiben von Texten wird durch Markup auf das wesentliche reduziert. Mitunter empfinden es Autorinnen und Autoren als störend, dass beim Schreiben eines Textes bereits das Layout zur Disposition steht. Programme wie Word und LibreOffice erlauben stets das Anpassen von Schriftarten, Seitenformatierungen etc. Und auch wenn man solche Einstellungen nicht vornimmt, so ist auch das eine Entscheidung für ein Layout. Dabei ist es oftmals gar nicht die Aufgabe der Autorin bzw. des Autors eines wissenschaftlichen Textes, diesen ästhetisch zu gestalten. Bei Markup ist das Layout deutlicher vom Text getrennt.

  • Die Ausgabeformate sind vielfältiger und der Wechsel zwischen verschiedenen Vorlagen ist einfacher. Das Umformatieren von Texten in Word oder LibreOffice ist oft doch nicht so einfach wie gedacht. Pandoc erscheint mir hier flexibler zu sein, indem es noch mehr Ausgabeformate ermöglicht. So kann Markup nicht nur als Text, sondern auch als Webseite oder Präsentation ausgegeben werden. Teilweise sind die Vorlagen schon an die Anforderungen spezieller Journals angepasst.

  • Plain Text bietet eine hohe Kompatibilität insbesondere zu LaTex und HTML5 als Ausgabeformate und zu R bzw. Skriptsprachen wie Python als Evaluationstools. HTML5 wiederum ist insbesondere im Kontext von E-Learning interessant, denn es ermöglicht interaktive Inhalte.

Diesen Vorteilen steht entgegen, dass viele Journals (nur) .doc-Dateien zur Einreichung akzeptieren und die höchste Kompatibilität zu diesem Format hat einfach Microsoft Word. Außerdem ist das Schreiben in solchen Textverarbeitungsprogrammen einfacher zu erlernen. Und auch hier können viele Ausgabeformate ausgewählt werden. Es bleibt also letztlich ein Abwägen und eine individuelle Entscheidung, die womöglich auch für einzelne Artikel oder Forschungsprojekte anders ausfällt.

Abbildung: Beispiel für die Entstehung eines wissenschaftlichen Textes

Auf den Punkt der zahlreichen Ausgabeformate möchte ich gerne zurückkommen, denn ich glaube dass hier ein großes Potential des wissenschaftlichen Schreibens in Markup liegt. Ein wissenschaftlicher Text hat ja oft eine Geschichte und entsteht schrittweise (vgl. Abbildung). Dabei durchläuft der Text eine Vielzahl von Formaten. Er beginnt als Sammlung von Notizen, Analysen und Resultaten. Für einen Vortrag auf einer Konferenz wird er zu einer Präsentation mit mehreren Folien. Dann werden evtl. die Analysen überarbeitet und die Resultate ändern sich. Daraus wird dann ein Artikel in einer Zeitschrift. Im Kontext von Lehre oder Projekten wird der Text ggf. auch für Seminare oder Workshops verwendet. Der dabei verwendete Text ist natürlich unterschiedlich ausführlich, stellt aber die selbe Idee dar. Markup bieten die Möglichkeit, dass der Text in dieser gesamten Entwicklung im selben Textformat vorliegt und von hier die unterschiedlichen Ausgabeformate überführt werden kann.

comments powered by Disqus