Large quantities of historical newspapers are being digitized and OCRd. We describe a framework for processing the OCRd text to identify articles and extract metadata for them. We describe the article schema and provide examples of features that facilitate automatic indexing of them. For this processing, we employ lexical semantics, structural models, and community content. Furthermore, we describe visualization and summarization techniques that can be used to present the extracted events.
Die "Münchener Ratsch-Kathl" erschien in unterschiedlicher Periodizität von 1889 bis 1921. Als betont volksnahes Unterhaltungsblatt für die Öffentlichkeit der bayerischen Landeshauptstadt München konzipiert, erreichte sie hier durch einen umgangssprachlich-münchnerischen Ton und einen bunten Mix an lokalen Themen und Texten in den Jahren vor dem Ersten Weltkrieg eine weite Verbreitung. Der Ausdruck "Ratsch-Kathl" für eine geschwätzige Person war schon voher bekannt, ist aber nicht zuletzt wegen der Zeitschrift bis heute in München sprachliches Allgemeingut.
Am Anfang der Coburger Pressegeschichte stand wie in vielen anderen Territorien und Orten ein "Intelligenzblatt", das sich immer mehr zu einem Regierungs- und Amtsblatt entwickelte. Daneben etablierte sich 1861 die "Coburger Zeitung" als offizielle Coburger Tageszeitung. Sie erfuhr erst seit Anfang der 1930er Jahre ernsthafte Konkurrenz durch die nationalsozialistische "Coburger Nationalzeitung". Im Zuge der nationalsozialistischen Pressegleichschaltung verdrängte die "Nationalzeitung" bis 1940 alle anderen Coburger Zeitungen.
Das Bayerische Brauer-Journal erschien von 1891 bis 1919. Herausgeber waren die Versuchsstation für Bierbrauerei in Nürnberg und ab 1904 das Bayerische Gewerbemuseum in Nürnberg. Die Zeitschrift beschäftigte sich mit Fragen der Brautechnik und des Hopfen- und Gersteanbaus.