Large quantities of historical newspapers are being digitized and OCRd. We describe a framework for processing the OCRd text to identify articles and extract metadata for them. We describe the article schema and provide examples of features that facilitate automatic indexing of them. For this processing, we employ lexical semantics, structural models, and community content. Furthermore, we describe visualization and summarization techniques that can be used to present the extracted events.
The <div> TYPE attribute vocabulary is a list of terms that may be used to categorise the core structural elements of an object in a METS document conforming to the Australian METS Profile. Examples of how these values may be applied are given in the Appendix – Content Models. The content model in the current version of the document represent use cases that have been tested by the Maintenance Agency, and further content models and vocabulary terms will be added as they are developed.
Digitalisierungsprojekt der Universitätbibliothek und der Staats- und Stadtbibliothek Augsburg. Projektumfang: Jgg. 1770 - 1806. Fortsetzung 1807 - 1848 in Vorbereitung.
Die "Münchener Ratsch-Kathl" erschien in unterschiedlicher Periodizität von 1889 bis 1921. Als betont volksnahes Unterhaltungsblatt für die Öffentlichkeit der bayerischen Landeshauptstadt München konzipiert, erreichte sie hier durch einen umgangssprachlich-münchnerischen Ton und einen bunten Mix an lokalen Themen und Texten in den Jahren vor dem Ersten Weltkrieg eine weite Verbreitung. Der Ausdruck "Ratsch-Kathl" für eine geschwätzige Person war schon voher bekannt, ist aber nicht zuletzt wegen der Zeitschrift bis heute in München sprachliches Allgemeingut.
Am Anfang der Coburger Pressegeschichte stand wie in vielen anderen Territorien und Orten ein "Intelligenzblatt", das sich immer mehr zu einem Regierungs- und Amtsblatt entwickelte. Daneben etablierte sich 1861 die "Coburger Zeitung" als offizielle Coburger Tageszeitung. Sie erfuhr erst seit Anfang der 1930er Jahre ernsthafte Konkurrenz durch die nationalsozialistische "Coburger Nationalzeitung". Im Zuge der nationalsozialistischen Pressegleichschaltung verdrängte die "Nationalzeitung" bis 1940 alle anderen Coburger Zeitungen.
Das Bayerische Brauer-Journal erschien von 1891 bis 1919. Herausgeber waren die Versuchsstation für Bierbrauerei in Nürnberg und ab 1904 das Bayerische Gewerbemuseum in Nürnberg. Die Zeitschrift beschäftigte sich mit Fragen der Brautechnik und des Hopfen- und Gersteanbaus.
Welcome to Chronicling America, enhancing access to America's historic newspapers. This site allows you to search and view newspaper pages from 1880-1922 and find information about American newspapers published between 1690-present. Chronicling America is sponsored jointly by the National Endowment for the Humanities and the Library of Congress as part of the National Digital Newspaper Program (NDNP).
The California Digital Newspaper Collection offers over 200,000 pages of California newspapers spanning the years 1849-191l: the Alta California, 1849-1891; the San Francisco Call, 1893-1910; the Amador Ledger, 1900-1911; the Imperial Valley Press, 1901-1911; the Sacramento Record-Union, 1859-1890; and the Los Angeles Herald, 1905-1907. Additional years are forthcoming, as are other early California newspapers: the Californian; the California Star; the California Star and Californian; the Sacramento Transcript; the Placer Times; and the Pacific Rural Press.
The California Newspaper Project is an 18 year effort by the CBSR to identify, describe and preserve California newspapers. Close to 9,000 California newspapers were inventoried in over 14,000 repositories throughout the state, 1.5 million pages of California newspapers were preserved and made available on microfilm, and 100,000 rolls of negative microfilm rolls are being processed for permanent storage at the UC Regional Library Storage Facilities.
Die Vossische Zeitung ist eine der herausragendsten Quellen zum Studium der politischen Berichterstattung und öffentlichen Meinung in Deutschland. Die Vossische Zeitung Online. 1918 - 1934 schildert und kommentiert tagesaktuell die politischen, gesellschaftlichen und kulturellen Ereignisse der Epoche zwischen dem Ende des Ersten Weltkriegs und dem Beginn des "Dritten Reichs". Die Datenbank enthält ca. 10.500 Ausgaben mit über 127.000 Seiten der Jahrgänge 1918 bis 1934.
Die Königliche Bibliothek Ende 2006 startete das Projekt Databank Digital Zeitung mit Mitteln aus dem Nationalen Großforschung Einrichtungen Programm der NWO / SenterNovem. Für den Zeitraum 1940-1945, gibt es zusätzliche Mittel aus dem Programm der Heritage War of the Ministry of Health, Welfare digitalisiert und Sport.Het Projekt in großem Maßstab niederländischen nationalen, regionalen, lokalen und kolonialen Zeitungen und machen sie frei verfügbar im Internet . Insgesamt acht Millionen Seiten aus der ersten Zeitung im Jahr 1618 um Papiere des zwanzigsten Jahrhunderts.
von Ruth Fend. Verbraucher tauschen sich im Internet zunehmend über die Qualität von Produkten aus. Unternehmen nutzen die Blogs, um die Wünsche ihrer Kunden zu erfahren.
Von Reg Carr. Die digitalisierte Buchsuche Google Print Für eine europäische Perspektive: Die digitalisierte Google-Buchsuche nützt der klassenlosen Wissensgesellschaft
Nicholas Negroponte ist einer der Vordenker der Digitalen Revolution. Sein Buch "Being Digital" gilt als Bestseller. Derzeit macht mit dem 100-Dollar-Laptop für die Dritte Welt von sich reden. Im Interview spricht er über den den Wert von Informationen.
Von Torsten Kleinz. ZEIT online 25.1.2007. Die Regierung hat heute ein Gesetz zum Urheberrecht beschlossen. Künftig sollen Teilnehmer von Tauschbörsen auf zivilrechtlichem Weg ermittelt werden können. Im Gegenzug sinken die Abmahnkosten für geringfü
von Björn Maatz (Hamburg) Weblogs haben sich innerhalb weniger Jahre als fester Bestandteil der Web 2.0-Generation etabliert - Blogs wie BoingBoing gewinnen immer mehr Zulauf. Doch das Phänomen erreicht in diesem Jahr seinen Höhepunkt, prophezeien die
Tim O'Reilly ist der Guru des "Web 2.0". Doch er kann das Schlagwort, das zum Inbegriff des neuen Internetbooms wurde, selbst nicht mehr hören. Im Interview mit SPIEGEL ONLINE erklärt er, warum er einem Außerirdischen eher Google als YouTube zeigen wü
Volkmar Sigusch. Er und seine Frankfurter Forscher haben die Gesellschaft zu einem anderen Umgang mit ihrer Sexualität geführt. Am Samstag schließt das Institut endgültig.
"Alleine macht das keinen Sinn". Mit Blogs, Wikis, Flickr und openBC kennt sich Stephan Mosel aus Gießen aus. Der 28-jährige Pädagogikstudent betreibt seit Februar 2003 erfolgreich sein eigenes Blog (» weblog.plasticthinking.org), das auch über ein W
Die Universitätsbibliothek Heidelberg hat mit Unterstützung der Landesarchivdirektion Baden-Württemberg 19 ihrer Feldzeitungen aus der Zeit des Ersten Weltkrieges digitalisiert und mikroverfilmt. Um dem interessierten Benutzer online einen möglichst lückenlosen Bestand anbieten zu können, wurden vorhandene Lücken im Printbestand durch Digitalisierung von Exemplaren aus anderen Bibliotheken geschlossen.
The National Library of Australia, in collaboration the Australian State and Territory libraries, has commenced a
program to digitise out of copyright newspapers.
This is the Invitation to Tender of the public tendering procedure with reference 2007/S 216-262744,
falling within the scope of the Dutch Public Procurement Decree (Besluit aanbestedingsregels voor
overheidsopdrachten; BAO, which is based on European Procurement Directive 2004/18/EC) for the
provision of services for compiling the Databank of Digital Daily Newspapers.
The Koninklijke Bibliotheek, the National Library of the Netherlands (KB) initiated the Databank of Digital Daily newspapers project at the end of 2006. The project will realize the large-scale digitization of Dutch national, regional, local and colonial newspapers and make these freely accessible on the Internet. The Databank of Digital Daily newspapers will contain eight million pages, from the first newspaper dated 1618 to the newspapers of the twentieth century.
Die Topographie "Zeitungssammlungen in Deutschland" ist ein überregionaler Standortnachweis von Zeitungen* in Bibliotheken, Archiven, Dokumentationsstellen, Museen und Zeitungsverlagen mit derzeit ca. 1600 Datensätzen, die Angaben zu Mengen und Aspekten der Sammlungen, ggf. auch Titel enthalten.
Für die Recherche sind die Inhalte aus den Bereichen Institutionsname, Sigel**, Ort (Menüpunkt "Institutionen") und Thematik, Region, Zeit (Menüpunkt "Sammlungen") erschlossen und im Masken- oder Listenmodus abfragbar. Im Maskenmodus kann gleichzeitig oder getrennt in den Registern gezielt gesucht werden.
Die Grafinger Zeitung erschien erstmals im Dezember 1923 und wurde zunächst halbwöchentlich, ab dem 6. Oktober 1924 bis zu ihrer Einstellung 1945 täglich publiziert. Versuche, die Zeitung im Mai 1945 und im Herbst 1949 wieder zu begründen, blieben erfolglos. Als Heimatblatt für den Landkreis Ebersberg enthält sie überwiegend aktuelle Meldungen mit regionalem Hintergrund. Die überregionalen Teile stellte zwischen 1924 und 1945 die Redaktion beim Münchner Buchgewerbehaus Müller & Sohn bzw. dem Bayerischen Zeitungsblock bereit.
"Der gerade Weg" war eine 1932-1933 in München erschienene politische Wochenschrift. Sie publizierte mit die eindringlichsten, christlich begründeten Warnungen vor dem Nationalsozialismus. Ihr Herausgeber war der Journalist und Archivar Fritz Gerlich (1883-1934).
Die Sudetendeutsche Zeitung, ein in der Regel zwölfseitiges Wochenblatt, erschien erstmals im April 1951 in Bayreuth. Erscheinungsort ist seit 1952 München. Die hier bereitgestellten frühen Jahrgänge der Zeitung (1951-1955) beschäftigen sich besonders mit der Frage der Flüchtlingsintegration in Bayern und der Bundesrepublik Deutschland, woraus ein spezifischer Quellenwert resultiert.
The following is a list of daily and weekly Georgia newspapers and various college newspapers that maintain an online presence. The amount of information available in electronic format varies. (Excluded are alternative news weeklies and other specialized publications.)
Die Universitäts- und Landesbibliothek Sachsen-Anhalt verfügt neben der Bayerischen Staatsbibliothek München und der Staatsbibliothek zu Berlin – Preussischer Kulturbesitz über eine der umfangreichsten historischen Zeitungssammlungen in der Bundesrepublik Deutschland. Die Hauptschwerpunkte der Sammlung liegen im 19. und 20. Jahrhundert. Jedoch wurde die Zeitungssammlung schon vor dem Jahr 1824 - dem preußischen Pflichtexemplarsgesetz - angelegt. Die Bibliotheken verschiedener Gelehrter, besonders die Ponickau-Sammlung bilden den Grundstock der Sammlung. Dazu kamen die Pflichtexemplare an die Universitätsbibliothek, Schenkungen und Ankäufe. Ab 1892 wurden die Zeitungen des Landes systematisch gesammelt. Als historische Quelle sind Zeitungen - besonders die lokalen Bestände - vor allem für die Regional- und Landesgeschichtsschreibung von unschätzbarem Wert. Sie geben Auskunft über lokale Politik, Wirtschaft, Freizeit, Geschäfte und Kultur, eingebettet in die Ereignisse der deutschen und internationalen Politik.
Das Zeitungsportal der Bayerischen Staatsbibliothek bietet Zugriff auf derzeit ca. 26 retrodigitalisierte Zeitungen Bayerns, die nach und nach um weitere Titel ergänzt werden. Bitte beachten Sie: DigiPress liegt momentan als Beta-Version vor. Der Webauftritt befindet sich noch im Aufbau!
Von Alex Rühle - Ein anschwellender Blogsgesang: Von wegen "Weisheit der Vielen" - Nur weil es jetzt viele kleine Häufchen im Netz gibt, ist es noch lange kein großer. Macht also endlich Schluss mit dem mystischen Erlösungsgerede über das Internet!
«Open Access» verändert die universitären Publikationsverhältnisse. In wenigen Monaten soll an der Universität Zürich ein «Dokumenten- und Publikationsserver» aufgeschaltet werden, der möglichst alle an der Universität erbrachten Forschungen de
DIE ZEIT 16.03.2006 Nr.12. Mitreden, mitteilen, mitgestalten: Millionen wenden sich von den alten Medienkonzernen ab, weil die ihre neuen Vorlieben nicht bedienen Von Götz Hamann
DIE ZEIT, 21.09.2006 Nr. 39. Amateurfilme aus dem Alltag, Tagebücher und Schimpftiraden: Eine Welle neuer Internet-Firmen will damit Geld verdienen. Tim O’Reilly hat dafür den Begriff »Web 2.0« geprägt. Ein Boom oder nur der nächste Flop?
Von Gerrit Pohl. Seit "Wired"-Chef Chris Anderson seinen Bestseller "The Long Tail" vorlegte, sind Händler und Vermarkter ganz aus dem Häuschen. Andersons Entdeckung: Über das Web lässt sich richtig Geld mit Dingen machen, die nur selten jemand will.
Von Frank Patalong Die Telekommunikations-Konzerne haben eine finstere Vision: Ihr Traum ist ein Kommerznetz, bei dem nur noch zahlungskräftige Web-Unternehmen breitbandig beim Verbraucher ankommen. Im Web 3.0 hätten Startups, Blogger und junge Kreat
Der Web-Forscher Andreas Weigend über neue Geschäftsmodelle, private Selbstdarsteller und den Siegeszug des Laienwissens im Netz. Ein Interview von Philipp Wolff
Der Chef eines der erstaunlichsten und erfolgreichsten Unternehmen der letzten Jahre, Google-Chef Eric Schmidt, hält große Stücke auf die viel geschmähte deutsche und die europäische Wirtschaft. Im Interview mit den Handelsblatt spricht er außerdem
Von Anne Kunze. 01/2007. Um einen Job zu kriegen, braucht man Kontakte, heißt es. Nirgends in Deutschland gibt es mehr als bei der Internet-Plattform Xing/openBC. Ein Selbstversuch.
Donnerstag, 23. November 2006. Werden Medienhäuser unwichtiger und die Nutzer übernehmen das Regiment? absatzwirtschaft sprach dazu Nikolaus Brender, Chefredakteur ZDF.
Sie war Berlins älteste Zeitung, deren Gründungsgeschichte bis in das frühe 17. Jahrhundert zurückreichte: die 'Vossische Zeitung'. Für ihr bekanntes Feuilleton hatten schon Lessing und Fontane geschrieben. In den Jahren der Weimarer Republik gab es kaum einen bekannten deutschen Autor, der nicht in der 'Vossischen' zu Worte kam. Vor 75 Jahren stellte die Zeitung ihr Erscheinen ein.
Verstehensprobleme und Gestaltungsprinzipien für Online-Zeitungen. Der Beitrag beschäftigt sich mit den Anforderungen der Onlinekommunikation für Online-Zeitungen.
Brown University Library's digital collections contain a mix of public domain, copyrighted (fair-use), and licensed materials. Materials that are under copyright or license agreement are available only to members of the Brown Community. Public domain materials are available to everybody.
Northern New York Historical Newspapers are provided by the Northern New York Library Network to enhance access to the region's unique local history. The online collection currently consists of more than 1,348,000 pages from forty newspapers.
This article details the work undertaken by the National Library of Australia Newspaper Digitisation Program on identifying and testing solutions to improve OCR accuracy in large scale newspaper digitisation programs. In 2007 and 2008 several different solutions were identified, applied and tested on digitised material now available in the Australian Newspapers Digitisation Program beta service <http://ndpbeta.nla.gov.au/ndp/del/home>. This article gives a state of the art overview of how OCR software works on newspapers, factors that effect OCR accuracy, methods of measuring accuracy, methods of improving accuracy, and testing methods and results for specific solutions that were considered viable for large scale text digitisation projects.
Digitalisierung der Heidelberger Zeitung (1861-1919) und ihres Vorgängerblattes Heidelberger Tagblatt inkl. der Beilage Heidelberger Unterhaltungsblatt (1858 – 1860) sowie ihrer Nachfolgerin Badische Post (1919 – 1924)
Die Fürstenfeldbrucker Pressegeschichte kann als typisch für viele Märkte und Kleinstädte Oberbayerns angesehen werden. Für die lokale Forschung stellt die Zeitungsüberlieferung eine bedeutende Quelle dar, die allerdings nur eingeschränkt nutzbar ist.
Das 1868 und 1869 erschienene "Münchener Wochenblatt" für das katholische Volk war eine der ersten katholisch-ultramontanen Zeitungen Bayerns. Wichtigster Mitarbeiter war spätere Landtags- und Reichstagsabgeordnete Georg Ratzinger (1844-1899).
Ziel des Digitalen Forums Mittel- und Osteuropa ist es, diese vom Verfall bedrohten und bereits teilweise in Vergessenheit geratenen Bestände im Laufe der nächsten Jahre systematisch zu erschließen, digital zu sichern und zu archivieren und mittels eines Online-Portals der breiteren Öffentlichkeit, vor allem aber der Wissenschaft zugänglich zu machen. Gleichzeitig soll das Portal den Charakter einer gegenstandsbezogenen Plattform erhalten, mit Möglichkeiten zum Austausch, zur Diskussion und zur digitalen Publikation.
ANNO ist der virtuelle Zeitungslesesaal der Österreichischen Nationalbibliothek. Hier kann in historischen österreichischen Zeitungen und Zeitschriften online geblättert und gelesen werden.
The Newseum displays these daily newspaper front pages in their original, unedited form. Some front pages may contain material that is objectionable to some visitors. Viewer discretion is advised.
Ein Kommentar von Falk Lüke. ZEIT online 7.2.2007 - 14:47 Uhr. Apple-Chef Steve Jobs fordert das Ende des Kopierschutzes für heruntergeladene Musik. Obwohl er dabei vor allem an sein Unternehmen denkt, kann man ihm nur beipflichten.
Die Reise durchs Internet hinterlässt Spuren. Sie lassen sich minutiös verfolgen und im großen Stil speichern. Doch mithilfe eines "Dongles" können sich User dagegen wehren. TorPark, die mobile Version des Browsers Firefox
29. Dezember 2006, Neue Zürcher Zeitung. Die «Weisheit der Massen» als Triebkraft des Web 2.0. Die Internet-Nutzer, die ihr Wissen und Können gratis zur Verfügung stellen, wurden von der Redaktion des «Time Magazine» zur «Persönlichkeit» des Jah
10. Jan 07:23. Wir haben immer noch nicht begriffen, wie das Internet funktioniert - sagt Geert Lovink. Die Netzeitung im Gespräch mit dem provokanten Medientheoretiker.
26. August 2005, Online-Tagebücher für die Unternehmenskommunikation. Web-Logs (Blogs) erfreuen sich im Internet grosser Beliebtheit. Eine Mischung aus Tagebuch, Kolumne, Leserbrief und Presseschau, gewinnen Blogs zunehmend auch für die interne und ext
13. Januar 2006, Web 2.0 - Droge, Religionsersatz oder Zukunftstechnologie? Die Zukunft des Internets heisst Web 2.0. Es gibt Hunderte von Web- Tagebüchern, die sich mit diesem Thema beschäftigen, spezialisierte Online- Dienste, Zeitschriften, Konferenz