Digitalisierung der Heidelberger Zeitung (1861-1919) und ihres Vorgängerblattes Heidelberger Tagblatt inkl. der Beilage Heidelberger Unterhaltungsblatt (1858 – 1860) sowie ihrer Nachfolgerin Badische Post (1919 – 1924)
Digitalisierungsprojekt der Universitätbibliothek und der Staats- und Stadtbibliothek Augsburg. Projektumfang: Jgg. 1770 - 1806. Fortsetzung 1807 - 1848 in Vorbereitung.
ANNO ist der virtuelle Zeitungslesesaal der Österreichischen Nationalbibliothek. Hier kann in historischen österreichischen Zeitungen und Zeitschriften online geblättert und gelesen werden.
Mit der Schließung oder Zusammenlegung von Redaktionen reagieren viele deutsche Zeitungsverlage auf die Wirtschaftskrise. "So können zwar kurzfristig konjunkturelle Probleme abgefangen werden. Das eigentliche Problem besteht jedoch seit Jahren in einem schleichenden Schwund der Leserschaft, dem man mit einer nachhaltigen Investition in Qualität begegnen sollte", sagt Privatdozent Dr. Klaus Arnold, wissenschaftlicher Assistent am Lehrstuhl für Journalistik II der Katholischen Universität Eichstätt-Ingolstadt (KU). In einer repräsentativen Studie untersuchte Arnold, was dem Zeitungspublikum besonders wichtig ist.
Ziel des Digitalen Forums Mittel- und Osteuropa ist es, diese vom Verfall bedrohten und bereits teilweise in Vergessenheit geratenen Bestände im Laufe der nächsten Jahre systematisch zu erschließen, digital zu sichern und zu archivieren und mittels eines Online-Portals der breiteren Öffentlichkeit, vor allem aber der Wissenschaft zugänglich zu machen. Gleichzeitig soll das Portal den Charakter einer gegenstandsbezogenen Plattform erhalten, mit Möglichkeiten zum Austausch, zur Diskussion und zur digitalen Publikation.
Surprise. All generally accepted truths notwithstanding, more than 96 percent of newspaper reading is still done in the print editions, and the online share
Newspaper collections are the subject of an increasing number of large-scale digitisation projects. In Papers Past (http://paperspast.natlib.govt.nz), a collection of over a million newspaper pages, the introduction of full-text search has made a wealth of information findable that was previously hidden. The search feature is dependent on text extracted from the newspaper page images with Optical Character Recognition (OCR), so any improvement in OCR accuracy will add value to the collection by improving our users' chances of finding useful information.
This article details the work undertaken by the National Library of Australia Newspaper Digitisation Program on identifying and testing solutions to improve OCR accuracy in large scale newspaper digitisation programs. In 2007 and 2008 several different solutions were identified, applied and tested on digitised material now available in the Australian Newspapers Digitisation Program beta service <http://ndpbeta.nla.gov.au/ndp/del/home>. This article gives a state of the art overview of how OCR software works on newspapers, factors that effect OCR accuracy, methods of measuring accuracy, methods of improving accuracy, and testing methods and results for specific solutions that were considered viable for large scale text digitisation projects.
Die REGAG hat sich im Mai 2000 als freiwillige Kooperationsgemeinschaft von Archiven, Dokumentationsstellen, Bibliotheken, Museen und Zeitungsverlagen mit Zeitungsbeständen der Region Berlin-Brandenburg gegründet. Das koordinierte Zusammenwirken dieser Institutionen ist erforderlich, um die historischen Zeitungsbestände kooperativ zu sichern, Verfilmungsprojekte dieser Bestände koordiniert zu realisieren, sowie die aktuellen Zeitungstitel des In- und Auslands in der Region optimal zur Verfügung zu stellen, sei es als Originalausgabe, als Mikrofilm oder in elektronischer Form (online oder CD-ROM-Ausgabe).
Die Topographie "Zeitungssammlungen in Deutschland" ist ein überregionaler Standortnachweis von Zeitungen* in Bibliotheken, Archiven, Dokumentationsstellen, Museen und Zeitungsverlagen mit derzeit ca. 1600 Datensätzen, die Angaben zu Mengen und Aspekten der Sammlungen, ggf. auch Titel enthalten.
Für die Recherche sind die Inhalte aus den Bereichen Institutionsname, Sigel**, Ort (Menüpunkt "Institutionen") und Thematik, Region, Zeit (Menüpunkt "Sammlungen") erschlossen und im Masken- oder Listenmodus abfragbar. Im Maskenmodus kann gleichzeitig oder getrennt in den Registern gezielt gesucht werden.
Northern New York Historical Newspapers are provided by the Northern New York Library Network to enhance access to the region's unique local history. The online collection currently consists of more than 1,348,000 pages from forty newspapers.
Materials accessible here are Cornell University Library's contributions to Making of America (MOA), a digital library of primary sources in American social history from the antebellum period through reconstruction. The collection is particularly strong in the subject areas of education, psychology, American history, sociology, religion, and science and technology. This site provides access to 267 monograph volumes and over 100,000 journal articles with 19th century imprints. The project represents a major collaborative endeavor in preservation and electronic access to historical texts.
For a thorough discourse based analysis of the transition from "dead tree"newspapers to digital information see the article by Eric Alterman in the New Yorker, Out of Print. The death and life of the American newspaper. March 31, 2008.
The Koninklijke Bibliotheek, the National Library of the Netherlands (KB) initiated the Databank of Digital Daily newspapers project at the end of 2006. The project will realize the large-scale digitization of Dutch national, regional, local and colonial newspapers and make these freely accessible on the Internet. The Databank of Digital Daily newspapers will contain eight million pages, from the first newspaper dated 1618 to the newspapers of the twentieth century.
This is the Invitation to Tender of the public tendering procedure with reference 2007/S 216-262744,
falling within the scope of the Dutch Public Procurement Decree (Besluit aanbestedingsregels voor
overheidsopdrachten; BAO, which is based on European Procurement Directive 2004/18/EC) for the
provision of services for compiling the Databank of Digital Daily Newspapers.
Brown University Library's digital collections contain a mix of public domain, copyrighted (fair-use), and licensed materials. Materials that are under copyright or license agreement are available only to members of the Brown Community. Public domain materials are available to everybody.
The <div> TYPE attribute vocabulary is a list of terms that may be used to categorise the core structural elements of an object in a METS document conforming to the Australian METS Profile. Examples of how these values may be applied are given in the Appendix – Content Models. The content model in the current version of the document represent use cases that have been tested by the Maintenance Agency, and further content models and vocabulary terms will be added as they are developed.
The National Digital Newspaper Program (NDNP), a partnership between the National Endowment for the Humanities (NEH) and the Library of Congress (LC), is a long-term effort to develop an Internet-based, searchable database of all U.S. newspapers with descriptive information and select digitization of historic pages. Supported by NEH, this rich digital resource will be developed and permanently maintained at the Library of Congress. An NEH grant program will fund the contribution of content from, eventually, all U.S. states and territories.
The National Library of Australia, in collaboration the Australian State and Territory libraries, has commenced a
program to digitise out of copyright newspapers.
Large quantities of historical newspapers are being digitized and OCRd. We describe a framework for processing the OCRd text to identify articles and extract metadata for them. We describe the article schema and provide examples of features that facilitate automatic indexing of them. For this processing, we employ lexical semantics, structural models, and community content. Furthermore, we describe visualization and summarization techniques that can be used to present the extracted events.
J. Singh, und A. Anand. Proceedings of the 2017 Conference on Conference Human Information Interaction and Retrieval, Seite 361--364. New York, NY, USA, ACM, (2017)
D. Rajanen, M. Salminen, und N. Ravaja. Proceedings of the 19th International Academic Mindtrek Conference (Academic MindTrek 2015), Seite 155--162. New York, NY, USA, ACM, (2015)
A. Dallmann, F. Lemmerich, D. Zoller, und A. Hotho. Proceedings of the LWA 2015 Workshops: KDML, FGWM, IR, and FGDB. Trier, Germany, 7.-9. October 2015, CEUR-WS.org, (2015)
R. Kawase, E. Herder, und P. Siehndel. Proceedings of the ISWC 2014 Posters & Demonstrations Track a track within the 13th International Semantic Web Conference, ISWC 2014, Riva del Garda, Italy, October 21, 2014., Seite 365--368. (2014)
R. Krestel, R. Witte, und S. Bergler. International Conference on Recent Advances in Natural Language Processing (RANLP 2007), Borovets, Bulgaria, (September 2007)