zerlegt digital elektronische, Papier-, Mikrofilm- oder Mikrofiche- Dokumente in ihre Bestandteile und schafft durchsuchbare Inhalte bei gleichzeitigem
Das SBB Zeitungen METS-Profil - Exchange beschreibt das Datenformat für den Austausch von Metadaten für digitale Objekte digitalisierter Zeitungen zwischen der Staatsbibliothek zu Berlin und Dritten, die als Auftragnehmer diese Daten erstellen.
Sage und schreibe 8.000 Zeitungen und Online-Magazine kann man auf der Webseite "Metagrid Zeitungen & Magazine" mit der Internetadresse http://www.metagrid.de finden.
Large quantities of historical newspapers are being digitized and OCRd. We describe a framework for processing the OCRd text to identify articles and extract metadata for them. We describe the article schema and provide examples of features that facilitate automatic indexing of them. For this processing, we employ lexical semantics, structural models, and community content. Furthermore, we describe visualization and summarization techniques that can be used to present the extracted events.
Die Topographie "Zeitungssammlungen in Deutschland" ist ein überregionaler Standortnachweis von Zeitungen* in Bibliotheken, Archiven, Dokumentationsstellen, Museen und Zeitungsverlagen mit derzeit ca. 1600 Datensätzen, die Angaben zu Mengen und Aspekten der Sammlungen, ggf. auch Titel enthalten.
Für die Recherche sind die Inhalte aus den Bereichen Institutionsname, Sigel**, Ort (Menüpunkt "Institutionen") und Thematik, Region, Zeit (Menüpunkt "Sammlungen") erschlossen und im Masken- oder Listenmodus abfragbar. Im Maskenmodus kann gleichzeitig oder getrennt in den Registern gezielt gesucht werden.
The <div> TYPE attribute vocabulary is a list of terms that may be used to categorise the core structural elements of an object in a METS document conforming to the Australian METS Profile. Examples of how these values may be applied are given in the Appendix – Content Models. The content model in the current version of the document represent use cases that have been tested by the Maintenance Agency, and further content models and vocabulary terms will be added as they are developed.
Die Sudetendeutsche Zeitung, ein in der Regel zwölfseitiges Wochenblatt, erschien erstmals im April 1951 in Bayreuth. Erscheinungsort ist seit 1952 München. Die hier bereitgestellten frühen Jahrgänge der Zeitung (1951-1955) beschäftigen sich besonders mit der Frage der Flüchtlingsintegration in Bayern und der Bundesrepublik Deutschland, woraus ein spezifischer Quellenwert resultiert.
Im Rahmen eines inzwischen abgeschlossenen DFG-Projektes wurde das historische Pressematerial des Hamburgischen Welt-Wirtschafts-Archivs (HWWA) und des Wirtschaftsarchivs des Instituts für Weltwirtschaft in Kiel (WIA/IfW) bis zur Währungsreform 1948 bzw. zur Gründung der Bundesrepublik 1949 digitalisiert. Das überwiegend vom Rollfilm digitalisierte Material wird nun sukzessive aufbereitet und veröffentlicht.
Ziel des Digitalen Forums Mittel- und Osteuropa ist es, diese vom Verfall bedrohten und bereits teilweise in Vergessenheit geratenen Bestände im Laufe der nächsten Jahre systematisch zu erschließen, digital zu sichern und zu archivieren und mittels eines Online-Portals der breiteren Öffentlichkeit, vor allem aber der Wissenschaft zugänglich zu machen. Gleichzeitig soll das Portal den Charakter einer gegenstandsbezogenen Plattform erhalten, mit Möglichkeiten zum Austausch, zur Diskussion und zur digitalen Publikation.
Digitalisierungsprojekt der Universitätbibliothek und der Staats- und Stadtbibliothek Augsburg. Projektumfang: Jgg. 1770 - 1806. Fortsetzung 1807 - 1848 in Vorbereitung.
The DjVuLibre XML Tools provide for editing the metadata, hyperlinks and hidden text associated with DjVu files. Unlike djvused(1) the DjVuLibre XML Tools rely on the XML technology and can take advantage of XML editors and verifiers.
The National Digital Newspaper Program (NDNP), a partnership between the National Endowment for the Humanities (NEH) and the Library of Congress (LC), is a long-term effort to develop an Internet-based, searchable database of all U.S. newspapers with descriptive information and select digitization of historic pages. Supported by NEH, this rich digital resource will be developed and permanently maintained at the Library of Congress. An NEH grant program will fund the contribution of content from, eventually, all U.S. states and territories.
Sie war Berlins älteste Zeitung, deren Gründungsgeschichte bis in das frühe 17. Jahrhundert zurückreichte: die 'Vossische Zeitung'. Für ihr bekanntes Feuilleton hatten schon Lessing und Fontane geschrieben. In den Jahren der Weimarer Republik gab es kaum einen bekannten deutschen Autor, der nicht in der 'Vossischen' zu Worte kam. Vor 75 Jahren stellte die Zeitung ihr Erscheinen ein.
The design of the SPAR system is based on the major digital preservation standard, the OAIS model1. The architecture is composed of several modules connected via web services and based on open source components. One of the main components of the system is the data management module : it will use RDF data stored in a RDF triple store.
ZBW Labs eröffnen Ihnen einen Blick in unsere Werkstatt. Wir stellen hier in der ZBW entwickelte innovative Anwendungen und Services vor, die noch keinen Eingang in den Regelbetrieb gefunden haben, sondern als Prototypen und Beta-Versionen laufend erweitert und verbessert werden. Sie setzen auf neuesten Technologien auf und tragen zum Teil noch experimentellen Charakter.
Die REGAG hat sich im Mai 2000 als freiwillige Kooperationsgemeinschaft von Archiven, Dokumentationsstellen, Bibliotheken, Museen und Zeitungsverlagen mit Zeitungsbeständen der Region Berlin-Brandenburg gegründet. Das koordinierte Zusammenwirken dieser Institutionen ist erforderlich, um die historischen Zeitungsbestände kooperativ zu sichern, Verfilmungsprojekte dieser Bestände koordiniert zu realisieren, sowie die aktuellen Zeitungstitel des In- und Auslands in der Region optimal zur Verfügung zu stellen, sei es als Originalausgabe, als Mikrofilm oder in elektronischer Form (online oder CD-ROM-Ausgabe).
The National Library of Australia, in collaboration the Australian State and Territory libraries, has commenced a
program to digitise out of copyright newspapers.
Fez, a flexible, digital repository and workflow management system, was released in November 2005 by UQ staff under open source license. The site for downloading software and keeping on top of software development is http://sourceforge.net/projects/fez/. The Fez software is PHP- and MySQL-based and works as a front-end and administration tool using Fedora (http://www.fedora.info/), an excellent tool for managing objects and the relationships between them. In a Fedora repository, objects can be communities, collections, and records. Records can belong to both collections and communities. Details of the software, documentation and further planned development is at http://www.library.uq.edu.au/escholarship/
hOCR is a format for representing OCR output, including layout information, character confidences, bounding boxes, and style information. It embeds this information invisibly in standard HTML. By building on standard HTML, it automatically inherits well-defined support for most scripts, languages, and common layout options. Furthermore, unlike previous OCR formats, the recognized text and OCR-related information co-exist in the same file and survives editing and manipulation. hOCR markup is independent of the presentation.
OCRopus is a state-of-the-art document analysis and OCR system, featuring pluggable layout analysis, pluggable character recognition, statistical natural language modeling, and multi-lingual capabilities. This server allows you to use the system through your web browser.
Bisher wird kein direkter Export von MODS unterstützt. Die Metadaten aus Katalogen des GBV ließen sich aber grundsätzlich nach MODS umwandeln, beispielsweise über MARC21.
This site serves as a repository for the NYU Digital Library Team's METS implementation development projects. At present a modest handful of XSLT-based page-turner and search implementations are freely available for use on an "as is" basis. In the pipeline are a java-based SMIL viewer, a java-based application and a perl-based application to extract a METS file from a database using NYU's zeroDB schema.
The Koninklijke Bibliotheek, the National Library of the Netherlands (KB) initiated the Databank of Digital Daily newspapers project at the end of 2006. The project will realize the large-scale digitization of Dutch national, regional, local and colonial newspapers and make these freely accessible on the Internet. The Databank of Digital Daily newspapers will contain eight million pages, from the first newspaper dated 1618 to the newspapers of the twentieth century.
textMD is a XML Schema maintained by the Library of Congress that details technical metadata for text-based digital objects. It allows for detailing properties such as encoding information (quality, platform, software, agent), character information (character set and size, byte order and size, line terminators), languages, fonts, markup information, processing and textual notes, technical requirements for printing and viewing, and page ordering and sequencing.
The eXtensible Text Framework (XTF) is a powerful open source platform for providing access to digital content. Developed and maintained by the California Digital Library (CDL), XTF functions as the primary access technology for the CDL's digital collections and other digital projects worldwide.
La Gazette de Leyde, parue essentiellement sous le titre Nouvelles extraordinaires de divers endroits (1679—1795/98), est l'une des plus intéressantes par sa longévité (1677-1811), sa continuité, son tirage (7000 exemplaires en 1785, sans compter les contrefaçons, d'après J. Popkin), sa qualité, et son indépendance par rapport à la France, ce qui la distingue de la Gazette d'Amsterdam.
Newspaper collections are the subject of an increasing number of large-scale digitisation projects. In Papers Past (http://paperspast.natlib.govt.nz), a collection of over a million newspaper pages, the introduction of full-text search has made a wealth of information findable that was previously hidden. The search feature is dependent on text extracted from the newspaper page images with Optical Character Recognition (OCR), so any improvement in OCR accuracy will add value to the collection by improving our users' chances of finding useful information.
Cairo will develop a tool for ingesting complex collections of born-digital materials, with basic descriptive, preservation and relationship metadata, into a preservation repository. The project is based on needs identified by the JISC-funded Paradigm project and the Wellcome Library's Digital Curation in Action project. It is a key building block in the partner institutions' strategy to develop digital repository architectures which can support the development of digital collections over the long-term.
OCRopus(tm) is a state-of-the-art document analysis and OCR system, featuring pluggable layout analysis, pluggable character recognition, statistical natural language modeling, and multi-lingual capabilities.
ALTO (Analyzed Layout and Text Object) is a XML Schema that details technical metadata for describing the layout and content of physical text resources, such as pages of a book or a newspaper. It most commonly serves as an extension schema used within the Metadata Encoding and Transmission Schema (METS) administrative metadata section. However, ALTO instances can also exist as a standalone document used independently of METS.
For the last 150 years, The New York Times has maintained one of the most authoritative news vocabularies ever developed. In 2009, we began to publish this vocabulary as linked open data.
ISO 2146 (Registry Services for Libraries and Related Organisations) is an international standard currently under development by ISO TC46 SC4 WG7 to operate as a framework for building registry services for libraries and related organisations. It takes the form of an information model that identifies the objects and data elements needed for the collaborative construction of registries of all types. It is not bound to any specific protocol or data schema. The aim is to be as abstract as possible, in order to facilitate a shared understanding of the common processes involved, across multiple communities of practice.
Omnifont OCR für Erkennung von Frakturschrift. ABBYY FineReader XIX ist eine spezielle Version der vielfach ausgezeichneten OCR Software FineReader für die Erkennung von Texten, die zwischen 1800 und 1938 in Frakturschrift gedruckt wurden.
Der Research Explorer erschließt über 17.000 Institute an deutschen Hochschulen und außeruniversitären Forschungseinrichtungen nach geografischen, fachlichen und strukturellen Kriterien. Alle verzeichneten Institutionen werden mit ihrer Postanschrift und Webadresse in laufend aktualisierter Form präsentiert.
Laut einer Forsa-Umfrage sind rund 30 Millionen Bundesbürger Mitglied mindestens einer Community. Dabei geht es den Nutzern in erster Linie um Kontaktpflege mit Freunden und Bekannten.
Das aktuelle Buch von Rainer Kuhlen "Erfolgreiches Scheitern - eine Götterdämmerung des Urheberrechts" kann jetzt auch beim Verlag direkt bestellt werden, aber auch frei als PDF heruntergeladen werden.
Startseite > Über uns > Struktur Struktur Zahlen, Daten und Fakten zur Initiative D21 Die Initiative D21 ist ein eingetragener gemeinnütziger Verein mit Sitz in Berlin. Sie ist Europas größte Partnerschaft von Politik und Wirtschaft für die Informationsgesellschaft. Annähernd 200 Mitgliedsunternehmen und - organisationen aller Branchen bringen gemeinsam mit den politischen Partnern in diesem Netzwerk praxisnahe non-profit Projekte voran - alle mit engem Bezug zu Informations- und Kommunikationstechnologien.
The broad aim of the project is to kick-start a critical mass of METS-based projects within the UK so ensuring that UK institutions are fully standards-based in their digital object management.
Links to several dozen newspapers' sites, sortable by name and by city. A drop-down menu lets you choose which section of the paper the links go to, which is useful though it needs some updating.
Les gazettes européennes de langue française couvrent toute l'histoire du 18e siècle européen. Die Französisch-sprachige Zeitungen in Europa decken die gesamte Geschichte des 18. Jahrhunderts in Europa.
W. Eger, und G. Kesper. Schriftenreihe Naturschutz in Waldeck-Frankenberg NABU Waldeck-Frankenberg, Postfach 33 34547 Edertal, (2011)Literaturverz. S. 475 - 483.