2012. Metadata Statistics for a Large Web Corpus
ABSTRACT
We provide an analysis of the adoption of metadata standards on the Web based a large crawl of the Web. In particular, we look at what forms of syntax and vocabularies publishers are using to mark up data inside HTML pages. We also describe the process that we have followed and the difficulties involved in web data extraction.
Abstract. In order to support web applications to understand the content of HTML pages an increasing number of websites have started to annotate structured data within their pages using markup formats such as Microdata, RDFa, Microformats. The annotations are used by Google, Yahoo!, Yandex, Bing and Facebook to enrich search results and to display entity descriptions within their applications. In this paper, we present a series of publicly accessible Microdata, RDFa, Microformats datasets that we have extracted from three large web corpora dating from 2010, 2012 and 2013.
K. Angerbauer. Haufe Verlag, München, 1. Auflage edition, (2013)Verfasserangabe: Klaus Angerbauer ; Online-Ressource Kann nicht per Fernleihe bestellt werden! ; Quelldatenbank: UBSI-x.
M. Milz. Springer Fachmedien Wiesbaden, Wiesbaden, (2013)Verfasserangabe: von Markus Milz ; Online-Ressource Kann nicht per Fernleihe bestellt werden! ; Quelldatenbank: UBSI-x ; Format:marcform: print ; Umfang: XVI, 275 S. 87 Abb.
C. von Au. Leadership und Angewandte Psychologie Springer Fachmedien Wiesbaden, Imprint: Springer, Wiesbaden, (2017)Verfasserangabe: herausgegeben von Corinna von Au ; Online-Ressource Kann nicht per Fernleihe bestellt werden! ; Quelldatenbank: UBSI-x ; Format:marcform: print ; Umfang: 1 Online-Ressource (XVI, 235 S. 42 Abb).
G. Stahl. Managementwissen für Studium und Praxis Reprint 2018 edition, (2018)Verfasserangabe: Günter K. Stahl ; Online-Ressource Kann nicht per Fernleihe bestellt werden! ; Mode of access: Internet via World Wide Web ; Quelldatenbank: UBSI-x ; Format:marcform: print ; Umfang: 1 online resource (372 p.).
M. Pausch, and S. Matten. Springer Fachmedien Wiesbaden, Imprint: Springer, Wiesbaden, (2018)Verfasserangabe: von Markus J. Pausch, Sven J. Matten ; Online-Ressource Kann nicht per Fernleihe bestellt werden! ; Quelldatenbank: UBSI-x ; Format:marcform: print ; Umfang: 1 Online-Ressource (XI, 116 S.).