The research of ancient written artefacts results in an ever-increasing amount of digital data in different forms, ranging from raw images of artefacts to automatically generated data from advanced acquisition techniques. The manual analysis of this data is typically time consuming and can be subject to human error and bias. Therefore, a set of Pattern Analysis Software Tools (PAST) has been developed for the automatic analysis of visual and tabular patterns in the research data from the study of ancient written artefacts. These software tools have been developed by Hussein Mohammed to facilitate a more efficient study of written artefacts and to help scholars benefit from the rapid advancements in the fields of pattern analysis and artificial intelligence. Furthermore, these tools can provide new insights which can only be derived from the statistical analysis of research data. Each tool in PAST is developed and tested in close collaboration with experts from relevant fields of research in order to ensure its usability and applicability to actual research questions.
Die im Projekt Digital Plato (www.digital-plato.org) im Rahmen der Förderung durch die VolkswagenStiftung entwickelten Tools zur Paraphrasensuche via WMD sowie komplexen n-Grammen und dem Referenzannotierer ermöglichen eine völlig neue, webbasierte Analyse von Texten.
Die im Projekt Digital Plato (www.digital-plato.org) im Rahmen der Förderung durch die VolkswagenStiftung entwickelten Tools zur Paraphrasensuche via WMD sowie komplexen n-Grammen und dem Referenzannotierer ermöglichen eine völlig neue, webbasierte Analyse von Texten: Mit der rWMD (relaxed Word Mover’s Distance) sind Paraphrasenkandidaten in digitalisierten Textkorpora zu identifizieren, mit dem Referenzannotierer können die Relationen zwischen den so aufgefundenen Textpassagen in verschiedenen Kategorien annotiert werden und mit der auf komplexen n-Grammen basierenden Suche können über eine Variation der Parameter unterschiedliche Paraphrasenbegriffe für die jeweilige Suchanfrage modelliert werden. Alle gefundenen Textzitate werden mit CTS-URNs nach dem Protokoll der Canonical Text Services versehen, um eine persistente Zitierweise zu sichern. Exportmöglichkeiten für die Weiterverarbeitung stehen ebenfalls zur Verfügung.
Archetype is an integrated suite of web-based tools for the study of medieval handwriting, art and iconography. Using Archetype, scholars can annotate, describe and tag an image, or part of an image.
Text-Fabric is a Python3 package for Text plus Annotations. It provides a data model, a text file format, a binary format, an API, and apps for (ancient) text plus (linguistic) annotations.