Die Tübinger Baumbank des Deutschen / Schriftsprache (TüBa-D/Z) ist ein syntaktisch annotiertes Korpus auf der Grundlage der Zeitung "die tageszeitung" (taz). Sie umfasst zur Zeit ca. 36 000 Sätze bzw. 630 000 Worte.
Natural Language systems have evolved tremendously in the past few years from dealing only with small handcrafted examples to extremely large, real-world applications.
Z. Zhang, X. Han, Z. Liu, X. Jiang, M. Sun, und Q. Liu. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, Seite 1441--1451. Florence, Italy, Association for Computational Linguistics, (Juli 2019)
S. Bordia, und S. Bowman. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop, Seite 7--15. Minneapolis, Minnesota, Association for Computational Linguistics, (Juni 2019)