Trabajo inscrito dentro del marco del Proyecto de Investigación concedido por El Ministerio de Economía y Competitividad (anterior Ministerio de Ciencia e Innovación), referencia FFI2011-2472, Análisis léxico y discursivo de corpus paralelos y comparables (español-inglés-francés) de páginas web de promoción turística, 2011-2014
El Corpus AnCora es un corpus de catalán (AnCora-CA) y de español (AnCora-ES) constituido fundamentalmente por textos periodísticos. El corpus contiene 500.000 palabras por cada lengua.
El Corpus de Referencia del Español Actual (CREA) es un conjunto de textos de diversa procedencia, almacenados en soporte informático, del que es posible extraer información para estudiar las palabras, sus significados y sus contextos.