WCRFT to tager morfo-syntaktyczny dla języka polskiego. Tager łączy technikę warunkowych pól losowych (CRF) ze znakowaniem warstwowym (tiered tagging).

Tager został napisany w Pythonie, ale korzysta z modułów napisanych w języku C++:

  • klasyfikator CRF++
  • formalizm opisu cech morfo-syntaktycznych WCCL,
  • biblioteka corpus2 do obsługi korpusów oznakowanych i tagsetów.

Do tagowania czystego tekstu konieczne jest użycie analizatora morfologicznego, polecamy w tym celu system MACA.

Szczegółowy opis, dostęp do kodów źródłowych oraz instrukcja instalacji znajdują się na stronie projektu.