Krótko o Słowosieci

Wordnet jest siecią leksykalno-semantyczną, której węzłami są jednostki leksykalne, a nićmi spajającymi całość - relacje semantyczne pomiędzy jednostkami. Pierwszy wordnet na świecie - Princeton WordNet, powstał w latach 80. na Uniwersytecie Princeton i użyczył nazwy oraz struktury wielu takim bazom wiedzy dla innych języków. Istnieją bardzo liczne komercyjne i badawcze zastosowania wordnetów w informatyce i inżynierii oprogramowania, nade wszystko w sztucznej inteligencji i w przetwarzaniu języków.

Skuteczne wyszukiwanie informacji w nieustannie rosnącej ilości tekstu na Internecie wymaga starannej selekcji, w czym wordnety są z reguły bardzo pomocne. Jak każdy słownik, wordnet musi zawierać informację dokładną i - na ile się da - kompletną, toteż konstrukcja nowego wordnetu kosztuje wiele wysiłku. Prace zainicjowane kilkanaście lat temu doprowadziły do powstania wstępnych wersji wordnetów dla szeregu języków europejskich i azjatyckich.

Słowosieć to największy polski wordnet, konstruowany od 2006 roku przez Grupę Technologii Językowych Politechniki Wrocławskiej. Obecnie udostępniona wersja Słowosieci 3.0 liczy 170000 synsetów, 244000 jednostek leksykalnych oraz 670000 relacji leksykalnych (szczegółowy wykaz relacji w trakcie przygotowania).

 

Wytyczne do budowy Słowosieci

Słowosieć budowana jest przez lingwistów, pracujących pod nazdzorem koordynatora i przy wsparciu programistów. Podczas swojej pracy lingwiści posługują się wytycznymi, ułatwiającymi budowę spójnej sieci oraz zachowanie wysokiej zgodności pomiędzy poszczególnymi edytorami. Wszystkie te wytyczne zostały udostępnione na stronie Clarin.

Skrócone omówienie relacji w Słowosieci znajduje się tutaj.

 

Wykorzystanie Słowosieci

W 2009 udostępniona została w Internecie pierwsza wersja Słowosieci. Decyzją władz Politechniki Wrocławskiej Słowosieć jest udostępniana nieodpłatnie do wszelkich zastosowań (również komercyjnych) w oparciu o licencję wzorowaną na licencji Princeton WordNet. Od 2013 roku Słowosieć jest rozwijana w ramach części projektu Clarin. Jesteśmy otwarci na współpracę — zarówno o charakterze naukowym, jak i w ramach działań komercyjncych.

Obecnie Słowosieć jest dostępna w wersji serwisu WWW, uaktualnianej wraz z postępem prac. Została również stworzona aplikacja Słowosieci mobilnej, do pobrania w Google Play. Możliwe jest również przeglądanie Słowosieci w formie takiej, w jakiej widzą ją edytorzy Słowosieci, poprzez aplikację WNLoom-Viewer (do pobrania ze strony projektu Clarin). Krótki instruktaż korzystania z aplikacji znajduje się w materiałach z warsztatów Clarin.

Pełną bazę Słowosieci można pobrać po przesłaniu krótkiego formularza kontaktowego, znajdującego się na stronie WWW.

Udostępniamy również aplikację do rozbudowy Słowosieci WordnetLoom. W przypadku zainteresowania jej użyciem prosimy o kontakt.

 

Publikacje o Słowosieci

W celu dokładniejszego zapoznania się z naszą pracą, zachęcamy do odwiedzenia strony z publikacjami na temat Słowosieci.

W przypadku wykorzystania Słowosieci w Państwa pracy, prosimy o cytowanie następujących pozycji:

 

Dziękujemy za korzystanie ze Słowosieci i zachęcamy do kontaktu z nami

Zespół Słowosieci