Osiągnięcia zespołu badawczego

Dla pełniejszej informacji o planowanym projekcie chcielibyśmy zaoferować wybrane informacje o naszych osiągnięciach. Zespół badawczy, który zamierza zrealizować grant, dysponuje dużym doświadczeniem w realizacji analogicznych dokumentacyjnych przedsięwzięć. Oto krótki opis kilku z nich:

1. Narodowy Fotokorpus Języka Polskiego

2. Fotosuplement do Słownika warszawskiego

3. 50 000 słów. Indeks tematyczno-chronologizacyjny 1918-1939

4. Odkrywka. NEW GOOGLE. System wyszukiwania w tekstach historycznych

5. Biogram Narodu

Osobno chcielibyśmy przybliżyć miejsce pracy głównych wykonawców projektu: Chair of Korean Studies, Institute of Linguistics.

Narodowy Fotokorpus Języka Polskiego

Projekt kierowany przez Jana Wawrzyńczyka oraz Piotra Wierzchonia stanowi największą kolekcję XX-wiecznej polskiej leksyki wraz z poświadczeniem cytatowym. Jego cechą wyróżniającą jest bezwyjątkowe ukazanie cytatów w postaci fotodokumentacyjnej, tzn. w takiej, w jakiej ukazały się one w druku. W ramach korpusu zgromadzono materiał z okresu 1901–2000, natomiast za kryterium wyboru przyjęto brak jednostki w pierwszym słowniku ortograficznym XX wieku – Słowniku ortograficznym języka polskiego Władysława Kokowskiego (1903). Dzięki tym założeniom baza w sposób znaczący uzupełnia wiedzę o polskim słownictwie, gdyż wchodzący w jej skład zbiór jednostek obejmuje pozycje w dużej mierze w ogóle nieznane polskiej leksykografii lub takie, dla których wysuwano późniejsze hipotezy chronologizacyjne.

Strona: www.nfjp.pl

Fotosuplement do Słownika warszawskiego

Trzydzieści tomów autorstwa Piotra Wierzchonia wydanych w ramach serii Depozytorium leksykalne języka polskiego (odpowiednio numery 11-40) stanowi zbiór polskiego słownictwa lat 30. XX w., niezarejestrowanego w Słowniku warszawskim z roku 1900-1927.

Fot. 9. 30 tomów książki prof. Piotra Wierzchonia

Obejmująca 77 tysięcy jednostek z okresu 1930-1939 praca jest jednocześnie próbą rekonstrukcji siatki haseł zniszczonego w czasie II wojny światowej suplementu do tego opracowania. Każdy ujęty w siatce hasłowej wyraz został ukazany wraz z poświadczeniem fotocytatowym zgodnie z dyrektywami, na których oparta jest teoria lingwochronologizacji. Opracowanie stanowi obecnie najobfitszy materiał do badań nad leksyką lat 30. XX w.

50 000 słów. Indeks tematyczno-chronologizacyjny 1918-1939

„50 000 słów. Indeks tematyczno-chronologizacyjny 1918-1939” to projekt mający na celu stworzenie słownika tematycznego polszczyzny okresu międzywojennego. Planowane jest opracowanie materiału związanego z poszczególnymi dziedzinami (astronomia, biologia, chemia itd.), jak również z różnymi domenami życia społeczno-kulturalnego (np. religia, okultyzm, polityka, sport, kinematografia, życie codzienne). Obecnie trwa opracowywanie listy haseł indeksu.

Indeks tematyczno-chronologizacyjny 1918-1939 zademonstruje w fotocytatach bogactwo leksyki tematycznej polszczyzny międzywojennej i ukaże oblicze II Rzeczpospolitej przez pryzmat wielu sfer życia społecznego.

Odkrywka. NEW GOOGLE

Odkrywka jest „wyszukiwarką w historii”, systemem umożliwiającym poszukiwanie jednostek języka w zbiorze zdigitalizowanych tekstów napisanych w języku polskim. W projekcie w charakterze korpusu diachronicznego, liczącego setki tysięcy tekstów XIX i XX wieku (a także, w mniejszej ilości, wieków wcześniejszych), wykorzystywane są zbiory udostępniane przez biblioteki cyfrowe oraz inne źródła internetowe. Środowisko wyposażone jest w narzędzia wyszukiwania wyrazów i fraz oraz narzędzia pozwalające generować wykresy częstości dla jednostek języka. W chwili obecnej przedsięwzięcie ma charakter eksperymentalny, wypracowane narzędzia służą jednak do prowadzenia szybkich i efektywnych badań nad językiem, kulturą i historią Polski. Jest głównym źródłem materiału upublicznianego na stronie re-research.pl.

Biogram Narodu

Biogram Narodu. Stworzyliśmy narzędzie: Automatyczny Biograf. Jest to narzędzie, które z masy zdygitalizowanych tekstów historycznych (w chwili pisania tego tekstu: 3 miliony pozycji, ponad 20 milionów stron) wyłowi wszystkie wystąpienia nazwisk. Automatyczny Biograf oparty jest na dobrze ugruntowanych technikach informatycznych. Kluczowe zagadnienie tutaj to problem rozpoznawania tak zwanych bytów nazwanych (named entity recognition), zadanie niosące wiele wyzwań, ale jednak dobrze rozpoznane w literaturze przedmiotu i łatwiejsze niż na przykład tłumaczenie automatyczne czy rozpoznawanie mowy. Efektem działania Automatycznego Biografa będą:

• automatycznie wskazane wystąpienia odniesień do osób, tj. ich nazwisk (wraz z imionami, tytułami naukowymi itp.),

• wycinek tekstu w oryginalnej postaci dla każdego wystąpienia (fotodokumentacja),

• pozyskane automatycznie informacje o relacjach:

– czasowych (kto, co – kiedy?),

– przestrzennych (kto, co – gdzie?),

– społecznych (kto z kim?).

Aż wreszcie do ukoronowania poszukiwań, czyli do wyjaśnienia: (kto, co – dlaczego?). Chcemy ukazać LOS JEDNOSTKI.

Z punktu widzenia użytkownika serwisu najważniejsza funkcja Automatycznego Biografa to możliwość wyszukiwania wszystkich fragmentów zawierających wpisaną osobę. Innymi słowy: każdy użytkownik będzie mógł wpisać imię i nazwisko dowolnej osoby (czy to swojego przodka, czy to znanej postaci historycznej) i przejrzeć oryginalne teksty, w których pojawiło się odniesienie do tej osoby wraz z kontekstem czasowym, przestrzennym i społecznym oraz wybranymi wizualizacjami (wykres zmian częstości w czasie, mapy, sieć społeczna).

Strona: www.biogramnarodu.pl

Re-research.pl

Re-research.pl jest blogiem badawczym, stworzonym przez pracowników Instytutu Językoznawstwa (IJ) oraz Pracowni Systemów Informacyjnych (PSI) Uniwersytetu im. Adama Mickiewicza w Poznaniu. Autorami strony, odpowiedzialnymi zarówno za informatyczną stronę przedsięwzięcia, jak i sprawującymi pieczę nad jego zawartością merytoryczną, są: Piotr Wierzchoń (IJ), Filip Graliński (PSI), Daniel Dzienisiewicz (IJ), Łukasz Borchmann (IJ), Rafał Jaworski (PSI) i Szymon Kwapiszewski (IJ). Strona rozpoczęła swoją działalność 1 września 2016 r. i jest dostępna w czterech wersjach językowych: polskiej, angielskiej, niemieckiej i rosyjskiej. W zakładce O stronie autorzy przedstawiają portal:

RE-RESEARCH.PL to interdyscyplinarny blog badaczy z Instytutu Językoznawstwa i Pracowni Systemów Informacyjnych Uniwersytetu Adama Mickiewicza. Połączyła nas pasja lingwochronologizacyjna. Obecnie pracujemy razem w ramach grantu 50 000 słów. Indeks tematyczno-chronologizacyjny 1918-1939 zaplanowanego na lata 2016-2019 i realizowanego w ramach Narodowego Programu Rozwoju Humanistyki. Na blogu piszemy o naszych pracach realizowanych w ramach grantu, ale też o innych sprawach, którymi żyjemy jako badacze (pocztówki, legendy miejskie, latające spodki itd.).

Interesuje nas głównie językoznawstwo, ale chcemy, żeby nasz blog był prawdziwie interdyscyplinarny, pragniemy, by czytywali nas historycy i informatycy, psycholodzy i socjolodzy, astronomowie i teologowie, archiwiści i okultyści.

Pragnąc regularnie i z dużą częstotliwością dostarczać nowe treści, twórcy obiecali czytelnikom publikować nowy wpis każdego dnia. W roku 2016, począwszy od 1 września, obietnica została dotrzymana: na stronie opublikowano łącznie 123 wpisy o zróżnicowanej tematyce. Zawartość merytoryczną bloga można sklasyfikować według następujących ram tematycznych:

1) językoznawstwo,

2) folklorystyka,

3) relacje z konferencji naukowych,

4) varia.

Ostatnia z wymienionych grup obejmuje wpisy okolicznościowe oraz teksty dotyczące dziedzin niezwiązanych z tymi wymienionymi w punktach 1) i 2), takimi jak np. informatyka czy historia. Z uwagi na (dotychczas) w przeważającej mierze językoznawczy charakter strony, w niniejszym tekście uwypuklony zostanie ten aspekt. Większość udostępnionych wpisów − częstokroć napisanych w popularnej formie i okraszonych humorystyczną narracją, niekoniecznie operującą hermetycznym językiem naukowym − oscyluje wokół tematyki lingwistycznej związanej z zagadnieniami lingwochronologizacji (w tym badaniami o charakterze redatacyjnym), semantyki, wariantywności form czy frekwencji wyrazów i jednostek wielowyrazowych (wyrażenia, zwroty, frazy) w korpusach tekstów historycznych.

Chair of Korean Studies, Institute of Linguistics

The first period of teaching of Korean at the Institute of Linguistics began in 1988 and the first lecturer was Dr. Romuald Huszcza of Warsaw University. The participants were mainly students of Japanese and Chinese Philology. The second stage of teaching Korean at Adam Mickiewicz University began in October of 1998 when a Korean language lecturer started teaching at the Institute of Linguistics. The Korean language obtained the status of language of specialization, one of the keystones of the newly created course of studies, Ethnolinguistics. Kyong-Geun Oh, a graduate of Polish Philology at Jagiellonian University in Cracow, was employed as the first lecturer. For two years he taught the Korean language and elements of Korean culture to a group of about 15 students. There were three groups of students in the first, second and forth years, in all around 40 persons learning Korean as their language of specialization. Their course of studies included the following subjects: 1. Practical Knowledge of Korean, 2. Korean Grammar, 3. Korean Culture and Civilization, and 4. Korean Literature and story.

In the course of time, the idea of establishing Korean Philology developed, and it gained support from of the Korean Embassy in Poland as well as from the academic circles in Korea, most notably Professor Cheong Byung-Kwon, the then Dean of Academic Affairs at Hankuk University of Foreign Studies. As the result of many efforts on both sides, the five-year program of Korean studies began in the 2003/2004 academic year. Currently, about 30 students enter the Korean Philology each year, receiving instruction from three Korean staff members. The students organize a Day of Korean Culture every year that attracts many participants interested in Korean language and lifestyle. Graduates of the course find numerous career opportunities, contributing to the development of Polish-Korean exchange in the academic, cultural and business fields.

In 1998, Institute of Linguistics concluded a cooperation agreement with the Department of Polish, Hankuk University. To date, 150 students have taken part in various exchange programs. The Institute has also an exchange agreement with Korea National Open University since 2007 that resulted in book donations among others. In 2006, Professor Stanisław Lorenc, the then Rector of Adam Mickiewicz University visited Korea, taking part at a series of meetings at Hankuk University.

In recognition of his accomplishments, including the supervision of the translation of Pan Tadeusz into Korean, Professor Cheong Byung-Kwon received the title of Doctor Honoris Causa from Poznań University in 2012.

Zobacz strony:

https://www.facebook.com/buchaechum.polska/

http://ij.amu.edu.pl/filologia-koreanska/