Data mining & corpora
W czasie tego kursu Studenci nauczą się pracować na korpusie języka naturalnego oraz samodzielnie tworzyć, opracowywać i analizować duże próbki językowe. Praca na materiale językowym odbywa się przy użyciu różnych aplikacji dostępnych online oraz offline. Przed przystąpieniem do pracy badawczej Studenci uzyskają podstawową wiedzę w tematach: big data, przetwarzanie języków naturalnych, stylometria, tworzenie korpusów językowych. W czasie trwania kursu Studenci pozostają pod opieką dwóch Prowadzących. Zaliczenie kursu odbywa się na podstawie dwóch projektów badawczych (projekt mniejszy w połowie kursy, projekt większy na zakończenie kursu). Wyniki drugiego projektu zostaną dodatkowo opracowane statystycznie (MCA-multiple correspondence analysis – oczywiście z pomocą Prowadzącej). Kurs ten jest doskonałą okazją do opracowania materiału badawczego wykorzystanego w pracy magisterskiej.