Witold Kieraś is a member of the Linguistic Engineering Group at the Institute of Computer Science, Polish Academy of Sciences.

Publications by Witold Kieraś

Selected works authored or co-authored by Witold Kieraś from our institute bibliography.

2025

PLLuM: A Family of Polish Large Language Models

Authors

  • Jan Kocoń
  • Maciej Piasecki
  • Arkadiusz Janz
  • Teddy Ferdinan
  • Radliński
  • Bartłomiej Koptyra
  • Marcin Oleksy
  • Stanisław Woźniak
  • Paweł Walkowiak
  • Konrad Wojtasik
  • Julia Moska
  • Tomasz Naskręt
  • Bartosz Walkowiak
  • Mateusz Gniewkowski
  • Kamil Szyc
  • Dawid Motyka
  • Dawid Banach
  • Jonatan Dalasiński
  • Ewa Rudnicka
  • Bartłomiej Alberski
  • Tomasz Walkowiak
  • Aleksander Szczęsny
  • Maciej Markiewicz
  • Tomasz Bernaś
  • Hubert Mazur
  • Kamil Żyta
  • Mateusz Tykierko
  • Grzegorz Chodak
  • Tomasz Kajdanowicz
  • Przemysław Kazienko
  • Agnieszka Karlińska
  • Karolina Seweryn
  • Anna Kołos
  • Maciej Chrabąszcz
  • Katarzyna Lorenc
  • Aleksandra Krasnodębska
  • Artur Wilczek
  • Katarzyna Dziewulska
  • Paula Betscher
  • Zofia Cieślińska
  • Katarzyna Kowol
  • Daria Mikoś
  • Maciej Trzciński
  • Dawid Krutul
  • Marek Kozłowski
  • Sławomir Dadas
  • Rafał Poświata
  • Michał Perełkiewicz
  • Małgorzata Grębowiec
  • Maciej Kazuła
  • Marcin Białas
  • Roman Roszko
  • Danuta Roszko
  • Jurgita Vaičenonienė
  • Andrius Utka
  • Paweł Levchuk
  • Paweł Kowalski
  • Irena Prawdzic-Jankowska
  • Maciej Ogrodniczuk
  • Monika Borys
  • Anna Bulińska
  • Wiktoria Gumienna
  • Witold Kieraś
  • Dorota Komosińska
  • Katarzyna Krasnowska-Kieraś
  • Kobyliński
  • Martyna Lewandowska
  • Marek Łaziński
  • Mikołaj Łątkowski
  • Dawid Mastalerz
  • Beata Milewicz
  • Agnieszka Anna Mykowiecka
  • Angelika Peljak-Łapińska
  • Sandra Penno
  • Zuzanna Przybysz
  • Michał Rudolf
  • Piotr Rybak
  • Karolina Saputa
  • Aleksandra Tomaszewska
  • Aleksander Wawer
  • Marcin Woliński
  • Joanna Wołoszyn
  • Alina Wróblewska
  • Bartosz Żuk
  • Filip Żarnecki
  • Konrad Kaczyński
  • Anna Cichosz
  • Zuzanna Deckert
  • Monika Garnys
  • Izabela Grabarczyk
  • Wojciech Janowski
  • Sylwia Karasińska
  • Aleksandra Kujawiak
  • Piotr Misztela
  • Maria Szymańska
  • Karolina Walkusz
  • Igor Siek
  • Jakub Kwiatkowski
  • Piotr Pęzik

2025

The PLLuM Instruction Corpus

Authors

  • Piotr Pęzik
  • Filip Żarnecki
  • Konrad Kaczyński
  • Anna Cichosz
  • Zuzanna Deckert
  • Monika Garnys
  • Izabela Grabarczyk
  • Wojciech Janowski
  • Sylwia Karasińska
  • Aleksandra Kujawiak
  • Piotr Misztela
  • Maria Szymańska
  • Karolina Walkusz
  • Igor Siek
  • Maciej Chrabąszcz
  • Anna Kołos
  • Agnieszka Karlińska
  • Karolina Seweryn
  • Aleksandra Krasnodębska
  • Paula Betscher
  • Zofia Cieślińska
  • Katarzyna Kowol
  • Artur Wilczek
  • Maciej Trzciński
  • Katarzyna Dziewulska
  • Roman Roszko
  • Tomasz Bernaś
  • Jurgita Vaičenonienė
  • Danuta Roszko
  • Paweł Levchuk
  • Paweł Kowalski
  • Irena Prawdzic-Jankowska
  • Marek Kozłowski
  • Sławomir Dadas
  • Rafał Poświata
  • Alina Wróblewska
  • Katarzyna Krasnowska-Kieraś
  • Maciej Ogrodniczuk
  • Michał Rudolf
  • Piotr Rybak
  • Karolina Saputa
  • Joanna Wołoszyn
  • Marcin Oleksy
  • Bartłomiej Koptyra
  • Teddy Ferdinan
  • Stanisław Woźniak
  • Maciej Piasecki
  • Paweł Walkowiak
  • Konrad Wojtasik
  • Arkadiusz Janz
  • Przemysław Kazienko
  • Julia Moska
  • Jan Kocoń

2022

UniMorph 4.0: Universal Morphology

Proceedings of the Language Resources and Evaluation Conference

Authors

  • Khuyagbaatar Batsuren
  • Omer Goldman
  • Salam Khalifa
  • Nizar Habash
  • Witold Kieraś
  • Gábor Bella
  • Brian Leonard
  • Garrett Nicolai
  • Kyle Gorman
  • Yustinus Ghanggo Ate
  • Maria Ryskina
  • Sabrina Mielke
  • Elena Budianskaya
  • Charbel El-Khaissi
  • Tiago Pimentel
  • Michael Gasser
  • William Abbott Lane
  • Mohit Raj
  • Matt Coler
  • Jaime Rafael Montoya Samame
  • Delio Siticonatzi Camaiteri
  • Esaú Zumaeta Rojas
  • Didier López Francis
  • Arturo Oncevay
  • Juan López Bautista
  • Gema Celeste Silva Villegas
  • Lucas Torroba Hennigen
  • Adam Ek
  • David Guriel
  • Peter Dirix
  • Jean-Philippe Bernardy
  • Andrey Scherbakov
  • Aziyana Bayyr-ool
  • Antonios Anastasopoulos
  • Roberto Zariquiey
  • Karina Sheifer
  • Sofya Ganieva
  • Hilaria Cruz
  • Ritván Karahóǧa
  • Stella Markantonatou
  • George Pavlidis
  • Matvey Plugaryov
  • Elena Klyachko
  • Ali Salehi
  • Candy Angulo
  • Jatayu Baxi
  • Andrew Krizhanovsky
  • Natalia Krizhanovskaya
  • Elizabeth Salesky
  • Clara Vania
  • Sardana Ivanova
  • Jennifer White
  • Rowan Hall Maudslay
  • Josef Valvoda
  • Ran Zmigrod
  • Paula Czarnowska
  • Irene Nikkarinen
  • Aelita Salchak
  • Brijesh Bhatt
  • Christopher Straughn
  • Zoey Liu
  • Jonathan North Washington
  • Yuval Pinter
  • Duygu Ataman
  • Marcin Woliński
  • Totok Suhardijanto
  • Anna Yablonskaya
  • Niklas Stoehr
  • Hossep Dolatian
  • Zahroh Nuriah
  • Shyam Ratan
  • Francis M. Tyers
  • Edoardo M. Ponti
  • Grant Aiton
  • Aryaman Arora
  • Richard J. Hatcher
  • Ritesh Kumar
  • Jeremiah Young
  • Daria Rodionova
  • Anastasia Yemelina
  • Taras Andrushko
  • Igor Marchenko
  • Polina Mashkovtseva
  • Alexandra Serova
  • Emily Prud'hommeaux
  • Maria Nepomniashchaya
  • Fausto Giunchiglia
  • Eleanor Chodroff
  • Mans Hulden
  • Miikka Silfverberg
  • Arya D. McCarthy
  • David Yarowsky
  • Ryan Cotterell
  • Reut Tsarfaty
  • Ekaterina Vylomova

2022

HerBERT Based Language Model Detects Quantifiers and Their Semantic Properties in Polish

Proceedings of the Language Resources and Evaluation Conference

Authors

  • Marcin Woliński
  • Bartłomiej Nitoń
  • Witold Kieraś
  • Jakub Szymanik

2021

SIGMORPHON 2021 Shared Task on Morphological Reinflection: Generalization Across Languages

Proceedings of the 18th SIGMORPHON Workshop on Computational Research in Phonetics, Phonology, and Morphology

Authors

  • Tiago Pimentel
  • Maria Ryskina
  • Sabrina J. Mielke
  • Shijie Wu
  • Eleanor Chodroff
  • Brian Leonard
  • Garrett Nicolai
  • Yustinus Ghanggo Ate
  • Salam Khalifa
  • Nizar Habash
  • Charbel El-Khaissi
  • Omer Goldman
  • Michael Gasser
  • William Lane
  • Matt Coler
  • Arturo Oncevay
  • Jaime Rafael Montoya Samame
  • Gema Celeste Silva Villegas
  • Adam Ek
  • Jean-Philippe Bernardy
  • Andrey Shcherbakov
  • Aziyana Bayyr-ool
  • Karina Sheifer
  • Sofya Ganieva
  • Matvey Plugaryov
  • Elena Klyachko
  • Ali Salehi
  • Andrew Krizhanovsky
  • Natalia Krizhanovsky
  • Clara Vania
  • Sardana Ivanova
  • Aelita Salchak
  • Christopher Straughn
  • Zoey Liu
  • Jonathan North Washington
  • Duygu Ataman
  • Witold Kieraś
  • Marcin Woliński
  • Totok Suhardijanto
  • Niklas Stoehr
  • Zahroh Nuriah
  • Shyam Ratan
  • Francis M. Tyers
  • Edoardo M. Ponti
  • Grant Aiton
  • Richard J. Hatcher
  • Emily Prud'hommeaux
  • Ritesh Kumar
  • Mans Hulden
  • Botond Barta
  • Dorina Lakatos
  • Gábor Szolnok
  • Judit Ács
  • Mohit Raj
  • David Yarowsky
  • Ryan Cotterell
  • Ben Ambridge
  • Ekaterina Vylomova

2020

Analiza fleksyjna tekstów historycznych i zmienność fleksji polskiej z perspektywy danych korpusowych

Poradnik Językowy

Authors

  • Marcin Woliński
  • Witold Kieraś

2020

Towards the Evaluation of Feature Embedding Models of the Fusional Languages

Human Language Technology. Challenges for Computer Science and Linguistics, 8th Language and Technology Conference, LTC 2017, Poznań, Poland, November 17–19, 2017, Revised Selected Papers

Authors

  • Alina Wróblewska
  • Katarzyna Krasnowska-Kieraś
  • Piotr Rybak

2017

Polish Evaluation Dataset for Compositional Distributional Semantics Models

Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)

Authors

  • Alina Wróblewska
  • Katarzyna Krasnowska-Kieraś

2017

Co jest zgodne z duchem kraftu? Próba korpusowego badania słownictwa związanego z piwem

Język Polski

Authors

  • Witold Kieraś

2017

Morfeusz 2 – analizator i generator fleksyjny dla języka polskiego

Język Polski

Authors

  • Witold Kieraś
  • Marcin Woliński

2017

Słownik gramatyczny języka polskiego – wersja internetowa

Język Polski

Authors

  • Witold Kieraś
  • Marcin Woliński

2017

Anotatornia 2 — An Annotation Tool Geared towards Historical Corpora

Authors

  • Marcin Woliński
  • Witold Kieraś
  • Dorota Komosińska

2016

Part of Speech Tagging for Polish: State of the Art and Future Perspectives

Proceedings of the 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2016)

Authors

  • Kobyliński
  • Witold Kieraś

2016

Mikrokorpus polszczyzny 1830-1918

Komunikacja specjalistyczna

Authors

  • Joanna Bilińska
  • Magdalena Derwojedowa
  • Witold Kieraś
  • Monika Kwiecień

2016

Dynamika zmian fleksyjnych i ortograficznych między reformami 1830-1918

Język Polski

Authors

  • Magdalena Derwojedowa
  • Witold Kieraś
  • Joanna Bilińska
  • Monika Kwiecień

2014

Korpus polszczyzny XIX wieku – od mikrokorpusu do korpusu średniej wielkości

Prace Filologiczne

Authors

  • Magdalena Derwojedowa
  • Witold Kieraś
  • Danuta Skowrońska
  • Robert Wołosz

2014

Współczesne narzędzia leksykograficzne a analiza tekstów dawniejszych

Polonica

Authors

  • Magdalena Derwojedowa
  • Witold Kieraś
  • Danuta Skowrońska
  • Robert Wołosz

2014

Na tysiąc żołnierza ledwie pięciu rosłych chłopa. O pewnej nietypowej konstrukcji z liczebnikiem

Bogactwo współczesnej polszczyzny

Authors

  • Witold Kieraś

2013

Polish LFG treebank on a shoestring

Proceedings of The Twelfth Workshop on Treebanks and Linguistic Theories (TLT12)

Authors

  • Katarzyna Krasnowska
  • Witold Kieraś

2012

Atrakcje wyjazdowe, czyli w obydwie strony bez wahadła. O słownictwie kibiców piłkarskich

Socjolingwistyka

Authors

  • Witold Kieraś