
Ministerstwo Cyfryzacji zaprezentowało polski model językowy PLLuM – rodzinę modeli sztucznej inteligencji, która pozwala przetwarzać i generować teksty w języku polskim. Dostępny jest już dla każdego a w przyszłości wspomoże m.in. pracę w administracji publicznej. Do jego wytrenowania użyto ponad 100 miliardów słów.
I ciekawostka – portal Twój Sącz ma w tym swój mikroskopijny, ale jednak udział. Treści serwisu twojsacz.pl na podstawie umowy licencyjnej udzielonej konsorcjum przygotowującemu model językowy (na czele stoi Politechnika Wrocławska) również były i są wykorzystywane do szkolenia PLLuM.
– Polski model językowy jest elastyczny i skalowalny – wykorzystuje od 8 do 70 miliardów parametrów. Pozwala na precyzyjne generowanie treści w języku polskim. Mniejsze wersje dobrze sprawdzają się w szybkich zadaniach, podczas gdy większe modele oferują wyższą precyzję i kontekstową spójność w rozumieniu języka polskiego – podaje Ministerstwo Cyfryzacji, które w poniedziałek zaprezentowało PLLuM (Polish Large Language Models).
Jak podkreśla Ministerstwo Cyfryzacji, polski model bazuje na etycznym pozyskiwaniu danych. Wersje do użytku komercyjnego wykorzystują zasoby tekstowe od właścicieli, którzy udzielili licencji konsorcjum. Wśród dziesiątek współpracujących z prowadzącymi projekt instytucjami: Politechniką Wrocławską, NASK Państwowym Instytutem Badawczym, Instytutem Podstaw Informatyki Polskiej Akademii Nauk, Ośrodkiem Przetwarzania Informacji – Państwowym Instytutem Badawczym, Uniwersytetem Łódzkim oraz Instytutem Slawistyki Polskiej Akademii Nauk – znalazł się także serwis Twój Sącz.
– Im lepsze będą te teksty – bardziej informatywne, prawdziwe, staranniej zredagowane, zróżnicowane stylistycznie, ładne – jakie chcielibyśmy stawiać za wzór – tym lepszej, żywszej i autentyczniejszej polszczyzny nauczy się nasz model – tłumaczył nam prośbę o wykorzystanie materiałów naszego serwisu do prac przy tworzeniu modelu językowego dr hab. Maciej Piasecki, prof. Politechniki Wrocławskiej, koordynator projektu.
Projekt realizowany jest od początku zeszłego roku na zlecenie Ministerstwa Cyfryzacji, które jest właścicielem wyników i kontroluje rozwój PLLuM. Do tej pory wydano na niego 14,5 mln zł, a kolejne 19 mln zł mają pozwolić na wdrożenie go w administracji publicznej oraz rozszerzenie współpracy o nowych partnerów jak Centralny Ośrodek Informatyki oraz Akademickie Centrum Komputerowe CYFRONET AGH.
PLLuM w niedalekiej przyszłości ma być wykorzystany m.in. w aplikacji mObywatel (jako wirtualny asystent). Ponadto jako asystent urzędniczy, który zautomatyzuje przetwarzanie dokumentów, analizę treści, wyszukiwanie informacji i zapewni wsparcie w udzielaniu odpowiedzi na pytania obywateli i obywatelek. Ministerstwo Cyfryzacji zapowiada także, że polski model językowy ułatwi rozwój aplikacji edukacyjnych, tłumaczeń i pomoc nauczycielom i nauczycielkom w prowadzeniu angażujących lekcji z użyciem najnowszych technologii.
PLLuM jest dostępny na stronie http://pllum.clarin-pl.eu/
(JO)