PLLuM, czyli polska sztuczna inteligencja
Ministerstwo Cyfryzacji zaprezentowało dostępny od dzisiaj polski model językowy pod nazwą PLLuM. Polish Large Language Model to rodzina modeli sztucznej inteligencji (ang. AI, Artificial Intelligence), pozwalające przetwarzać i generować teksty w języku polskim. Zostały one opracowane przez polskich ekspertów IT i lingwistyki, w celu wspierania rozwoju kompetencji cyfrowych oraz innowacji w administracji publicznej i biznesie.
„PLLuM to dowód na to, że możemy rozwijać nowoczesne technologie na własnych warunkach, w naszym języku, z korzyścią dla obywatelek i obywateli. Tworzymy fundament pod inteligentne usługi publiczne i innowacje, które będą realnym wsparciem zarówno dla administracji, jak i biznesu.” – mówi Wicepremier i Minister Cyfryzacji Krzysztof Gawkowski.
Projekt, na zlecenie Ministerstwa Cyfryzacji, które jest właścicielem wyników i kontroluje rozwój PLLuM, realizowany był przez konsorcjum sześciu podmiotów: Politechnika Wrocławska (lider projektu), Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN, Naukowa i Akademicka Sieć Komputerowa (NASK-PIB), Ośrodek Przetwarzania Informacji (OPI-PIB), Uniwersytet Łódzki. W 2025 roku dołączy Centralny Ośrodek Informatyki oraz Akademickie Centrum Komputerowe CYFRONET AGH.
Główne zalety polskiego modelu językowego to:
elastyczność i skalowalność – model wykorzystuje od 8 do 70 miliardów parametrów, pozwalających precyzyjnie generować treści w języku polskim. *) W rodzinie modeli PLLuM znajdują się m.in. modele w architekturze MoE (ang. Mixture of Experts) ze zrównoważonym wyborem ekspertów oraz wyspecjalizowane modele RAG (ang. Retrieval Augmented Generation).
bazowanie na etycznym pozyskiwaniu danych – wersje komercyjne wykorzystują zasoby tekstowe właścicieli, którzy udzielili licencji konsorcjum twórców, a także zasoby, które mogą być wykorzystywane do budowy w pełni otwartego modelu, zgodnie z ustawą o prawie autorskim i prawach pokrewnych oraz przepisami UE, jak również modeli naukowych (m.in. Common Crawl).
możliwość dostrajania modelu na autorskich zbiorach danych i dziesiątkach tysięcy instrukcji (prompty oraz oczekiwane odpowiedzi modelu) oraz preferencji (prompty i różne odpowiedzi oceniane pod kątem jakościowym przez zespół ekspertów).
budowanie ekosystemu polskich modeli językowych – razem z modelem Bielik będzie promowana sztuczna inteligencja tworzona w Polsce tak, aby #AIMadeInPoland była coraz lepsza i znajdowała szerokie zastosowanie w administracji publicznej, biznesowe oraz społeczne.
PLLuM jest dostosowany do specyfiki języka polskiego oraz terminologii używanej administracji publicznej, korzysta z danych organicznych (opracowywanych ręcznie, a nie przy użyciu innych modeli językowych) oraz trenowany na polskich zasobach, więc bardzo dobrze radzi sobie z wyzwaniami fleksji i złożonej składni, generując poprawnie treści w języku polskim.
Dotychczas na projekt wydanych zostało 14,5 mln zł, a kolejne 19 mln zł pozwoli na wdrożenie modelu w administracji publicznej i rozszerzenie współpracy o nowych partnerów. Lider konsorcjum HIVE – Ośrodek Badań nad Bezpieczeństwem SI w NASK – będzie koordynować prace wdrożeniowe PLLuM w usługach administracji publicznej.
PLLuM m.in. dostarczy zaawansowane rozwiązania dla administracji publicznej i tym samym wesprze dalszą cyfryzację Polski:
Wirtualny asystent w aplikacji mObywatel wesprze obywateli w uzyskiwaniu informacji publicznych.
Inteligentny asystent urzędniczy zautomatyzuje przetwarzanie dokumentów, analizę treści, wyszukiwanie informacji i wsparcie w udzielaniu odpowiedzi na pytania obywateli.
Ułatwi także rozwój aplikacji edukacyjnych, tłumaczeń i pomoc nauczycielom w prowadzeniu angażujących lekcji z użyciem najnowszych technologii.
Rozwój projektu umożliwi jeszcze szersze zastosowanie AI w życiu codziennym. Polska ma szansę stać się jednym z liderów w rozwoju modeli językowych, co niewątpliwie może przełożyć się na wzrost innowacyjności i konkurencyjności całej gospodarki, a także rozwój edukacji. [MI]
PLLuM jest dostępny na stronie: http://pllum.clarin-pl.eu
Modele można pobrać na stronie: https://router.huggingface.co/CYFRAGOVPL
*) UWAGA: Ten artykuł został napisany przez człowieka bez użycia sztucznej inteligencji, na podstawie informacji prasowej przekazanej przez Ministerstwo Cyfryzacji.
Opublikuj komentarz
Musisz się zalogować, aby móc dodać komentarz.