Rozmowa z Małgorzatą Sieniewicz, ze spółki “Literacka”, nt. sztucznej inteligencji
-Współczesny świat ma swoją maszynę parową – sztuczną inteligencję, która wyręczy człowieka z realizowania wielu niewdzięcznych zadań. O ile maszyny parowej można było się bać, bo była wielka, głośna i silna, o tyle sztuczna inteligencja nie jest widoczna, skrywa się gdzieś w automatach, a jej istota nie do końca jest jasna. Czym jest sztuczna inteligencja?
-Miałabym problem z wyczerpującym zdefiniowaniem sztucznej inteligencji. Obrazowo mówiąc możemy przyjąć, że to coś w rodzaju robota, który przetwarza bardzo dużą ilość danych i nie jest to algorytm, przez który przepuszczamy informacje i na końcu otrzymujemy wynik jaki przewidywaliśmy. Sztuczna inteligencja ma tę cechę, że uczy się na bieżąco analizowania danych i dlatego rezultat nie jest do przewidzenia. Widzimy z czego korzysta sztuczna inteligencja, jakie dane analizuje, ale nie jesteśmy w stanie stwierdzić jak je zinterpretuje korzystając z różnych algorytmów tworząc po drodze własne.
-Założyła Pani z koleżankami spółkę, której działalność oparta jest na sztucznej inteligencji. W jaki sposób ta inteligencja będzie wykorzystywana?
Sztuczną inteligencję wykorzystujemy do tworzenia systemu zaawansowanych rekomendacji książkowych
-Najkrócej mówiąc do czytania książek, ich analizowania i tworzenia czegoś, co w spółce nazywamy recenzją, choć nie jest to taka typowa recenzja np. prasowa. Sztuczną inteligencję wykorzystujemy do tworzenia systemu zaawansowanych rekomendacji książkowych, które pomogą czytelnikowi dobrać dla siebie właściwą pozycję. Tylko w Polsce ukazuje się rocznie 35 tys. tytułów, czyli prawie 100 pozycji dziennie.
-To może stąd wzięło się powiedzenie, że więcej osób pisze książki niż je czyta…
-Mamy rzeczywiście nadmiar wszystkiego, w tym książek. Wiele osób ma problem z wyborem odpowiedniego dla siebie tytułu. Nie sposób się połapać na rynku wydawniczym. Kiedyś to było prostsze. Mówiło się księgarzowi co nas interesuje, a ten szybko wskazywał nam właściwą pozycję. Dzisiaj to raczej niemożliwe, bo także ludzie z branży mają problemy z monitorowaniem rynku wydawniczego. Chcemy pomóc księgarzom w rekomendowaniu książek. Obecnie wszystkie zapisane są w pliku cyfrowym więc mogą być przeanalizowane przez sztuczną inteligencję. Chodzi o beletrystykę, literaturę faktu, czyli książki z fabułą. Analizujemy język książki, znajdujemy prawidłowości pomiędzy słowami i porównujemy z naszą bazą danych opracowaną przez człowieka. Mamy zebranych kilka tysięcy ocen książek. Te oceny polegają na przypisaniu książkom cech i poziomu ich natężenia. Na przykład książka o zabarwieniu romantycznym. Może mieć zabarwienie na poziomie zero, albo na poziomie najwyższym. Jest w tym trochę subiektywizmu osoby, która to czyta, ale staramy się obiektywizować opinię poprzez ekspertów i społeczność internetową. Sprawdzamy jak przeciętni czytelnicy oceniliby poziom natężenia konkretnych cech i dopiero wtedy sztuczna inteligencja szuka odpowiedzi na pytanie: dlaczego recenzent przypisał właśnie te cecho do konkretnej książki? Przy następnej książce sztuczna inteligencja wykorzystuje poprzednią wiedzę i efekt powinien być jeszcze lepszy. Kolejna książka, kolejna lepsza recenzja itd. W tej chwili wrzucamy do komputera ok. 10 tys. nowych ebookow, które mamy ocenione w bazie i sprawdzamy jak oceni je sztuczna inteligencja. Czy zaopiniuje podobnie jak człowiek na poziomie 90-95 procent. Jeżeli nie, wdrażamy kolejny algorytm, żeby ocena była taka, jak opinia człowieka. Po uzyskaniu prawidłowego algorytmu dodajemy nowe książki i w tym momencie poruszamy się praktycznie w obszarze całej dostępnej literatury.
-Rekomendowanie dotyczy tylko książek napisanych w języku polskim?
-W tej chwili tak, ale w przyszłości chcielibyśmy stworzyć system rekomendacji także dla książek napisanych po angielsku. Zbieramy doświadczenie na podstawie książek polskich. Później te same algorytmy wykorzystamy do analizy książek w języku angielskim. Nie wystarczy przypisanie książek do standardowych kategorii typu kryminał, romans, literatura dla dzieci. Nasze rekomendacje porządkują lektury według ich treści. Jeśli czytelnik lubi książki z dobrym zakończeniem, zabawne, lekko zakręcone i z nutą erotyki, to takie właśnie pozycje zaproponuje system rekomendacji. Jeśli inny czytelnik woli, aby lektura dawała do myślenia, była poruszająca lub wyciskała łzy, to system takie tytuły dobierze. Informacje o książce opracowane przez człowieka zbierane są w bazie danych i wykorzystywane w algorytmie, który wciąż jest udoskonalany. Ten innowacyjny system umożliwia zestawienie cech podobieństwa książek z popularnością tytułów na portalach czytelniczych i w bibliotekach. Te ostatnie, mając olbrzymią bazę danych o tym kto i co wypożyczał, nie mają żadnego systemu rekomendacyjnego. Ciągłe doskonalenie algorytmu da czytelnikom spersonalizowane propozycje tytułów dopasowane do ich potrzeb i zainteresowań. W branży księgarskiej jest jeszcze taki problem, że książki wskutek wyprzedaży, znikają z rynku i pojawiają się nowe. Chodzi o to, aby te nowe pozycje były recenzowane i rekomendowane w sposób automatyczny już bez udziału człowieka.
-Co tak naprawdę jest rezultatem tych działań. Kwiecista recenzja, tytuł kolejnej książki do przeczytania? Jak rezultaty projektu można wykorzystać w praktyce?
W przypadku zakupu butów tradycyjny system rekomendacji może się sprawdzać, ale w przypadku książki już nie
-Rezultatem jest tzw recenzja, wskazanie dopasowujące lekturę do nastroju bądź celu lektury. W bibliotekach internetowych mamy także teraz podpowiedzi jaką książkę powinniśmy kupić. Ale te wskazania oparte są na zupełnie innych danych. Najczęściej na prostym algorytmie sumującym popularność zakupów innych tytułów lub na podstawie historii przeglądania. Dlatego też, gdy kupimy jakąś książkę przez dłuższy czas system rekomendacyjny poleca nam tytuły, które w ogóle nas nie interesują. W przypadku zakupu butów tradycyjny system może się sprawdzać, ale w przypadku książki już nie. W naszym projekcie to wskazanie jest oparte na znacznie większej liczbie przesłanek z udziałem opinii czytelników i sztucznej inteligencji. Tak zbudowany system rekomendacji może znaleźć zastosowanie w księgarniach internetowych, księgarniach tradycyjnych, portalach branżowych, bibliotekach.
-Kto finansuje ten projekt i kto poza założycielami spółki w nim uczestniczy? Tak wielkie przedsięwzięcie wymaga pracy zespołowej, z udziałem różnych specjalistów…
-Książkami zajmujemy się od dość dawna. Wszystkie pracowałyśmy, albo w sieciach księgarskich, albo prowadziłyśmy własne księgarnie także internetowe. Pomysł zaawansowanego systemu rekomendacyjnego dojrzewał od dawna, ale dopiero teraz, gdy pojawili się ludzie z Olsztyńskiego Parku Naukowo Technologicznego, którzy znają się na uczeniu maszynowym i sztucznej inteligencji, mogliśmy go wdrożyć w życie. Założycielkami spółki są kobiety po filologii polskiej i jest oczywiste, że bez wsparcia programistów same byśmy tego nie zrobiły. Po prostu specjaliści powiedzieli nam które z naszych potrzeb można zrealizować. Do współpracy zaprosiliśmy Petrosa Psyllosa, młodego wynalazcę z Politechniki Białostockiej, który w telewizji ma własny program nt. sztucznej inteligencji. Projekt otrzymał dotację z Narodowe Centrum Badań i Rozwoju.
–A kiedy projekt będzie zakończony? Kiedy pierwsze automatyczne rekomendacje?
-W tej chwili działa wersja pilotażowa. Współpracujemy z publio.pl i lubimyczytac.pl zakładamy, że pod koniec października 2018r. system będzie tam działać na zasadach badawczo-rozwojowych. Z początkiem 2019r. powinien być na tyle dojrzały, że wykorzystamy go szerzej w internecie.
Rozmawiał: Marcin Kosak