Fizyka w służbie języka i nie tylko języka, czyli ile wyrazów wystarczy, by rozpoznać autora?

Drodzy Słuchacze Akademosa,

Tym razem postanowiłem przedstawić Wam bardzo ciekawy artykuł na temat nowej metody stylometrii, służącej identyfikacji indywidualnego stylu językowego. O jej zastosowaniach słów kilka znajdziecie poniżej.

Autora niepodpisanego tekstu można zidentyfikować analizując zależności między zaledwie kilkoma wyrazami tekstu, wykazali fizycy-statystycy z Instytutu Fizyki Jądrowej Polskiej Akademii Nauk w Krakowie. Źródło: IFJ PAN

Indywidualność autora widać już w powiązaniach między zaledwie kilkunastoma wyrazami tekstu angielskiego. W językach słowiańskich rozpoznać to można jeszcze łatwiej – sugerują analizy tekstów literackich przeprowadzone nową metodą stylometrii, zaproponowaną przez fizyków z Krakowa.

Jak zweryfikować, spod czyjego pióra wyszedł historyczny tekst znany jedynie z fragmentów? Jak ustalić rzeczywistego twórcę internetowego paszkwilu? Jak naprawdę wiarygodnie stwierdzić, czy tekst pracy magisterskiej bądź doktorskiej nie jest plagiatem?

Tradycyjne metody stylometryczne w wielu przypadkach zawodzą lub nie prowadzą do dostatecznie pewnych wniosków. Na łamach czasopisma „Information Sciences” naukowcy z Instytutu Fizyki Jądrowej Polskiej Akademii Nauk (IFJ PAN) w Krakowie przedstawili własne narzędzie statystyczne do analizy stylometrycznej. Skonstruowane jest ono z użyciem grafów i pozwala spojrzeć na strukturę tekstów w jakościowo nowy sposób – poinformował Instytut w przesłanym PAP komunikacie.

„Wnioski płynące z naszych badań z jednej strony są budujące. Wskazują bowiem, że indywidualność każdej osoby przejawia się wyraźnie w sposobie używania już zaskakująco małej liczby wyrazów. Ale jest i druga, ciemniejsza strona medalu. Skoro bowiem okazujemy się tak oryginalni, będzie nas można łatwiej identyfikować po wypowiedziach” – mówi prof. dr hab. Stanisław Drożdż (IFJ PAN, Politechnika Krakowska).

Wróć na bloga
Ładowanie...
Ładowanie...