Kdo je autorem textu? Nová technologie vědců z UP jej pomůže určit

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států, řekl dnes novinářům Dan Faltýnek z katedry obecné lingvistiky FF UP.

Odborníci z katedry obecné lingvistiky FF UP se frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova. Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody zvolili odlišný postup. "S kolegy jsme zjistili, že podle nízko frekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka," uvedl Faltýnek.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo "konečně". "Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora," podotkl Faltýnek.

Objev je podle něj převratný, neboť dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze 200 až 500 slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1 500 slov, tak jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze 6000 slov.

Nová technologie podle Benešové dokáže extrahovat profil lidí. Opakování určitých slov může poukázat na psychických stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím, jelikož umožňuje určit inkriminované osoby. Lze ji využít i na obranu proti personalizaci člověka na internetu. "Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji," řekla Benešová.

Související

  • Alika zpracuje 6500 tun surovin ročně. Tržby jí loni vzrostly na 540 milionů
    Společnost

    Alika zpracuje 6500 tun surovin ročně. Tržby jí loni vzrostly na 540 milionů

    Společnost Alika z Čelčic na Prostějovsku, přední tuzemský výrobce pražených arašídů a oříšků, slaných snacků, sušeného ovoce a mrazem sušené zeleniny, loni zvýšila tržby meziročně o 12 procent na 540 milionů korun. ČTK to dnes řekla generální ředitelka pražírny Alika Petra Vránová. Alika ročně zpracuje přibližně 6500 tun ořechů, semínek, sušeného ovoce a dalších surovin.

  • Srážek se zvěří přibývá. Olomoucký kraj hlásí za půl roku přes 800 nehod
    Společnost

    Srážek se zvěří přibývá. Olomoucký kraj hlásí za půl roku přes 800 nehod

    Nový SRNA index ukazuje rostoucí počet střetů vozidel se zvěří na českých silnicích. V kraji evidovali policisté během uplynulého půlroku zatím nejvíce případů.

  • Soud zamítl návrhy na neplatnost referenda, v Prostějově bude pětadvacetimetrový bazén
    Společnost

    Soud zamítl návrhy na neplatnost referenda, v Prostějově bude pětadvacetimetrový bazén

    Krajský soud v Brně zamítl dva návrhy na vyslovení neplatnosti dubnového hlasování v místním referendu v Prostějově o délce plánovaného bazénu. Jejich autoři požadovali, aby se referendum opakovalo na podzim souběžně s komunálními volbami. ČTK informaci získala na informační desce soudu. Radnice tak může pokračovat v přípravě stavby pětadvacetimetrového bazénu. Iniciátoři referenda z TJ Prostějov prosazovali padesátimetrovou délku. Výsledek hlasování nebyl kvůli nízké účasti platný.

  • Hasiči trénovali v tramvajovém depu
    Společnost

    Hasiči trénovali v tramvajovém depu

    Speciální výcvik hasičů Hasičského záchranného sboru České republiky (HZS) se uskutečnil poslední květnový čtvrtek v olomouckém tramvajovém depu. Díky spolupráci s Dopravním podnikem města Olomouce měli možnost procvičit zásahy při střetech s tramvají, kdy je nutné vyprostit zraněné osoby nebo zaklíněné předměty.

Rychlovky

  • OLOMOUC
    Se zákroky kardiochirurgům z fakultky od listopadu pomáhá nový špičkový přístroj pro měření koronárních cév a bypassů. Je nástrojem, který umožňuje najít nejvhodnější místo pro voperování bypassu u pacientů se zúženými či zablokovanými srdečními tepnami. Více.
  • OLOMOUC
    Velká oprava silnice na sídlišti Povel. V pondělí odstartuje oprava ulice kpt. Jaroše. Rekonstrukce úseku dlouhého 680 metrů potrvá do poloviny srpna. Etapy opravy proběhnou za úplné uzavírky.
  • PŘEROVSKO
    Pokračuje modernizace železniční trati Brno–Přerov dochází kvůli tomu ke změně v automobilové dopravě. Kvůli stavbě nadjezdu se má ode dneška přesunout provoz v úseku Kojetín - Chropyně na přeložku silnice 436.

Nejnovější

Nejčtenější

Seriály