Lidovky.cz: Proč se u divadelní hry Jindřich VIII. začalo pochybovat o autorství Shakespeara?
Přinejmenším od 18. století se mluvilo o tom, že styl textu je nezvykle různorodý. Hypotézu, že hra vznikla ve spoluautorství s Johnem Fletcherem, ale vyslovil až v polovině 19. století britský literární analytik James Spedding.
Lidovky.cz: Jaký literární styl je typický pro Williama Shakespeara a jaký pro Johna Fletchera?
Sám Spedding například uvedl jako hlavní argument to, že Fletcher užívá mnohem častěji verše s jednou slabikou navíc (takzvaný extrametrical syllables). Rozdíly pak najdeme třeba i v užívání ukazovacích zájmen. Shakespeare používal ve svých dramatech you (ty, vy) a them (tyto, je, jich), zatímco Fletcher zvolil zkrácené varianty ye a ‘em.
John Fletcher
|
Lidovky.cz: Podle čeho odhaluje váš algoritmus autora textu?
Algoritmus měří četnosti výskytu několika stovek nejfrekventovanějších slov a několika stovek nejfrekventovanějších rytmických konfigurací v prokazatelně Shakespearových a prokazatelně Fletcherových dílech. Na základě těchto dat je pak pomocí strojového učení vytvořena klasifikační funkce, která rozhoduje, čí autorství je u jednotlivých částí hry pravděpodobnější.
Lidovky.cz: Jaká díla jste vybral, aby se algoritmus naučil styl dramatiků?
Vybral jsem díla pocházející zhruba z období předpokládaného vzniku hry Jindřich VIII., což bylo v 1613. Konkrétně se jednalo o Shakespearovy hry Coriolanus, Cymbelín, Zimní pohádka a Bouře a Fletcherovy hry Zkrocení zlého muže (Woman‘s Prize), Valentinian, Monsieur Thomas a Bonduca.
Lidovky.cz: Jak dlouho trvá, než se algoritmus naučí literární styl autora a co to všechno obnáší po technické stránce?
Samotné učení nezabere víc než několik desítek minut. V dnešní době navíc existuje celá řada softwarových knihoven, které umožňují implementovat metody strojového učení v několika málo řádcích kódu. Zdaleka nejpracnější je texty označkovat, to znamená například segmentovat verše na slabiky a určit, které z nich nesou přízvuk. I tento proces byl ovšem automatizovaný, a to pomocí softwaru vyvinutého na Stanford University.
Lidovky.cz: Jaká nová zjištění přinesla vaše analýza?
Díky kombinaci různých textových charakteristik dokáže metoda pracovat s relativně malými kousky textu a rozpoznat s vysokou přesností, kde došlo ke změně autorství. V zásadě se ale výsledky od původní Speddingovy hypotézy až zas tak moc neodlišují. Na rozdíl od něj moje analýza nepracuje s jedním izolovaným ukazatelem, ale s komplexní informací vyplývající ze stovek takových charakteristik. Výsledky tak lze považovat za mnohem spolehlivější.
Petr Plecháč (uprostřed) s pomocí strojové analýzy dokázal určit autora u každé scény ve hře Jindřich VIII.
Lidovky.cz: Dá se říci, kolik procent napsal Shakespeare?
Z výsledků vyplývá, že Shakespeare je autorem více než poloviny veršů.
Shakespeare napsal jen půlku hry Jindřich VIII., zjistil český lingvista s pomocí algoritmu |
Lidovky.cz: Odhalil algoritmus i nějakého jiného autora?
Vedle Shakespeara a Fletchera byl testován i další anglický dramatik Philip Massinger, jehož možná autorská účast bývá občas zmiňována v odborných studiích. To se ale ukázalo jako nepravděpodobné.
Lidovky.cz: Budete analyzovat i další Shakespearova díla?
V současné době pracuji na analýze hry Dva vznešení příbuzní. Už první vydání z roku 1634 ovšem uvádí, že ji napsali významné osobnosti té doby John Fletcher a William Shakespeare. Takže názor, že se jedná o ryze Shakespearovo dílo, je ve výrazné menšině.
Petr Plecháč
|