EBENEZER ROJT

Jak plagiatuje się w "Polityce"
albo ciepły kontakt z prostym czytelnikiem

Jeśli ktoś uzna, że wydrukowany w "Polityce" artykuł Tomasza Targańskiego Wiedza utracona [1] nie jest żadnym plagiatem, a jedynie najzupełniej wybaczalną (z uwagi na pośpiech pracy dziennikarskiej) kompilacją, nie będę się spierał. Nie mogę się jednak pozbyć wrażenia, że to, co w tym artykule najważniejsze, zostało wzięte wraz z wieloma cytatami z artykułu Laury Spinney ogłoszonego w maju zeszłego roku w "Guardianie" [2]. Targański zaś ani razu nie wymienił jej nazwiska, a zamiast tego dla niepoznaki dorzucił kilka drugorzędnych ciekawostek z Wikipedii.

Jednak mniejsza o plagiat. Gorzej, że tak przepisując i kompilując w pośpiechu, robił to często bez zrozumienia, już na własny rachunek plotąc najrozmaitsze androny.

Trzy przykłady.

W latach 40. XX w. brytyjski botanik Alexander Corbet obserwował motyle. Przez 24 miesiące dostrzegł ponad 70 gatunków, ale schwytać udało mu się zaledwie dwa. Ciekawy, na ile lepszy wynik osiągnąłby, gdyby kontynuował swoje "polowanie" przez kolejne dwa lata, zwrócił się do genetyka i statystyka Ronalda Fishera. Ten wykorzystał odpowiedni wzór matematyczny, w którym wziął pod uwagę m.in. obszar obserwacji i prawdopodobieństwo występowania na nim różnych motyli, i wyliczył, że Corbet miałby szansę schwytać 75 gatunków. Ten sposób szacowania liczby zwierząt, których nie udało się złapać/zobaczyć, jest do tej pory stosowany w ekologii. Nazwano go Modelem niewidzialnych gatunków (Targański, s. 55).
Motyli u Laury Spinney nie ma. Pomysł na tę kompilację Targański wziął prawdopodobnie z blogu Ann Thomas, natomiast samo wyjaśnienie, o co chodzi z tymi motylami i statystyką - oczywiście - z Wikipedii. Bieda w tym, że jest to wyjaśnienie niedorzeczne. Na podstawie informacji, że ktoś gdzieś "dostrzegł ponad 70 gatunków, ale schwytać udało mu się zaledwie dwa", nawet tak wybitny statystyk jak Fisher nie zbudowałby żadnego modelu.

W rzeczywistości Corbet zestawił całkiem obszerną tabelkę danych. Wynikało z niej, że na przykład w wypadku 14 gatunków motyli złowił po 12 okazów każdego gatunku, w wypadku 20 gatunków - po 9 okazów, w wypadku 74 gatunków - po 2 okazy każdego z nich (to właśnie te rzekome "dostrzegł ponad 70 gatunków, ale schwytać udało mu się zaledwie dwa"), natomiast w wypadku 118 gatunków złowił jedynie po jednym okazie z każdego gatunku [3]. Od tego zbioru danych do modelu jeszcze bardzo daleko, ale żeby coś z tego naprawdę zrozumieć, trzeba być nieźle obkutym w statystyce, więc nie będę was łudził, że można to łatwo i przyjemnie streścić.

Natomiast można łatwo i przyjemnie wyjaśnić dość intuicyjnie uchwytną różnicę między manuskryptem i dziełem. Tak, jak to robią Mike Kestemont i Folgert Karsdorp, główni autorzy artykułu z "Science", będącego dla Laury Spinney i Tomasza Targańskiego (tym razem już jawnie), podstawowym źródłem ich dziennikarskich mądrości. Manuskrypt (document) to po prostu materialny nośnik niematerialnego dzieła (work). Toteż:

(Materialna) strata dokumentów może prowadzić do (niematerialnej) straty dzieł. Dzieło staje się "zaginione", gdy nie wiadomo, czy przetrwała choćby jedna jego kopia [4].
Ale można też zrobić to mętnie i wtedy czytelnik dostaje coś takiego:
Mike Kestemont z Universiteit Antwerpen oraz Folgert Karsdorp z Meertens Instituut w Amsterdamie uznali, że tworzone przez wieki teksty można potraktować jak kulturowo-narracyjny ekosystem podobny do biologicznego. I wykorzystali Unseen Species Model do określenia, ile średniowiecznych manuskryptów z lat 1200-1450 "wyginęło".

Naukowcy najpierw przejrzeli (zaobserwowali) rycerskie eposy, sagi i opowieści heroiczne w językach: angielskim, niemieckim, francuskim, niderlandzkim, islandzkim oraz irlandzkim. Każdy z tekstów źródłowych miał kilka kopii (na marginesie: często do naszych czasów przetrwały tylko one, a po oryginale nie pozostał żaden ślad poza wzmiankami w późniejszych źródłach). Na podstawie tego klucza powstała lista 799 oryginałów oraz 3648 duplikatów. Kiedy przeanalizował ją komputer, okazało się, że "populacja" z badanego okresu powinna liczyć 1170 dzieł pierwotnych oraz 40 614 kopii (Targański, s. 55-56).

Teksty źródłowe, kopie, oryginały, duplikaty, dzieła pierwotne... Co gorsza, czytelnik dostaje ten gąszcz terminów wraz z niedorzeczną konkluzją: "Oznacza to, że znamy mniej więcej jeden na dziesięć tekstów powstałych w średniowieczu". Potem raz jeszcze powtórzoną (więc na pewno nie chodzi o stylistyczną niezręczność).
Gdyby natomiast potraktować je [wyliczenia Kestemonta i Karsdorpa] jako roboczy punkt odniesienia do rozmowy o stratach w narracyjnym i naukowym dziedzictwie, jakich doznały inne kręgi cywilizacyjne, można dojść do zaskakującego wniosku. Takiego, że uratowanie ok. 10 proc. źródeł to wcale nie tak mało (Targański, s. 56).
Mniejsza już o to, że Targański zdążył zapomnieć, że nie chodzi ogólnie o "teksty powstałe w średniowieczu", lecz jednak o dość specyficzną grupę dzieł: opowieści rycerskie napisane w sześciu językach narodowych (czyli zero łaciny!). Ale przecież Kestemont i Karsdorp piszą wyraźnie, że przetrwało mniej więcej dwie trzecie dzieł z tej grupy. To tylko manuskryptów, czyli nośników tych dzieł, przetrwało zaledwie 10% [5]. Tyle że to z kolei nic nadzwyczajnego. Przecież nawet w wypadku wielu książek przetrwało mniej niż 10% nakładu.

Na koniec brednia największa. Tak nieprawdopodobna, że muszę zacytować pełne trzy akapity, bo inaczej gotowiście uznać, że to ja coś zmyślam.

Intuicja podpowiada, że wynalazkiem przełomowym, zwiększającym szansę przetrwania dużej ilości tekstów kultury, była prasa drukarska. Faktycznie, mogła pomóc przetrwać wielu dziełom, ale z pewnością nie uchroniła nas przed utratą wielu wybitnych utworów.

Niezbicie dowiódł tego David McInnis, znawca twórczości Szekspira z uniwersytetu w Melbourne i autor książki "Shakespeare and Lost Plays". Według jego wyliczeń z okresu od 1576 r. (kiedy otwarto pierwszy teatr publiczny w Londynie) do 1642 r. (kiedy zamknęli je purytanie w czasie wojny domowej) do dziś przetrwały 543 sztuki wybitnego dramaturga. McInnis pisze, że jest to zaledwie ułamek powstałej wówczas twórczości: na podstawie wzmianek w innych dziełach Szekspira oraz w pamiętnikach z epoki oszacował, że z pewnością brakuje 744 tekstów. Do najbardziej znanych należą m.in.: komedia "Love's Labour's Won" oraz "Ur-Hamlet", prequel właściwego Hamleta napisany przez Szekspira (lub innego znanego wówczas dramaturga Thomasa Kyda).

Można się oczywiście pocieszać, że przepadłe na zawsze manuskrypty nie były arcydziełami na miarę tragedii o księciu Danii, nie straciliśmy więc wiele. Niestety również i to może nie być prawdą. McInnis pisze, że "zaginione sztuki radziły sobie na deskach teatrów równie dobrze, a czasem nawet lepiej niż te, które przetrwały". Utożsamianie rzeczy zaginionych z mało wartościowymi ocenia jako rezultat naszych "nieuświadomionych uprzedzeń oraz ignorancji w stosunku do tego, co utracone" (Targański, s. 56; wyróżnienia moje).

Do dziś przetrwały 543 sztuki Szekspira? 744 zaginęło? Miałżeby Bard być takim stachanowcem teatru jak Lope de Vega? (2000 sztuk na liczniku). Ależ gdzie tam! Nawet z zaginionymi i hipotetycznymi nie ma szans, by dociągnąć rejestr sztuk Szekspira do pół setki. Nadto Targańskiemu powinien dać do myślenia już sam ten przedział czasowy: od 1576 do 1642. W 1576 roku Szekspir miał dwanaście lat, w roku 1642 już od przeszło ćwierć wieku nie żył. W rzeczywistości McInnis policzył bowiem wszystkie sztuki wszystkich dramatopisarzy - zachowane i zaginione - które wystawiono w tym okresie w Londynie [6].

Wierzyć się nie chce, żeby w miarę przytomny autor z maturą mógł coś takiego napisać. Może to zatem raczej skutek pośpiechu pracy redaktorskiej? Redaktor coś tam raz-dwa ciachnął, a potem już nie chciało mu się na spokojnie przeczytać tego, co mu wyszło.

Czego by o linii programowej "Polityki" nie sądzić, było to w dawnych czasach pismo redagowane poważnie i profesjonalnie. Dziś można się z niego nie tylko dowiedzieć o 543 sztukach Szekspira, lecz również o tym, że komendantem KL Auschwitz był Adolf Eichmann [7] albo że Jerzy Giedroyc redagował przed wojną "Prosto z Mostu" [8]. I ktoś te androny puszcza do druku.

A to tylko niektóre z nich, te złapane i przyszpilone niczym motyle Alexandra Corbeta. Aby mieć wyobrażenie o całości, trzeba by chyba policzyć również to, czego nie widać, za pomocą jakiegoś Unseen Bullshits Model.

Nie można jednak wykluczyć, że wszystko to dzieje się z premedytacją, wraz z wymianą starych czytelników na nowe pokolenie: tych młodych, wykształconych, z wielkich miast... Być może więc świadomie sięgnięto po receptę Zygmunta Kałużyńskiego, w końcu długoletniego redaktora "Polityki", który już na początku lat 90., gdy nowy kapitalistyczny rynek gazet dopiero raczkował, nie bez kozery przypomniał "wychodzący przed wojną «Nasz Przegląd», wydawany po polsku dla czytelników starozakonnych, ale tak dynamicznie redagowany, że czytali go chętnie również goje, ja także".

Otóż "Nasz Przegląd" był wydawany nieprawdopodobnie niechlujnie, roił się od błędów drukarskich, a także rzeczowych, mimo że jego redaktor był niewątpliwym fachowcem. Jerzy Stempowski wspomina, że zwrócił się do niego z pytaniem, dlaczego pismo jest tak niestaranne i otrzymał odpowiedź mniej więcej taką: Nasi czytelnicy są bezpretensjonalni, prości i wyzbyci snobizmu. Gdyby pismo było doskonałe, uważaliby, że jest dla nich za dobre i stałoby się im obce: nie zależy im na perfekcji, ale chcą mieć coś swojego, bliskiego, podobnego do nich. Błędy w piśmie upewniają ich, że redaktorzy są tacy jak każdy z nich. Czytelnik, który dostrzega pomyłkę, czuje się lepszy od gazety i dlatego ją kocha! Ciekawe, że coś podobnego usłyszałem od red. Wacława Gralewskiego, w roku bodaj 1938, gdy jako chłopiec starałem się o praktykę w gazecie lubelskiej: radził on, by od czasu do czasu walnąć rozmyślnie coś niedorzecznego, np., że "Hamleta" napisał Sienkiewicz. Przyjdzie wtedy kupa listów ze sprostowaniami, czytelnicy ośmielają się, bratają się, nawiązuje się ciepły kontakt... Zaś to jest ważniejsze niż dokładność [9].
Dynamiki również nie można dzisiejszej "Polityce" odmówić. Mają tam nawet wręcz obwieszonego dynamitem Jana Hartmana [9a] oraz rezerwowy lont w postaci wiecznie młodego Kuby Wojewódzkiego.
[1] Tomasz Targański, Wiedza utracona, "Polityka" 2023, nr 7, s. 55-57. Dalej cytuję jako Targański.

[2] Laura Spinney, The big idea: could the greatest works of literature be undiscovered?, "The Guardian", 28 maja 2022. Wersja internetowa tutaj.

[3] A[lexander] Steven Corbet, The Distribution of Butterflies in the Malay Peninsula (Lepid.), "Proceedings of the Royal Entomological Society of London", seria A, tom 16, grudzień 1941, tabela XI na stronie 115. A tu już zaczynają się schody ze statystyką (podkreślam: zaczynają się!): R[onald] A[ylmer] Fisher, A[lexander] Steven Corbet i C[arrington] B[onsor] Williams, The Relation Between the Number of Species and the Number of Individuals in a Random Sample of an Animal Population, "Journal of Animal Ecology", tom 12, nr 1, maj 1943.

Nb. nie mam pojęcia, skąd się wzięły te 24 miesiące obserwacji motyli i lata 40., które Targański powtórzył za jakimś wikipedystą, który z kolei powtórzył je za poboczną uwagą w artykułe dostępnym tutaj. Corbet swoją tabelę opisał tak: "Distribution frequencies of species collected in Malaya from 1927 to 1932". A wcześniej na stronie 107 zaznaczył: "The figures for the abundance groups are based on the results of my own collecting during 5 years residence in British Malaya, such collecting being carried out as often as possible at all elevations and in all three plant associations".

[Dopisek] Teraz już mam pojęcie. Pan Tomasz Lewandowski uprzejmie zwrócił mi uwagę, że najprawdopodobniej w taki anegdotyczny sposób o badaniach Corbeta pierwszy opowiedział Bradley Efron na 6 stronie broszury Graduate Studies in Statistics wydanej przez Uniwersytet Stanforda i dostępnej tutaj. Zaczyna się ta opowieść właśnie tak: "Here is an example of three faces of statistics, done in early 1940's. The naturalist Corbet had spent two years trapping butterflies in Malaya". Tyle że dla Efrema historyczne szczegóły nie były ważne. Chodziło mu jedynie o ciekawy przykład zastosowania statystyki, zachęcający do jej studiowania, i do tego przykładu nagiął nieco fakty, być może mgliście zapamiętane.

[4] Mike Kestemont, Folgert Karsdorp, Elisabeth de Bruijn, Matthew Driscoll, Katarzyna A. Kapitan, Pádraig Ó Macháin, Daniel Sawyer, Remco Sleiderink, Anne Chao, Forgotten books: The application of unseen species models to the survival of culture, "Science" 375, 18 lutego 2022, s. 766: "The (material) loss of documents can entail the (immaterial) loss of works: A work becomes «lost» when none of the copies that once preserved it is known to have survived".

Nb. "nie wiadomo, czy przetrwała" to na szczęście nie to samo co "wiadomo, że nie przetrwała". Czasem bowiem zaginione dzieło można znaleźć nawet w jakiejś bibliotece, gdy ktoś natrafi w magazynie na źle opisany manuskrypt, który je zawiera.

[5] "The results for the union of the corpora [...] suggest an overall survival ratio with a 68.3% confidence interval (CI) of 63.2 to 73.5% for works and a 9.0% CI of 7.5 to 10.7% for documents" (s. 767). Confidence interval to po polsku przedział ufności, czyli znowu trzeba się nauczyć statystyki. Jak się zdaje, dla Kestemonta i Karsdorpa wszystko liczyła Anne Chao, więc samym tym liczbom można chyba zaufać na 100%.

[6] David McInnis, Shakespeare and Lost Plays. Reimagining Drama in Early Modern England, Cambridge University Press 2021, s. 1: "Recent estimates suggest that for the period of c.1567-1642, whilst only 543 plays from the London commercial theatres have survived, as many as 744 plays are identifiably lost, with hundreds more completely untraceable".

Nb. McInnis podaje nieco inną początkową datę niż cytująca go Laura Spinney: rok 1567, nie zaś 1576 (co za Spinney wiernie powtarza Targański). Wygląda to na czeski błąd, ale w 1576 istotnie wybudowano w Londynie pierwszy stały teatr.

Jednak z drugiej strony, dla McInnisa jest to circa 1567 rok i tę samą datę podaje on we wstępie do wydanej siedem lat wcześniej książki Lost Plays in Shakespeare's England (redakcja David McInnis i Matthew Steggle, Palgrave Macmillan 2014). "It has been estimated that, in the lifetime of the commercial playhouses, roughly 1567 to 1642, around 3,000 different plays must have been written and staged in them: and that of these, a minority survive, among them, obviously, the plays of Shakespeare, Jonson, Marlowe and the rest. The latest and most authoritative count puts the number of surviving plays at 543. [...] But the latest count of plays in this category suggests that there are now no fewer than 744 identifiable «lost plays» from the commercial theatre in this period" (s. 1; wyróżnienie moje).

Nie ma też u McInnisa zdania, które Spinney jakoby za nim cytuje: "Lost plays performed at least as well as, and usually better than, the plays that have survived", a które Targański przełożył jako: "zaginione sztuki radziły sobie na deskach teatrów równie dobrze, a czasem nawet lepiej niż te, które przetrwały". McInnis naprawdę napisał: "[...] lost plays were at least as profitable as those plays that survived in print" (s. 42).

Być może to już taki zwyczaj, że dziennikarze poprawiają naukowców.

[7] Tak w każdym razie twierdzi Agata Bielik-Robson. Kto chciałby się przekonać, że nie było to omsknięcie w jakiejś marginalnej wyliczance, niech przeczyta w OSOBACH: "Agata Bielik-Robson zmyśla jak dziecko albo stan oświeceniowej elity".

[8] Tak w każdym razie twierdzi Paweł Śpiewak. Kto chciałby się przekonać, że to też nie była jakaś marginalna wyliczanka, niech przeczyta w OSOBACH: "Paweł Śpiewak walczy bez skrupułów albo Żydzi, antysemici i Leo Messi".

[9] Zygmunt Kałużyński, Pamiętnik rozbitka, Polska Oficyna Wydawnicza "BGW", Warszawa 1991, s. 102. Naturalnie nie należy wierzyć Kałużyńskiemu, że Jerzy Stempowski coś tam wspominał, a Wacław Gralewski coś tam powiedział. "Kałużyński to wielki erudyta, ale jeszcze większy łgarz. Wierzyć mu nie należy. Jeśli ktoś chce wierzyć, to niech sobie idzie do kościoła" (Jerzy Urban, Alfabet Urbana. Od UA do Z, Polska Oficyna Wydawnicza "BGW", Warszawa 1990, s. 77).

Nb. Kałużyński sprzedał potem tę anegdotkę jeszcze przynajmniej dwukrotnie z niewielkimi zmianami. W wersji z Bankietu w domu powieszonego (Polska Oficyna Wydawnicza "BGW", Warszawa 1993, s. 202) Jerzy Stempowski to już "mój stary nauczyciel, Jerzy Stempowski", natomiast w Do czytania pod prysznicem (Instytut Wydawniczy Latarnik, Warszawa 2004, s. 13) Jerzy Stempowski znowu tylko "napomyka w swoich wspomnieniach".

[9a] Anonimowy Czytelnik powiadomił mnie, że z tym dynamitem Jana Hartmana może jednak nie być najlepiej. Nie jest nawet wykluczone, że w jego pasie szahida sporo ładunków to tylko atrapy, opakowania po ładunkach już niegdyś zużytych [9b]. Taki w każdym razie wniosek nasuwa się po porównaniu zawartości dwóch artykułów profesora Hartmana: artykułu Co po socjologii ogłoszonego w 2012 roku w piśmie "Zarządzanie Publiczne" (nr 1(19)) oraz artykułu Kondycja intelektualna i etyczna badacza społecznego ogłoszonego w roku 2017 w "Przeglądzie Socjologicznym" (tom LXVI, nr 2).

Jak twierdzi Czytelnik, porównanie obu artykułów za pomocą tego narzędzia wykazuje, że starszy artykuł został wykorzystany w nowszym w ponad 90%, co jednak w żaden sposób nie zostało w nowszym artykule zaznaczone. Nawet w najmarniejszym przypisie. Jest to zatem wręcz ilustracyjny przykład autoplagiatu.

"Używane w etyce akademickiej słowo «autoplagiat» odnosi się do nieuczciwego dysponowania własnym dorobkiem, to jest niesygnalizowanego włączania przez autora do upublicznionego (w formie druku lub publikacji elektronicznej, względnie wygłaszanego) utworu całości lub fragmentów wcześniej już opublikowanych drukiem (albo w innej postaci) innego własnego utworu. «Autoplagiatem» jest również powtórne i każde kolejne opublikowanie własnego utworu, bez zamieszczenia czytelnej informacji o poprzednich jego wydaniach.

Jako zasadę dobrej praktyki należy przyjąć, że w każdej publikacji własnej i w każdym przypadku wygłaszania własnego utworu (odczytu, wykładu, prezentacji), kiedy wykorzystuje się wcześniej opublikowane własne utwory, trzeba powtarzane fragmenty wyraźnie zaznaczyć w podobny sposób, w jaki zaznacza się zapożyczenia lub cytaty z cudzych prac" (Rzetelność w badaniach naukowych oraz poszanowanie własności intelektualnej, Ministerstwo Nauki i Szkolnictwa Wyższego, Warszawa 2012, s. 23).

I jeszcze na koniec rzecz najzabawniejsza - informacja ze strony redakcyjnej powyższej broszury:

"Niniejsze opracowanie zostało przygotowane przez Zespół do Spraw Dobrych Praktyk Akademickich, który doradza Ministrowi Nauki i Szkolnictwa Wyższego.
W skład Zespołu wchodzą:
prof. dr hab. Jan Hartman - przewodniczący".

[9b] Przepraszam profesora Jana Hartmana za to, że małodusznie zwątpiłem w świeżość jego zapasów dynamitu. W pół roku później prof. Hartman odpalił z hukiem ładunek, który nie tylko osmalił kilka tysięcy jego kibiców na Twitterze, ale i jego samego siłą odrzutu wyrzucił z lewicowej listy kandydatów do sejmu. Kto chciałby wiedzieć więcej, niech najpierw zaduma się nad tym tweetem prof. Hartmana z sierpnia 2023, a potem poszuka komentarzy na plotkarskich (czy są jeszcze jakieś inne?) portalach.