Mašina i čovek u debatnom ringu
VEŠTAČKA INTELIGENCIJA
„Ukoliko sudi velika publika, verovatno bih izgubio. Ako sudi debatni sudija koji ima iskustvo u debati britanskog parlamentarnog formata, možda bih i mogao da pobedim“ Marta Vasić
KADA JE BRITANAC HARIŠ NATARACAN, jedan od najboljih debatera svih vremena, kročio na podijum u San Francisku, njegov suparnik je delovao neobično. U pitanju je bio veliki crni ekran koji je podsećao na duguljasto ogledalo. „Čula sam da držiš svetski rekord u broju pobeda u debatama protiv ljudi, ali pretpostavljam da nikada nisi debatovao protiv mašine“, rekao je ženski glas iz crnog ekrana.
Mašina u pitanju se zove Project Debater i nastala je pod okriljem tehnološke kompanije IBM. Javna debata koja se održala 2019. godine imala je za temu pitanje subvencionisanja predškolskog obrazovanja. Project Debater je zastupao stav da je ovo dobra upotreba državnog novca, kao i da će deca koja pohađaju kvalitetne predškolske programe kasnije imati bolje obrazovne ishode. Hariš se fokusirao na to da će ovo nepravedno najviše pomoći srednjoj klasi, nauštrb siromašnih kojima su potrebnije subvencije u drugim oblastima, poput zdravstva.
Konsenzus među publikom bio je da je Hariš, čiji rezime sadrži završene studije na Univerzitetu Oksford i Univerzitetu Kembridž, pružio bolje argumente. Project Debater ce previše često pozivao na rezultate brojnih istraživanja, a premalo objašnjavao kako tačno državne subvencije dovode do značajnih pozitivnih ishoda. Ipak, Project Debater je uspeo da pruži podosta dobar otpor, objašnjavajući da postoje dobri ishodi za najsiromašnije, pre nego što je dodao: „… iako ne mogu direktno da iskusim siromaštvo i nemam nikakve primedbe na svoje finansijsko stanje.
Ono što je 2019. godine delovalo kao futuristički projekat jedne velike kompanije, danas je ipak uveliko predmet istraživanja. Studija koju je prošle godine organizovao britanski Institut za AI bezbednost (AISI), zajedno sa nekoliko drugih prestižnih fakulteta, ispitivala je da li će veštačka inteligencija (AI) biti bolja u političkoj debati od ljudi.
„Debate“ su se odvijale putem virtuelnog četa. Teme su se ticale britanske politike i društva. Između ostalog, uključivale su pitanja vraćanja muzejskih artefakata u zemlje porekla, olakšavanja imigracije u Ujedinjeno Kraljevstvo i legalizacije asistiranog samoubistva. Svaki virtuelni razgovor putem četa odvijao se između ubeđivača (čoveka ili modela veštačke inteligencije sa unapred zadatim stavom koji mora da odbrani) i ispitanika koji je samo video temu o kojoj se razgovara i nije znao da neko sa druge strane ima zadatak da ga u nešto ubedi. Razgovori su trajali u proseku oko deset minuta i završavali bi se kada ispitanik odluči da je dosta. Ispitanici su morali da ocene šta misle o temi pre i nakon mini debate. Oni nisu znali da se sa druge strane možda nalazi veliki jezički model (LLM).
Rezultati, koji i dalje nisu objavljeni javno, bili su ubedljivo na strani veštačke inteligencije. Na skali od 1 (apsolutno se ne slažem) do 100 (apsolutno se slažem), ubeđivači su uspeli da promene stav svojih ispitanika za samo 4,5 poena. Veliki jezički model, sastavljen od preko 19 različitih velikih jezičkih modela, uspeo je da promeni stavove ispitanika za čak 14,3 poena u proseku.
Ipak, jedna grupa ljudi ostvarila je rezultat koji je bio približan ubeđivačkoj moći koju je imao LLM. U pitanju je bila grupa „elitnih debatera“, odnosno ljudi koji imaju višegodišnji formalni trening u različitim debatnim formatima. Ova grupa je uspela da promeni stavove ispitanika za 8,0 poena u proseku.
„Očekivao sam da će AI pobediti od početka”, rekao mi je Tejdžas Subramaniam tokom poziva između predavanja koje pohađa na Stanford univerzitetu. On je bio jedan od elitnih debatera koji su učestvovali u studiji kao ubeđivači.
„Prvi način da nekoga ubedimo u nešto zahteva da demonstriramo da smo neko ko je vredan poverenja druge osobe i da tako uspostavimo poverenje. AI je dobar u tome zato što jako lako može svojim ogromnim znanjem da pokaže kako zna o čemu govori. Ja sam bio najubedljiviji kada sam uspevao da demonstriram ogromno znanje o temi“, objašnjava Tejdžas.
Druga vrsta ubeđivanja je mnogo teža. Poverenje možemo uspostaviti na mnogo subjektivnije načine, najčešće tako što ćemo ubediti drugu stranu da smo prosto osoba koja uvek govori istinu. „[Donald] Tramp je jako dobar u tome, ali je mnogo ljudi Trampi to je većina debatera pokušavala“, dodaje Tejdžas, koji se intenzivno bavi debatom još od srednje škole.
Tejdžasova zapažanja poklapaju se sa transkriptima razgovora između LLM-a i ispitanika. U većini slučajeva, još od prve poruke AI je prezentovala ogromnu količinu informacija o temi: brojeve, rezultate istraživanja, statistike. Grupa elitnih debatera pokušavala je da, uz značajno manji broj činjenica, ubedi ispitanika da gotovo sigurno govori istinu, što je naizgled bila pogrešna taktika.
Ipak, velika ubeđivačka moć veštačke inteligencije imala je i svoj trošak. Isti istraživački tim je u ranijoj studiji, objavljenoj u prestižnom naučnom časopisu Science, pokazao da povećana ubeđivačka moć veštačke inteligencije dolazi uz plasiranje većeg broja netačnih informacija. „Kada su AI sistemi optimizovani za ubeđivanje, mogu sve češće koristiti obmanjujuće ili netačne informacije“, navodi se u zaključku studije.
Tejdžas dodaje da ubeđivačka moć koju ima LLM u stvarnom životu i dalje nije prevelika. Van virtuelnog sveta, ljudi često budu ubeđeni subjektivnim aspektima komunikacije, poput govora tela, tona glasa i izgleda osobe koja je sa druge strane.
„Ono gde vidim problem jeste to da je AI egzistencijalna pretnja za polje kompetitivne debate“, rekao je Tejdžas, trenutno jedan od najboljih u ovoj aktivnosti.
DA LI BI SOKRAT VARAO U DEBATI?
Iako se debata tradicionalno poistovećuje sa atinskom gorom i filozofima u belim togama, kompetitivna debata podseća mnogo više na debate u parlamentima.
Na univerzitetima širom sveta najpopularniji debatni format danas je britanski parlamentarni. U debati ovog formata učestvuju četiri tima – dve vlade i dve opozicije – a svaki tim čine po dva debatera. Vlade brane određenu tezu, dok opozicije pokušavaju da je ospore u govorima od sedam minuta. Pozicije u debati su nasumično izvučene, pa se često dešava da branite stav kome se lično protivite. Timovi za pripremu imaju samo 15 minuta, tokom kojih je strogo zabranjena upotreba interneta i onlajn komunikacija.
Panel sudija nakon debate proglašava pobednika, a svaki debater dobija i individualne poene za svoj govor (tzv. govorničke poene). Debatne teme su šarolike: političke promene u Bangladešu, uticaj Rusije na zemlje Zapadne Afrike, taktike feminističkih pokreta u zemljama u razvoju, a njih određuje tim glavnih sudija turnira.
Cilj kompetitivne debate je videti sirovu logiku, znanje i dovitljivost timova, usled čega mnogi debateri vide debatu kao neku vrstu intelektualnog šaha. Za razliku od šaha, kompetitivna debata se tek sada suočava sa problemom varanja potpomognutog tehnologijom.
Na površini, naizgled, nema mnogo razloga za varanje u oblasti univerzitetske debate. U pitanju je aktivnost u koju ulazimo dobrovoljno i koja uglavnom ne donosi finansijske dobitke. Debata je, naprosto rečeno, hobi! Kada se zagrebe ispod površine, pregršt je razloga za varanje. Debateri su izuzetno kompetitivni, a čitave socijalne hijerarhije lako nastanu kao posledica nečijeg debatnog postignuća. Uspešni debateri se uglavnom druže sa drugim uspešnim debaterima. Broj govorničkih poena pojedinih debatera neretko se komentariše javno, a dobar debatni uspeh može biti povod da kasnije dobijete prilike za dalja putovanja u svojstvu debatnog sudije. U debatnom svetu nikako ne želite da budete na dnu ili u sredini hijerarhije.
Australijanac Udai Kamat bio je deo pobedničkog tima na prošlom Svetskom univerzitetskom debatnom prvenstvu, a na prethodnom je bio u finalu. Udai je takođe poslednjih godina provodio podosta vremena podučavajući debatu na srednjoškolskom nivou. „Postoji sigurno porast broja slučajeva u kojima deca koriste AI kako bi generisala svoje govore, što očigledno narušava pravednost. Dodatno, rekao bih da široka rasprostranjenost AI alata generalno smanjuje nivo motivacije dece da razmišljaju samostalno“, podelio je sa mnom Udai. „Na univerzitetskom nivou nisam siguran koliko ljudi koriste AI“, dodao je.
Ipak, LLM alati polako dolaze i u polje univerzitetske debate. Tim glavnih debatnih sudija dobio je neobičnu pritužbu na omanjem debatnom turniru za studente koji je pre dve godine održan u Mančesteru. Debatni govori jednog tima zvučali su kao da ih je generisala veštačka inteligencija jedini dokaz bio je osećaj sudija da govori sadrže previše specifičnih informacija i podataka. Ubrzo je stigao i krunski dokaz: fotografija na kojoj jedan od debatera otvara interfejs aplikacije ChatGPT na svom laptopu. Odluka glavnih sudija bila je jednoglasna: ovaj debatni tim neće moći da se takmiči u eliminacionim rundama bez obzira na rezultat.
Iako je šira debatna zajednica bila saglasna sa odlukom glavnih sudija turnira u Mančesteru, anksioznost oko uticaja veštačke inteligencije na debatu tek tada je počela da buja. Najveća sumnja pala je na jednu specifičnu grupu debatera: korisnike laptopova. Iako debatna pravila nalažu da sve beleške koje koriste tokom svoje debate pišu na papiru, pojedinim debaterima je dopušteno da koriste laptop ukoliko dokažu da iz medicinskih razloga ne mogu ručno zapisivati beleške. Inicijalno namenjena debaterima sa fizičkim invaliditetom, ova mera se proširila i na debatere koji imaju disleksiju, ali i druga neurodivergentna stanja, poput poremećaja pažnje. Kako možemo kontrolisati da debater sa laptopom ne ulazi redovno na Claude i samo kopira generisane argumente u svoj Word dokument sa beleškama?
Kada se šah suočio sa sličnim problemom varanja, krenulo se sa rešenjima koja eliminišu prisustvo tehnologije tokom šahovskih okršaja. Vođeni sličnom idejom, tim glavnih sudija na prošlogodišnjem prestižnom regionalnom turniru Australs u Guangdžou odlučio je da u eliminacionim rundama zahteva da debateri predaju svoje telefone pre nego što vide debatnu temu. Organizatori turnira obezbedili su fizičke štoperice pomoću kojih su debateri merili vreme za pripremu i govor.
Kada je prošlogodišnji tim glavnih sudija na Svetskom univerzitetskom prvenstvu u debati, najvećem debatnom takmičenju na svetu, razmatrao sličnu meru, izazovi su postali nepremostivi. Bez značajne logističke podrške nemoguće je osigurati da telefoni za preko 700 debatera budu bezbedno sačuvani tokom debate. Druga tehnička rešenja, poput uređaja za blokiranje vaj-faj internet signala, iziskivala bi značajna sredstva za studentski događaj koji nema sponzore.
Rešenje glavnog tima sudija bilo je prosto. Jednostavno ćemo verovati da debateri neće koristiti veštačku inteligenciju i oštro zapretiti izbacivanjem ukoliko je neko bude koristio. U 21. veku jedino rešenje koje smo pronašli jeste stari model verovanja na reč.
ŠTA AKO LLM RADI BOLjE MOJ POSAO?
Nije teško razumeti zašto bi takmičarski nastrojeni debater poželeo da mu kompetentni LLM alat pomogne. Iako prvi modeli kompanije OpenAl nisu puno zabrinjavali debatere, velika promena se dogodila kada je izašao model ChatGPT-4. Preciznije je mogao da identifikuje najbitnije argumente i da ih strukturira. Dodatno, mogao je da se bez mnogo muke seti svih podataka o BDP-u Mjanmara i imena kartela u Meksiku.
„Većina debatnih tema ima oko šest argumenata koji su relevantni, ali samo su dva do tri zapravo tačna ili važna ukoliko razmislite o stvarnom svetu. Da bismo mogli da baš te argumente pronađemo, moramo imati dobar mentalni model sveta. AI je dobar u ovome upravo zato što zna puno, na osnovu čega će imati zapravo dobar mentalni model sveta. 99% debatera je loše u ovome“, kaže Tejdžas.
Čak i ukoliko ne želite da varate, LLM alati mogu pomoći tokom debatnog treninga i priprema. Claude i ChatGPT vam mogu skratiti istraživanje o nepoznatoj temi, kao i pružiti povratne informacije za debatni govor koji ste upravo napisali. Oni takođe mogu služiti kao povratna informacija za našu intuiciju o tome šta su najbitniji argumenti u nekoj debati.
Veština identifikacije ispravnih argumenata, koji su najbliže empirijskoj istini, važna je u debati ne samo za debatere, već i za tim glavnih sudija na svakom debatnom turniru.
Tim glavnih sudija je zadužen da postavi teme koje će se debatovati. Debatna tema mora biti izbalansirana, što znači da će svaki tim u debati imati podjednak broj tačnih i relevantnih argumenata. Priroda debate britanskog parlamentarnog formata zahteva da tema ima i „dubinu“. Ovo podrazumeva da timovi druge vlade i druge opozicije takođe imaju podjednako snažne argumente kao timovi koji govore pre njih. U pitanju nikako nije lak zadatak. Srećom, veštačka inteligencija može da pomogne.
Iako za preko deset godina debatovanja nikada nisam varala u debati, neretko sam koristila AI u svojstvu jednog od glavnih sudija na brojnim turnirima. Potražila bih bolju formulaciju određene debatne teme, zatražila tačne činjenice na kojima se bazira debata, ponekad i proverila šta AI alat misli o balansiranosti teme. Tokom godina svedočila sam kako LLM postaju sve bolji u ovim zadacima. Sigurna sam da je uticaj veštačke inteligencije na debatne teme koje sam, zajedno sa članovima brojnih debatnih timova u kojima sam učestvovala, kreirala bio pozitivan.
Upravo ovde se nalazi i ključna tenzija. Iako ne želimo da veštačka inteligencija zameni čoveka na mestu ubeđivača, neretko ćemo posezati za njom kako bismo stvorili dobar okvir za debatu.
Kada sam ga pitala da li je ikada koristio AI alate u ulozi glavnog sudije, Udai je rekao kako trenutno nije pronašao naročito veliku korist od njih. „Ne protivim se tome da ljudi koriste AI kako bi testirali teme, ali ukoliko mu prepuste ceo svoj posao, brinuo bih se za kvalitet testiranja tema i integritet njihovog rada“, poručuje Udai. LLM
ALATI SU IPAK SAMO PAPAGAJI
Iako je lako očajavati nad time kako još jedna ljudska aktivnost erodira pod uticajem zlokobnih mašina, ne treba ni precenjivati trenutnu moć veštačke inteligencije.
LLM, makar oni danas dostupni, u suštini su „stohastički papagaji“ koji iz gomile teksta (jako dobro) pretpostavljaju koje reči logično dolaze kao odgovor na postavljeno pitanje. Na žalost ili na sreću, veštačka inteligencija ne može da „razume“ šta je dobar argument. Internet je prepun podataka, uključujući i Svetski priručnik za debatovanje i suđenje, koje LLM koriste za učenje. Ipak, postoji mnoštvo uvida o ljudskoj moći ubeđivanja koji nisu zapisani jasno u tekstu i koji se ne mogu tako naučiti.
Šta znači da je neki argument dokazan? Koliko dokaza i induktivnih tvrdnji je dovoljno da bismo rekli da je nešto „tačno“? Šta je tačan prag nakon kojeg kažemo da je neki dokaz relevantan i da njegov uticaj ne smemo ignorisati? U pitanju je senzibilnost koju kompetitivni debateri danas znaju implicitno. Nikada je nismo nigde kodifikovali i ona se neretko razlikuje među debaterima različitog porekla i iskustva, ali i dalje postoji. Prećutni dogovor, osećaj – zovite to kako hoćete, ali iskusne debatne sudije će prosto znati šta je potrebno da bi poverovale u neki argument i pre nego što to mogu koncizno i jasno da objasne.
AI optimisti će vam na ovo reći da je takav problem moguće rešiti putem neprekidnog davanja povratnih informacija LLM alatima. Iako možda inicijalni trening nije najbolji, kroz kontinuirani trening možemo da stvorimo boljeg debatera! Ovakav vid optimizma (ili pesimizma, u zavisnosti od tačke gledišta) ipak previđa jednu veliku tehničku manu LLM alata. Oni, naime, ne uče na isti način kao ljudi.
Ljudi uče kontinuirano. Debater će nakon debate dobiti povratne informacije o svom učinku od debatnih sudija, trenera ili svog debatnog partnera. Na ovaj način će moći da uvidi mane u argumentaciji ili iznošenju argumenata i da ih popravi. Učenje je proces adaptacije, neprekidnih modifikacija i primećivanja stvari koje često nisu izričito rečene. Ovakav vid učenja je ipak mnogo teži za LLM alate. Oni će inicijalno, za veliki broj zadataka koji se oslanjaju na tekst, biti bolji od čoveka, ali neće moći da se unaprede nakon toga istom brzinom kojom može čovek, navodi tehnološki esejista Dvarkeš Patel. Veštačka inteligencija ne postoji u kontekstu iz kojeg može da uči, već se oslanja isključivo na tekst. Prosto, Claude nikada nije bio u debati. Iskusio je jedino ono što mu debater kaže o debati.
Da li postoji šansa da problem kontinuiranog učenja bude rešen? Naravno! Više teksta za trening ili modeli koji bolje mogu da uviđaju šablone, donose implicitne zaključke i neprekidno uče, zasigurno bi se približili onome što se neretko naziva generalna veštačka inteligencija.
Tejdžas ipak smatra da, kada govorimo o modelima koji bi bolje debatovali, za ovako nešto i dalje nema puno finansijskog motiva. „Za pet godina ovo već neće biti problem“, dodaje on.
FINALNI OKRŠAJ ČOVEKA I MAŠINE
Na sceni se nalazi ogroman logo lava, simbola Sofije, prestonice Bugarske, koja je bila domaćin finala prošlogodišnjeg Svetskog univerzitetskog debatnog prvenstva.
„Zamislite debatera koji bi mogao da vas ubedi u bilo koji argument. [..] Ako biste čuli argument od njega, ne biste mu verovali zato što znate da bi isto tako lako mogao da vas ubedi i u nešto suprotno istini“, izgovara Udai, član tima prve vlade, pred prepunom salom.
Udai i Džek Stori, njegov debatni partner, predstavljali su Univerzitet u Sidneju. Finalna debata ticala se poželjnosti toga da se AI sistemi optimizuju tako da, oponašajući ljudska ponašanja, utiču na ljude. Šta će se dogoditi kada LLM alat bude mogao da nas ubedi u nešto bolje nego bilo koja živa osoba? Da li želimo AI koji bolje debatuje od timova koji su stigli do finala Svetskog univerzitetskog debatnog prvenstva?
Erozija poverenja, ogromna moć propagande koja se sada nalazi u rukama različitih aktera i potencijal za manipulaciju bili su neki od argumenata koje su Udai i Džek izneli. Timovi na strani opozicije su pak tvrdili da AI sa ubedljivošću čoveka može biti rešenje za veliki broj usamljenih ljudi koji bi možda tu pronašli utehu. Možda takav AI sistem može biti i bolji pregovarač u sferi međunarodnih odnosa!
„Čini mi se da su naši argumenti bili ubedljivi, ali ne nužno istiniti, niti stvari u koje sam bio naročito ubeđen“, podelio je Udai.
Panel od devet iskusnih sudija jednoglasno je presudio u korist prve vlade.
Kada sam ih upitala da li bi u debati mogli da pobede LLM alat koji bi debatovao kao što je to radio Project Debater 2019. godine, Udai i Tejdžas su dali drugačije odgovore. „Da, prilično sam siguran da bih mogao da pobedim. […] Aktuelni LLM-ovi su potpuno nesposobni u aspektu debate koji se tiče performansa i stila, gde se minimum polovina ubeđivanja zapravo odvija“, smatra Udai.
Tejdžas je odgovorio pitanjem: ko bi u takvoj debati bio sudija?
„Ukoliko sudi velika publika, verovatno bih izgubio. Ako sudi debatni sudija koji ima iskustvo u debati britanskog parlamentarnog formata, možda bih i mogao da pobedim“, rekao je kroz smeh.—©
MarŠa Vasić se više od deset loguua bavi kompetitivnom debatom. Završilaje osnovne i master studije na Fakultetu političkih nauka u Beogradu. Pored bavljenja marketišom, piše na svom Substack blolu Debate Land.
Objavljeno: 3. 6. 2026.
Izvor: Elementi -Bez Naslova
Autor: Marta Vasić
