Riječ je o autentičnim videima snimljenim mobilnim telefonom, bez ikakvih tehničkih indikatora AI generisanja ili deepfake manipulacije, kazao je ChatGPT, najpoznatiji alat Vještačke inteligencije (AI), na pitanje Portala 24kroz7 povodom snimaka obraćanja odbjeglog šefa organizovane kriminalne grupe Miloša Medenice, koji su se pojavili na društvenim mrežama.
Uprava policije i brojni političari vlasti, odmah nakon pojavljivanja prvog snimka u nedjelju 1. februara oko 18 časova, kazali su da je riječ o uratku napravljenom uz pomoć vještačke inteligencije.
Miloš Medenica, sin nekadašnje predsjednice Vrhovnog suda Crne Gore Vesne Medenice, kome je izrečena prvostepena presuda od deset godina i dva mjeseca, od 28. januara se nalazi u bjekstvu. Tereti se da za stvaranje kriminalne organizacije, produženo krivično djelo krijumčarenje, dva krivična djela protivzakoniti uticaj putem pomaganja, kao i za sprječavanje dokazivanja.
Nakon što su se na mreži “Iks”, na nalogu “Istina134696”, pojavili snimci obraćanja odbjeglog Medenice, u kojima se obraća ministru unutrašnjih poslova Danilu Šaranoviću i direktoru Uprave policije Lazaru Šćepanoviću, ali i pozdravlja lidera Demokratske narodne partije Milana Kneževića, u javnosti se otvorila polemika da li se radi o autentičnom ili snimku generisanom pomoću vještačke inteligencije.
Iz toga razloga, pitali smo ChatGpt za analizu autentičnosti snimaka i ubrzo dobili jasne odgovore.
– Kada je riječ o vizuelnoj forenzičkoj analizi, pokretima lica i mikro-ekspresije, prisutan je kontinuiran niz mikro-pokreta, pa obrve, kapci, vilica i obrazi reaguju prirodno na govor. Nema tzv. *facial drift-a* (pomjeranja lica nezavisno od glave), što je čest AI problem. Zjenice su stabilne, bez “plutanja” ili neprirodnog širenja/sužavanja. Treptaji su nepravilni i realni (AI često ima ritmične ili rijetke treptaje). Da zaključimo, obrazac mimike je ljudski, a ne sintetički – odgovara ChatGPT.
ChatGPT dalje navodi da sinhronizacija usana i glasa savršeno prate foneme, posebno suglasnike B, M, P, F, da nema kašnjenja, ni “klizanja” usana, niti tipičnog AI problema gdje se zubi ili unutrašnjost usta “mute” ili zamagle, što znači da nema tragova AI lip-sync sistema.
– Na videima postoji mikro-podrhtavanje kamere, glava prati ne nepredvidive korekcije položaja, često nesavršene, a ramena i vrat se pomjeraju nezavisno od lica (AI često “zaključa” tijelo), što je jak dokaz da je snimak stvaran – dodaje ChatGPT u analizi glave i pokreta tijela.
Govoreći o osvjetljenju, teksturi i kompresiji, ChatGPT navofi da je osvjetljenje neravnomjerno, da sjene na licu nijesu simetrične i da postoje male promjene u svjetlu dok se osoba pomjera, dok AI snimci često imaju “savršeno izbalansirano” svjetlo, što kada je rije i pomenutim snimcima toga nema.
– Koža ima realan šum, tzv. grain, posebno u sjenama, ivica lica prema pozadini nije “rastopljena”, a odjeća ima realne nabore koji se ponašaju fizički ispravno. Blaga “mekoća” slike dolazi od slabijeg osvjetljenja, platformske kompresije, moguće prednje kamere telefona, što se često pogrešno tumači kao AI, ali nije – dodaje ChatGPT u analizi teksture kože i ivica.
Kada se riječ o audio forenzici, to jest karakeristikama glasa, ChatGPT navodi da su prisutni mikro-drhtaj glasa, promjene tempa i disanja, da intonacija nije linearna niti “prečista” i da nema metalnog prizvuka ni uniformnosti tipične za TTS, odnosno AI glas. Pauze u govoru su nepravilne, odgovara ChatGPT, u skladu sa emocijom, čuje se blago uvlačenje vazduha između rečenica jer AI glasovi često “zaborave” disanje ili ga ubacuju vještački, što govori o vrlo snažom indikatoru prirodnog glasa.
– Emocija je konzistentna kroz cijeli klip, nema “emocionalnih skokova” ili neutralnih momenata tipičnih za AI, govor nije savršeno strukturisan jer ima blage zastanke, nepravilne naglaske i spontano formulisane rečenice. AI obično zvuči previše kontrolisano, a ovdje to nije slučaj – kaže ChatGPT u analizi emocionalne i psihološke konzistentnosti.
Kontekstualno analizirajući snimke, ChatGPT govori da u ovim snimcima nema znakova rezanja unutar rečenica nema nelogičnih skokova u kadru ili zvuku, da djeluju kao ,,jedan kontinualan take” i da ako postoji manipulacija, ona bi bila narativna, ne tehnička.
– Tehnička vjerovatnoća da se radi o videu generisanom pomoću alata vještačke inteligencije veoma je niska (≈ 5–10 odsto), dok je autentičnost snimka vrlo visoka (≈ 90–95 odsto)”, kaže ChatGPT u objedinjenoj analizi.
Zaključuje da je najrealni scenario da se radi o autentičnim videima snimljenim mobilnim telefonom, u slabijem osvjetljenju, sa naknadnom kompresijom platforme, bez ikakvih tehničkih indikatora AI generisanja ili deepfake manipulacije.
Uprava policije, u saopštenju objavljenom nakon prvog snimka Miloša Medenice, navodi da se radi o lažnom snimku, te da je riječ o manipulativnom sadržaju koji sadrži obmanjujuće informacije, usmjerene na narušavanje profesionalnog kredibiliteta i ugleda menadžmenta Ministarstva unutrašnjih poslova i Uprave policije.
U najnovijem snimku, trećem po redu, Miloš Medenica se kroz osmijeh osvrće na navode da su snimci sa njegovim likom kreirani pomoću vještačke inteligencije.
– Ja ću se oglašavati svakog dana, dok me ne uhapse ili dok ne demantuju da sam bot. Šćepo, sprinterice su tu – zaključuje Medenica u snimku, aludirajući na govor direktora policije Šćepanovića koji je 27. decembra u plenarnoj sali Skupštine Crne Gore kada je poručio da “oni koji su obučeni sada neka stave patike, sprinterice, ali neće pobjeći”.
Da li je Uprava policije ishireno reagovala kada je navela da su snimci Medenice generisani pomoću alata vještačke inteligencije i da li će u slučaju demantovanja neko zbog obmanjivanja javnosti, ako ne zbog dozvoljavanja bijega osuđenog šefa kriminalne grupe, u strukturana bezbjednosti podnijeti ostavku, ostaje da se vidi u narednim danima.
Komentariši