Arhitektura koja kombinuje duboke neuronske mreže i vektorsko-simboličke modele

Arhitektura koja kombinuje duboke neuronske mreže i vektorsko-simboličke modele

Istraživači iz IBM Research Zurich i ETH Cirih nedavno su kreirali novu arhitekturu koja kombinuje dva najpoznatija pristupa veštačkoj inteligenciji, naime duboke neuronske mreže i vektorsko-simboličke modele. Njihova arhitektura, predstavljena u Nature Machine Intelligence, mogla bi da prevaziđe ograničenja oba ova pristupa, efikasnije rešavajući progresivne matrice i druge zadatke rezonovanja.

„Naš nedavni rad zasnovan je na našim ranijim istraživačkim radovima koji su imali za cilj povećanje i poboljšanje neuronskih mreža pomoću moćne mašinerije vektorsko-simboličkih arhitektura (VSA)“, rekao je Abas Rahimi, jedan od istraživača koji su sproveli studiju, za Tech Ksplore. „Ova kombinacija je ranije primenjena na učenje sa nekoliko snimaka, kao i na zadatke kontinuiranog učenja sa nekoliko snimaka, postižući najsavremeniju tačnost sa nižom složenošću računara. U našem nedavnom radu, ovaj koncept preuzimamo izvan percepcije, fokusirajući se na rešavanje zadataka vizuelnog apstraktnog rezonovanja, konkretno, široko korišćenih testova inteligencije poznatih kao Ravenove progresivne matrice.“

Ravenove progresivne matrice su neverbalni testovi koji se obično koriste za testiranje koeficijenta inteligencije i veština apstraktnog rasuđivanja. Sastoje se od niza predmeta predstavljenih u setovima, gde nedostaje jedan ili više stavki.

Da bi rešili Ravenove progresivne matrice, ispitanici treba da tačno identifikuju stavke koje nedostaju u datim skupovima među nekoliko mogućih izbora. Ovo zahteva napredne sposobnosti zaključivanja, kao što je mogućnost otkrivanja apstraktnih odnosa između objekata, koji mogu biti povezani sa njihovim oblikom, veličinom, bojom ili drugim karakteristikama.

Neuro-vektorsko-simbolička arhitektura (NVSA) koju su razvili Rahimi i njegove kolege kombinuje duboke neuronske mreže, za koje se zna da dobro rade na zadacima percepcije, sa VSA mašinama. VSA su jedinstveni računarski modeli koji obavljaju simbolička izračunavanja koristeći distribuirane, visokodimenzionalne vektore.

„Iako bi naš pristup mogao zvučati pomalo kao neuro-simbolički AI pristupi, neuro-simbolička AI je nasledila ograničenja njihovog individualnog dubokog učenja i klasičnih simboličkih AI komponenti“, objasnio je Rahimi. „Naš ključni cilj je da se pozabavimo ovim ograničenjima, odnosno problemom neuronskog vezivanja i iscrpnom pretragom, u NVSA koristeći zajednički jezik između neuronskih i simboličkih komponenti.

Timska kombinacija dubokih neuronskih mreža i VSA podržana je sa dve glavne karakteristike dizajna arhitekture. To uključuje novi proces obuke neuronske mreže i metod za izvođenje VSA transformacija.

„Razvili smo dva ključna pokretača naše arhitekture“, rekao je Rahimi. „Prva je upotreba nove metode obuke neuronske mreže kao fleksibilnog sredstva za učenje predstavljanja preko VSA. Druga je metoda za postizanje ispravnih VSA transformacija tako da se iscrpna izračunavanja verovatnoće i pretraživanja mogu zameniti jednostavnijim algebarskim operacijama u VSA vektorski prostor“.

U početnim procenama, arhitektura koju su razvili Rahimi i njegove kolege postigla je veoma obećavajuće rezultate, rešavajući Ravenove progresivne matrice brže i efikasnije od drugih arhitektura razvijenih u prošlosti. Konkretno, imao je bolji učinak i od najsavremenijih dubokih neuronskih mreža i od neuro-simboličkih AI pristupa, postigavši nove rekordne tačnosti od 87,7% na RAVEN skupu podataka i 88,1% na I-RAVEN skupu podataka.

„Da bi se rešio Raven test, potrebno je nešto što se zove probabilistička otmica, proces koji uključuje traženje rešenja u prostoru definisanom prethodnim pozadinskim znanjem o testu“, rekao je Rahimi. „Prethodno znanje je predstavljeno u simboličkom obliku opisom svih mogućih realizacija pravila koje bi mogle da upravljaju Ravenovim testovima. Pristup čisto simboličkog zaključivanja treba da prođe kroz sve važeće kombinacije, izračuna verovatnoću pravila i sumira ih. Ova pretraga postaje računarska usko grlo u velikom prostoru za pretragu, zbog velikog broja kombinacija koje bi bilo nedovoljno testirati.“

Za razliku od postojećih arhitektura, NVSA može da izvrši opsežna verovatnoća proračuna u jednoj vektorskoj operaciji. Ovo mu zauzvrat omogućava da brže i preciznije rešava apstraktno rezonovanje i probleme vezane za analogiju, kao što su Ravenove progresivne matrice, nego drugi pristupi veštačke inteligencije zasnovani samo na dubokim neuronskim mrežama ili VSA.

„Naš pristup se takođe bavi problemom neuronskog vezivanja, omogućavajući jednoj neuronskoj mreži da odvojeno prepozna različita svojstva više objekata istovremeno u sceni“, rekao je Rahimi. „Sve u svemu, NVSA nudi transparentno, brzo i efikasno rezonovanje; i to je prvi primer koji pokazuje kako verovatnoćalno rezonovanje (kao nadogradnja čistog logičkog rezonovanja) može efikasno da se izvodi distribuiranim reprezentacijama i operatorima VSA. U poređenju sa simboličkim rezonovanjem neuro-simboličkim pristupima, verovatnoćalno rezonovanje NVSA je dva reda veličine brže, sa jeftinijim operacijama na distribuiranim reprezentacijama.“

Nova arhitektura koju je kreirao ovaj tim do sada se pokazala kao veoma obećavajuća za efikasno i brzo rešavanje složenih zadataka zaključivanja. U budućnosti bi se moglo testirati i primeniti na razne druge probleme, a istovremeno bi potencijalno inspirisalo razvoj drugih sličnih pristupa.

„NVSA je važan korak ka inkapsuliranju različitih paradigmi veštačke inteligencije u jedinstveni okvir za rešavanje zadataka koji uključuju i percepciju i razmišljanje višeg nivoa“, dodao je Rahimi. „Interesantno je da je NVSA već pokazala stepene generalizacije na različite nevidljive kombinacije objekata i atributa objekata. Dalja generalizacija u ovom pravcu je još uvek otvoren problem.