[汽車之家 資訊] 日前,據(jù)外媒報(bào)道,美國麻省理工學(xué)院(MIT)的研究人員展示了當(dāng)某種特定的神經(jīng)網(wǎng)絡(luò)被訓(xùn)練執(zhí)行導(dǎo)航任務(wù)時(shí),其能夠理解該項(xiàng)任務(wù)真正的因果結(jié)構(gòu)。該項(xiàng)研究能夠提升執(zhí)行高風(fēng)險(xiǎn)的機(jī)器學(xué)習(xí)代理的可靠性和可信度,如在繁忙高速公路上駕駛自動駕駛汽車。
據(jù)悉,此類神經(jīng)網(wǎng)絡(luò)能夠直接從視覺數(shù)據(jù)理解該任務(wù),當(dāng)在樹木密集或天氣條件變化迅速的地方等復(fù)雜環(huán)境中導(dǎo)航時(shí),此類神經(jīng)網(wǎng)絡(luò)比其他神經(jīng)網(wǎng)絡(luò)更高效。該項(xiàng)新研究利用了此前Hasani和其他人的研究,后者展示了一種由液體神經(jīng)網(wǎng)絡(luò)細(xì)胞構(gòu)建的、受大腦啟發(fā)的深度學(xué)習(xí)系統(tǒng)-神經(jīng)回路策略(Neural Circuit Policy,NCP),如何通過只有19個(gè)控制神經(jīng)元的網(wǎng)絡(luò)自動控制一輛自動駕駛汽車。
研究人員觀察到,執(zhí)行車道保持任務(wù)的NPC在做出駕駛決策時(shí),會將注意力集中在道路的地平線和邊界上,這與人類駕駛汽車時(shí)的做法相同,而所研究的其他神經(jīng)網(wǎng)絡(luò)并不會總會關(guān)注于道路。他們發(fā)現(xiàn),當(dāng)一個(gè)NCP在接受完成一個(gè)任務(wù)的訓(xùn)練時(shí),該神經(jīng)網(wǎng)絡(luò)學(xué)會與環(huán)境互動,并理解干預(yù)行為。從本質(zhì)上看,該網(wǎng)絡(luò)能夠識別其輸出是否被某種干預(yù)所改變,然后將因果聯(lián)系在一起。
在訓(xùn)練過程中,該網(wǎng)絡(luò)向前運(yùn)行以生成輸出,然后返回運(yùn)行以糾正錯(cuò)誤。研究人員觀察到,NPC會在前向運(yùn)行和后向運(yùn)行模式中將因果關(guān)系關(guān)聯(lián)起來,從而可以使該網(wǎng)絡(luò)能夠?qū)⒆⒁饬性谡嬲囊蚬Y(jié)構(gòu)上。
研究人員發(fā)現(xiàn),在天氣好的情況下,NPC在較簡單任務(wù)上的表現(xiàn)與其他神經(jīng)網(wǎng)絡(luò)一樣好,但在更具挑戰(zhàn)性的任務(wù)上,如在暴雨中跟隨移動的物體時(shí),NPC的表現(xiàn)要好于其他神經(jīng)網(wǎng)絡(luò)。未來,研究人員希望探索采用NCP來構(gòu)建更大的系統(tǒng)。將成千上萬的神經(jīng)網(wǎng)絡(luò)連接在一起,從而讓其處理更復(fù)雜的任務(wù)。(編譯/汽車之家 馬艾駿)
好評理由:
差評理由: