99热免费,女高潮大叫喷水流白浆,精品老肥婆88AV,美女后入视频,日韩h

首頁(yè)> 要聞 > > 正文

遠(yuǎn)超阿爾法狗? “戰(zhàn)顱”成戰(zhàn)場(chǎng)輔助決策“最強(qiáng)大腦”

2021-04-19 12:15:18 來(lái)源:科技日?qǐng)?bào)

團(tuán)隊(duì)成員基于“戰(zhàn)顱”進(jìn)行戰(zhàn)法推演受訪者供圖

在第四屆全國(guó)兵棋推演大賽“機(jī)—機(jī)”智能博弈專項(xiàng)賽中,國(guó)防科技大學(xué)系統(tǒng)工程學(xué)院智能規(guī)劃與目標(biāo)工程研究團(tuán)隊(duì)研發(fā)的作戰(zhàn)輔助決策智能體“戰(zhàn)顱”升級(jí)版“戰(zhàn)顱二號(hào)”,上演了一場(chǎng)扣人心弦的“戲碼”:在敵方搶占先機(jī)向它發(fā)起猛攻之時(shí),它展開了強(qiáng)力反擊,最終以1架飛機(jī)的優(yōu)勢(shì)反敗為勝。

現(xiàn)代戰(zhàn)爭(zhēng)是個(gè)復(fù)雜的系統(tǒng)工程,單靠指揮員個(gè)人的腦力運(yùn)算很難實(shí)現(xiàn)快速最優(yōu)決策,需要指控系統(tǒng)這個(gè)“機(jī)器大腦”輔助決策甚至替代指揮員執(zhí)行部分決策。如何使“機(jī)器大腦”各要素協(xié)同更密切、信息處理更高效、決策更精準(zhǔn),成為戰(zhàn)場(chǎng)上輔助決策的“最強(qiáng)大腦”,該團(tuán)隊(duì)一直在思考和鉆研。

探索智能決策“無(wú)人區(qū)”

提起人工智能算法,“戰(zhàn)顱”首席設(shè)計(jì)師馮旸赫如數(shù)家珍。2012年攻讀博士期間為了完成某項(xiàng)目研發(fā),他與人工智能算法結(jié)緣,從此開始系統(tǒng)的學(xué)習(xí)和研究。

2016年AlphaGo(阿爾法狗)戰(zhàn)勝世界圍棋冠軍,令人工智能名聲大噪。對(duì)于這個(gè)結(jié)果,馮旸赫并不感到意外,他早就敏銳地覺(jué)察到,智能化時(shí)代即將到來(lái),將智能化技術(shù)運(yùn)用到軍事領(lǐng)域?qū)⒋笥锌蔀椤?/p>

馮旸赫與同事們交流了自己的想法,大家一致認(rèn)為軍事智能化是一個(gè)重磅課題,甚至可能是制勝未來(lái)戰(zhàn)爭(zhēng)的關(guān)鍵,團(tuán)隊(duì)當(dāng)即把軍事智能研究列入了重大項(xiàng)目研究計(jì)劃。

“我們的研究方向是復(fù)雜對(duì)抗環(huán)境下作戰(zhàn)智能決策問(wèn)題,這個(gè)領(lǐng)域當(dāng)時(shí)在國(guó)內(nèi)還屬于無(wú)人區(qū)?!背坦鈾?quán)副研究員介紹說(shuō)。

團(tuán)隊(duì)定下了達(dá)到一般人類智能水平的階段性研發(fā)目標(biāo)。集中攻關(guān)4個(gè)月后,他們最終基于兵棋推演平臺(tái)研制出了融合知識(shí)推理、監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等一系列方法的作戰(zhàn)輔助決策智能體,并將其取名為“戰(zhàn)顱”。

團(tuán)隊(duì)成員吳克宇表示:“我們?cè)诿髦杏龅搅撕芏嗉夹g(shù)難關(guān),‘戰(zhàn)顱’面對(duì)的對(duì)抗環(huán)境中實(shí)體多、變數(shù)多、空間大、規(guī)則復(fù)雜,對(duì)動(dòng)作、速度等精準(zhǔn)度要求極高,遠(yuǎn)超AlphaGo等人工智能所要處理場(chǎng)景的復(fù)雜度?!?/p>

好的理論推演結(jié)果曾讓馮旸赫對(duì)實(shí)戰(zhàn)效果信心滿滿。但和真人進(jìn)行實(shí)戰(zhàn)對(duì)抗時(shí),“戰(zhàn)顱”暴露出智能化水平低、結(jié)果不穩(wěn)定的弱點(diǎn),效果并不盡如人意。

問(wèn)題出在哪里?團(tuán)隊(duì)經(jīng)過(guò)反復(fù)試驗(yàn)后發(fā)現(xiàn),與理論推演中設(shè)置的理想環(huán)境不同,作戰(zhàn)環(huán)境充斥著不確定性,態(tài)勢(shì)難以感知、目標(biāo)不易評(píng)判、信息不夠完全影響著“戰(zhàn)顱”的決策。團(tuán)隊(duì)認(rèn)為,單純對(duì)標(biāo)AlphaGo的研發(fā)思路,直接運(yùn)用深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等算法對(duì)“戰(zhàn)顱”行不通。

基于多年對(duì)運(yùn)籌和規(guī)劃問(wèn)題的研究積累,團(tuán)隊(duì)調(diào)整了技術(shù)路線:將傳統(tǒng)的優(yōu)化方法和智能化算法相結(jié)合,突出規(guī)則和經(jīng)驗(yàn)性知識(shí),綜合實(shí)體模型和人的經(jīng)驗(yàn),分階段、分場(chǎng)景處理。終于,“戰(zhàn)顱”的智能越來(lái)越強(qiáng)大,在實(shí)戰(zhàn)對(duì)抗中表現(xiàn)也越來(lái)越好。

“戰(zhàn)顱”以全勝戰(zhàn)績(jī)贏得冠軍

在人機(jī)大戰(zhàn)中,紅方“米格”戰(zhàn)機(jī)出發(fā)不久,藍(lán)方各傳感器已偵察到對(duì)方信息,迅速派出大批戰(zhàn)機(jī)升空壓制?!懊赘瘛眲傄贿M(jìn)入戰(zhàn)斗射程,藍(lán)方便發(fā)動(dòng)進(jìn)攻。一番糾纏,“戰(zhàn)顱”憑借強(qiáng)大的計(jì)算性能,不僅能利用戰(zhàn)機(jī)的盲區(qū)進(jìn)行規(guī)避,而且能抓住有利時(shí)機(jī)精準(zhǔn)打擊,紅方戰(zhàn)機(jī)接連被擊落數(shù)架。首場(chǎng)交戰(zhàn),“戰(zhàn)顱”就以770分的高分獲勝。

這是第三屆全國(guó)兵棋推演大賽“人機(jī)挑戰(zhàn)賽”場(chǎng)景。大賽吸引了全國(guó)11名優(yōu)秀人類挑戰(zhàn)者參與,他們與“戰(zhàn)顱”展開了22場(chǎng)激烈對(duì)決,最終,“戰(zhàn)顱”以22場(chǎng)全勝戰(zhàn)績(jī)贏得冠軍,也標(biāo)志著我國(guó)走出了智能決策技術(shù)落地應(yīng)用的重要一步。

挑戰(zhàn)者王俊翔與“戰(zhàn)顱”交手后表示,“戰(zhàn)顱”的優(yōu)點(diǎn)是數(shù)據(jù)分析和學(xué)習(xí)的能力強(qiáng),能針對(duì)人類選手的操作,根據(jù)實(shí)時(shí)態(tài)勢(shì)改變應(yīng)對(duì)策略,擅長(zhǎng)精算、細(xì)算。

實(shí)際上在開賽前,“戰(zhàn)顱”便已與48名選手對(duì)戰(zhàn)了36場(chǎng),并保持全勝戰(zhàn)績(jī)。58場(chǎng)全勝,如此“神操作”,究竟是如何做到的?

馮旸赫介紹說(shuō):“賽前,我們利用人與人對(duì)抗產(chǎn)生的優(yōu)質(zhì)數(shù)據(jù)和機(jī)器自打產(chǎn)生的大數(shù)據(jù)對(duì)‘戰(zhàn)顱’進(jìn)行了充分訓(xùn)練。截至參賽,‘戰(zhàn)顱’一共訓(xùn)練了136天,每天自打160余場(chǎng)?!?/p>

光鮮亮麗的背后,更多的是不為人知的付出。備戰(zhàn)比賽階段,團(tuán)隊(duì)在實(shí)驗(yàn)室安營(yíng)扎寨,每天都工作到深夜。

“從近一個(gè)月的參賽表現(xiàn)看,‘戰(zhàn)顱’不僅學(xué)會(huì)了一些人類選手的經(jīng)典戰(zhàn)法,還獨(dú)創(chuàng)了特有的戰(zhàn)法戰(zhàn)術(shù)。”團(tuán)隊(duì)負(fù)責(zé)人黃金才研究員表示,人工智能技術(shù)的應(yīng)用提高了指控系統(tǒng)的自動(dòng)化程度和打擊精度,是奪取未來(lái)戰(zhàn)場(chǎng)制高點(diǎn)的關(guān)鍵。

升級(jí)版“戰(zhàn)顱二號(hào)”戰(zhàn)法更靈活

與往屆全部使用行動(dòng)指令、控制實(shí)體作戰(zhàn)的“人人對(duì)抗賽”“人機(jī)對(duì)抗賽”不同,第四屆全國(guó)兵棋推演大賽首次設(shè)置了“機(jī)—機(jī)”智能體博弈專項(xiàng)賽,比賽采用任務(wù)級(jí)兵棋推演平臺(tái),作戰(zhàn)任務(wù)為??章?lián)合攻防。

團(tuán)隊(duì)派出了“戰(zhàn)顱”智能體的最新升級(jí)版本——“戰(zhàn)顱二號(hào)”。最終,“戰(zhàn)顱二號(hào)”以107分的高分排名第一,勇奪“機(jī)—機(jī)”智能博弈專項(xiàng)賽冠軍。

“在交戰(zhàn)中,我感覺(jué)到‘戰(zhàn)顱二號(hào)’的戰(zhàn)法很靈活,每一步?jīng)Q策都精準(zhǔn)到位,給人一種難以攻破、難以防守的感覺(jué)?!迸c“戰(zhàn)顱二號(hào)”交鋒的選手說(shuō)。

“‘戰(zhàn)顱二號(hào)’完成了聯(lián)合防空、對(duì)海攻擊以及空中作戰(zhàn)3個(gè)模塊的任務(wù),通過(guò)模塊間的組織,‘戰(zhàn)顱二號(hào)’能夠面對(duì)不同的敵人選擇不同的打法,做到敵變我變?!瘪T旸赫表示,今年的比賽中,智能體不再是給飛機(jī)、艦船等實(shí)體下達(dá)“動(dòng)作級(jí)”指令,指揮它們具體往哪個(gè)方向行動(dòng),而是憑借具有自主決策能力的智能化模型,讓實(shí)體完成如巡邏、偵察、開火等“任務(wù)級(jí)”指令。經(jīng)此改進(jìn),實(shí)體具備了“主觀能動(dòng)性”,能像人一樣根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)機(jī)動(dòng)靈活地執(zhí)行智能體下達(dá)的命令,這不僅提高了輔助決策的效率,也有助于探索更加出其不意的戰(zhàn)法。

對(duì)抗過(guò)程中,憑借戰(zhàn)法模塊間的任務(wù)調(diào)度、力量配置、任務(wù)觸發(fā),“戰(zhàn)顱二號(hào)”一路高歌猛進(jìn),任憑對(duì)方智能體使出“繞后偷襲”“強(qiáng)力防守”“猛烈進(jìn)攻”“誘騙導(dǎo)彈”等多種戰(zhàn)法,它都能精準(zhǔn)研判態(tài)勢(shì),快速形成決策,一一擊敗對(duì)手。

走下賽場(chǎng),團(tuán)隊(duì)領(lǐng)軍專家劉忠表示,要繼續(xù)將數(shù)據(jù)、知識(shí)和機(jī)理很好地融合,將運(yùn)籌規(guī)劃和知識(shí)推理、強(qiáng)化學(xué)習(xí)等人工智能技術(shù)相結(jié)合,探索智能博弈的新機(jī)理,推動(dòng)智能規(guī)劃技術(shù)的研究落地,打造自主決策能力更強(qiáng)、學(xué)習(xí)能力更快、具有較強(qiáng)場(chǎng)景遷移能力的新一代智能體。(張 強(qiáng))

[ 責(zé)編:武玥彤]

標(biāo)簽: 阿爾法 戰(zhàn)場(chǎng) 輔助 決策