猜你喜歡
更多>團(tuán)隊(duì)成員基于“戰(zhàn)顱”進(jìn)行戰(zhàn)法推演受訪者供圖
在第四屆全國(guó)兵棋推演大賽“機(jī)—機(jī)”智能博弈專項(xiàng)賽中,國(guó)防科技大學(xué)系統(tǒng)工程學(xué)院智能規(guī)劃與目標(biāo)工程研究團(tuán)隊(duì)研發(fā)的作戰(zhàn)輔助決策智能體“戰(zhàn)顱”升級(jí)版“戰(zhàn)顱二號(hào)”,上演了一場(chǎng)扣人心弦的“戲碼”:在敵方搶占先機(jī)向它發(fā)起猛攻之時(shí),它展開了強(qiáng)力反擊,最終以1架飛機(jī)的優(yōu)勢(shì)反敗為勝。
現(xiàn)代戰(zhàn)爭(zhēng)是個(gè)復(fù)雜的系統(tǒng)工程,單靠指揮員個(gè)人的腦力運(yùn)算很難實(shí)現(xiàn)快速最優(yōu)決策,需要指控系統(tǒng)這個(gè)“機(jī)器大腦”輔助決策甚至替代指揮員執(zhí)行部分決策。如何使“機(jī)器大腦”各要素協(xié)同更密切、信息處理更高效、決策更精準(zhǔn),成為戰(zhàn)場(chǎng)上輔助決策的“最強(qiáng)大腦”,該團(tuán)隊(duì)一直在思考和鉆研。
探索智能決策“無(wú)人區(qū)”
提起人工智能算法,“戰(zhàn)顱”首席設(shè)計(jì)師馮旸赫如數(shù)家珍。2012年攻讀博士期間為了完成某項(xiàng)目研發(fā),他與人工智能算法結(jié)緣,從此開始系統(tǒng)的學(xué)習(xí)和研究。
2016年AlphaGo(阿爾法狗)戰(zhàn)勝世界圍棋冠軍,令人工智能名聲大噪。對(duì)于這個(gè)結(jié)果,馮旸赫并不感到意外,他早就敏銳地覺(jué)察到,智能化時(shí)代即將到來(lái),將智能化技術(shù)運(yùn)用到軍事領(lǐng)域?qū)⒋笥锌蔀椤?/p>
馮旸赫與同事們交流了自己的想法,大家一致認(rèn)為軍事智能化是一個(gè)重磅課題,甚至可能是制勝未來(lái)戰(zhàn)爭(zhēng)的關(guān)鍵,團(tuán)隊(duì)當(dāng)即把軍事智能研究列入了重大項(xiàng)目研究計(jì)劃。
“我們的研究方向是復(fù)雜對(duì)抗環(huán)境下作戰(zhàn)智能決策問(wèn)題,這個(gè)領(lǐng)域當(dāng)時(shí)在國(guó)內(nèi)還屬于無(wú)人區(qū)?!背坦鈾?quán)副研究員介紹說(shuō)。
團(tuán)隊(duì)定下了達(dá)到一般人類智能水平的階段性研發(fā)目標(biāo)。集中攻關(guān)4個(gè)月后,他們最終基于兵棋推演平臺(tái)研制出了融合知識(shí)推理、監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等一系列方法的作戰(zhàn)輔助決策智能體,并將其取名為“戰(zhàn)顱”。
團(tuán)隊(duì)成員吳克宇表示:“我們?cè)诿髦杏龅搅撕芏嗉夹g(shù)難關(guān),‘戰(zhàn)顱’面對(duì)的對(duì)抗環(huán)境中實(shí)體多、變數(shù)多、空間大、規(guī)則復(fù)雜,對(duì)動(dòng)作、速度等精準(zhǔn)度要求極高,遠(yuǎn)超AlphaGo等人工智能所要處理場(chǎng)景的復(fù)雜度?!?/p>
好的理論推演結(jié)果曾讓馮旸赫對(duì)實(shí)戰(zhàn)效果信心滿滿。但和真人進(jìn)行實(shí)戰(zhàn)對(duì)抗時(shí),“戰(zhàn)顱”暴露出智能化水平低、結(jié)果不穩(wěn)定的弱點(diǎn),效果并不盡如人意。
問(wèn)題出在哪里?團(tuán)隊(duì)經(jīng)過(guò)反復(fù)試驗(yàn)后發(fā)現(xiàn),與理論推演中設(shè)置的理想環(huán)境不同,作戰(zhàn)環(huán)境充斥著不確定性,態(tài)勢(shì)難以感知、目標(biāo)不易評(píng)判、信息不夠完全影響著“戰(zhàn)顱”的決策。團(tuán)隊(duì)認(rèn)為,單純對(duì)標(biāo)AlphaGo的研發(fā)思路,直接運(yùn)用深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等算法對(duì)“戰(zhàn)顱”行不通。
基于多年對(duì)運(yùn)籌和規(guī)劃問(wèn)題的研究積累,團(tuán)隊(duì)調(diào)整了技術(shù)路線:將傳統(tǒng)的優(yōu)化方法和智能化算法相結(jié)合,突出規(guī)則和經(jīng)驗(yàn)性知識(shí),綜合實(shí)體模型和人的經(jīng)驗(yàn),分階段、分場(chǎng)景處理。終于,“戰(zhàn)顱”的智能越來(lái)越強(qiáng)大,在實(shí)戰(zhàn)對(duì)抗中表現(xiàn)也越來(lái)越好。
“戰(zhàn)顱”以全勝戰(zhàn)績(jī)贏得冠軍
在人機(jī)大戰(zhàn)中,紅方“米格”戰(zhàn)機(jī)出發(fā)不久,藍(lán)方各傳感器已偵察到對(duì)方信息,迅速派出大批戰(zhàn)機(jī)升空壓制?!懊赘瘛眲傄贿M(jìn)入戰(zhàn)斗射程,藍(lán)方便發(fā)動(dòng)進(jìn)攻。一番糾纏,“戰(zhàn)顱”憑借強(qiáng)大的計(jì)算性能,不僅能利用戰(zhàn)機(jī)的盲區(qū)進(jìn)行規(guī)避,而且能抓住有利時(shí)機(jī)精準(zhǔn)打擊,紅方戰(zhàn)機(jī)接連被擊落數(shù)架。首場(chǎng)交戰(zhàn),“戰(zhàn)顱”就以770分的高分獲勝。
這是第三屆全國(guó)兵棋推演大賽“人機(jī)挑戰(zhàn)賽”場(chǎng)景。大賽吸引了全國(guó)11名優(yōu)秀人類挑戰(zhàn)者參與,他們與“戰(zhàn)顱”展開了22場(chǎng)激烈對(duì)決,最終,“戰(zhàn)顱”以22場(chǎng)全勝戰(zhàn)績(jī)贏得冠軍,也標(biāo)志著我國(guó)走出了智能決策技術(shù)落地應(yīng)用的重要一步。
挑戰(zhàn)者王俊翔與“戰(zhàn)顱”交手后表示,“戰(zhàn)顱”的優(yōu)點(diǎn)是數(shù)據(jù)分析和學(xué)習(xí)的能力強(qiáng),能針對(duì)人類選手的操作,根據(jù)實(shí)時(shí)態(tài)勢(shì)改變應(yīng)對(duì)策略,擅長(zhǎng)精算、細(xì)算。
實(shí)際上在開賽前,“戰(zhàn)顱”便已與48名選手對(duì)戰(zhàn)了36場(chǎng),并保持全勝戰(zhàn)績(jī)。58場(chǎng)全勝,如此“神操作”,究竟是如何做到的?
馮旸赫介紹說(shuō):“賽前,我們利用人與人對(duì)抗產(chǎn)生的優(yōu)質(zhì)數(shù)據(jù)和機(jī)器自打產(chǎn)生的大數(shù)據(jù)對(duì)‘戰(zhàn)顱’進(jìn)行了充分訓(xùn)練。截至參賽,‘戰(zhàn)顱’一共訓(xùn)練了136天,每天自打160余場(chǎng)?!?/p>
光鮮亮麗的背后,更多的是不為人知的付出。備戰(zhàn)比賽階段,團(tuán)隊(duì)在實(shí)驗(yàn)室安營(yíng)扎寨,每天都工作到深夜。
“從近一個(gè)月的參賽表現(xiàn)看,‘戰(zhàn)顱’不僅學(xué)會(huì)了一些人類選手的經(jīng)典戰(zhàn)法,還獨(dú)創(chuàng)了特有的戰(zhàn)法戰(zhàn)術(shù)。”團(tuán)隊(duì)負(fù)責(zé)人黃金才研究員表示,人工智能技術(shù)的應(yīng)用提高了指控系統(tǒng)的自動(dòng)化程度和打擊精度,是奪取未來(lái)戰(zhàn)場(chǎng)制高點(diǎn)的關(guān)鍵。
升級(jí)版“戰(zhàn)顱二號(hào)”戰(zhàn)法更靈活
與往屆全部使用行動(dòng)指令、控制實(shí)體作戰(zhàn)的“人人對(duì)抗賽”“人機(jī)對(duì)抗賽”不同,第四屆全國(guó)兵棋推演大賽首次設(shè)置了“機(jī)—機(jī)”智能體博弈專項(xiàng)賽,比賽采用任務(wù)級(jí)兵棋推演平臺(tái),作戰(zhàn)任務(wù)為??章?lián)合攻防。
團(tuán)隊(duì)派出了“戰(zhàn)顱”智能體的最新升級(jí)版本——“戰(zhàn)顱二號(hào)”。最終,“戰(zhàn)顱二號(hào)”以107分的高分排名第一,勇奪“機(jī)—機(jī)”智能博弈專項(xiàng)賽冠軍。
“在交戰(zhàn)中,我感覺(jué)到‘戰(zhàn)顱二號(hào)’的戰(zhàn)法很靈活,每一步?jīng)Q策都精準(zhǔn)到位,給人一種難以攻破、難以防守的感覺(jué)?!迸c“戰(zhàn)顱二號(hào)”交鋒的選手說(shuō)。
“‘戰(zhàn)顱二號(hào)’完成了聯(lián)合防空、對(duì)海攻擊以及空中作戰(zhàn)3個(gè)模塊的任務(wù),通過(guò)模塊間的組織,‘戰(zhàn)顱二號(hào)’能夠面對(duì)不同的敵人選擇不同的打法,做到敵變我變?!瘪T旸赫表示,今年的比賽中,智能體不再是給飛機(jī)、艦船等實(shí)體下達(dá)“動(dòng)作級(jí)”指令,指揮它們具體往哪個(gè)方向行動(dòng),而是憑借具有自主決策能力的智能化模型,讓實(shí)體完成如巡邏、偵察、開火等“任務(wù)級(jí)”指令。經(jīng)此改進(jìn),實(shí)體具備了“主觀能動(dòng)性”,能像人一樣根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)機(jī)動(dòng)靈活地執(zhí)行智能體下達(dá)的命令,這不僅提高了輔助決策的效率,也有助于探索更加出其不意的戰(zhàn)法。
對(duì)抗過(guò)程中,憑借戰(zhàn)法模塊間的任務(wù)調(diào)度、力量配置、任務(wù)觸發(fā),“戰(zhàn)顱二號(hào)”一路高歌猛進(jìn),任憑對(duì)方智能體使出“繞后偷襲”“強(qiáng)力防守”“猛烈進(jìn)攻”“誘騙導(dǎo)彈”等多種戰(zhàn)法,它都能精準(zhǔn)研判態(tài)勢(shì),快速形成決策,一一擊敗對(duì)手。
走下賽場(chǎng),團(tuán)隊(duì)領(lǐng)軍專家劉忠表示,要繼續(xù)將數(shù)據(jù)、知識(shí)和機(jī)理很好地融合,將運(yùn)籌規(guī)劃和知識(shí)推理、強(qiáng)化學(xué)習(xí)等人工智能技術(shù)相結(jié)合,探索智能博弈的新機(jī)理,推動(dòng)智能規(guī)劃技術(shù)的研究落地,打造自主決策能力更強(qiáng)、學(xué)習(xí)能力更快、具有較強(qiáng)場(chǎng)景遷移能力的新一代智能體。(張 強(qiáng))
[ 責(zé)編:武玥彤]標(biāo)簽: 阿爾法 戰(zhàn)場(chǎng) 輔助 決策
最新推薦
更多>石榴快播丨推動(dòng)國(guó)資國(guó)企高質(zhì)量發(fā)展邁上新臺(tái)階 自治區(qū)區(qū)屬國(guó)有企業(yè)座談會(huì)今日召開
武漢地鐵幾點(diǎn)開班收班(武漢地鐵幾點(diǎn)開班)
河北啟動(dòng)干旱防御Ⅳ級(jí)應(yīng)急響應(yīng) 多措并舉保障農(nóng)業(yè)生產(chǎn)
鄧倫犯了什么事 鄧倫被強(qiáng)制執(zhí)行 基本情況講解
華誼兄弟:《非誠(chéng)勿擾3》已于6月開機(jī)制作
國(guó)產(chǎn)小爆款《火山的女兒》銷量60萬(wàn)!Steam好評(píng)如潮
GGII:6月全國(guó)備案154個(gè)儲(chǔ)能項(xiàng)目 總規(guī)模達(dá)15.4GW/34.9GWh
聯(lián)泰環(huán)保:聯(lián)合中標(biāo)汕頭市澄海區(qū)蓮下污水處理廠二期及配套管網(wǎng)完善建設(shè)項(xiàng)目
猜你喜歡
更多>要聞
更多>終極斗羅15:家丑不可外揚(yáng),傳靈塔卻反其道而行之
新化:洋溪鎮(zhèn)撬動(dòng)行業(yè)協(xié)會(huì)力量,助推農(nóng)村建筑安全、耕地保護(hù)和控違拆違工作良性開展
嘉峪關(guān)酒泉機(jī)場(chǎng)工程順利通過(guò)行業(yè)驗(yàn)收 計(jì)劃9月7日復(fù)航
3連板大連熱電(600719.SH):擬籌劃的資產(chǎn)重組事項(xiàng)存在不確定性
昊華科技(600378)周評(píng):本周跌3.29%,主力資金合計(jì)凈流出1578.27萬(wàn)元
借力AI賦能全球創(chuàng)作者 萬(wàn)興科技攜Wondershare Filmora亮相創(chuàng)作
全部真實(shí)業(yè)務(wù)系統(tǒng)!華為云展示盤古大模型行業(yè)應(yīng)用