国语自产精品视频在线第100页,亚洲视频管

首頁(yè)> 要聞 > > 正文

遠(yuǎn)超阿爾法狗？ “戰(zhàn)顱”成戰(zhàn)場(chǎng)輔助決策“最強(qiáng)大腦”

2021-04-19 12:15:18 來(lái)源：科技日?qǐng)?bào)

團(tuán)隊(duì)成員基于“戰(zhàn)顱”進(jìn)行戰(zhàn)法推演受訪者供圖

在第四屆全國(guó)兵棋推演大賽“機(jī)—機(jī)”智能博弈專項(xiàng)賽中，國(guó)防科技大學(xué)系統(tǒng)工程學(xué)院智能規(guī)劃與目標(biāo)工程研究團(tuán)隊(duì)研發(fā)的作戰(zhàn)輔助決策智能體“戰(zhàn)顱”升級(jí)版“戰(zhàn)顱二號(hào)”，上演了一場(chǎng)扣人心弦的“戲碼”：在敵方搶占先機(jī)向它發(fā)起猛攻之時(shí)，它展開了強(qiáng)力反擊，最終以1架飛機(jī)的優(yōu)勢(shì)反敗為勝。

現(xiàn)代戰(zhàn)爭(zhēng)是個(gè)復(fù)雜的系統(tǒng)工程，單靠指揮員個(gè)人的腦力運(yùn)算很難實(shí)現(xiàn)快速最優(yōu)決策，需要指控系統(tǒng)這個(gè)“機(jī)器大腦”輔助決策甚至替代指揮員執(zhí)行部分決策。如何使“機(jī)器大腦”各要素協(xié)同更密切、信息處理更高效、決策更精準(zhǔn)，成為戰(zhàn)場(chǎng)上輔助決策的“最強(qiáng)大腦”，該團(tuán)隊(duì)一直在思考和鉆研。

探索智能決策“無(wú)人區(qū)”

提起人工智能算法，“戰(zhàn)顱”首席設(shè)計(jì)師馮旸赫如數(shù)家珍。2012年攻讀博士期間為了完成某項(xiàng)目研發(fā)，他與人工智能算法結(jié)緣，從此開始系統(tǒng)的學(xué)習(xí)和研究。

2016年AlphaGo（阿爾法狗）戰(zhàn)勝世界圍棋冠軍，令人工智能名聲大噪。對(duì)于這個(gè)結(jié)果，馮旸赫并不感到意外，他早就敏銳地覺(jué)察到，智能化時(shí)代即將到來(lái)，將智能化技術(shù)運(yùn)用到軍事領(lǐng)域?qū)⒋笥锌蔀椤?/p>

馮旸赫與同事們交流了自己的想法，大家一致認(rèn)為軍事智能化是一個(gè)重磅課題，甚至可能是制勝未來(lái)戰(zhàn)爭(zhēng)的關(guān)鍵，團(tuán)隊(duì)當(dāng)即把軍事智能研究列入了重大項(xiàng)目研究計(jì)劃。

“我們的研究方向是復(fù)雜對(duì)抗環(huán)境下作戰(zhàn)智能決策問(wèn)題，這個(gè)領(lǐng)域當(dāng)時(shí)在國(guó)內(nèi)還屬于無(wú)人區(qū)?！背坦鈾?quán)副研究員介紹說(shuō)。

團(tuán)隊(duì)定下了達(dá)到一般人類智能水平的階段性研發(fā)目標(biāo)。集中攻關(guān)4個(gè)月后，他們最終基于兵棋推演平臺(tái)研制出了融合知識(shí)推理、監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等一系列方法的作戰(zhàn)輔助決策智能體，并將其取名為“戰(zhàn)顱”。

團(tuán)隊(duì)成員吳克宇表示：“我們?cè)诿髦杏龅搅撕芏嗉夹g(shù)難關(guān)，‘戰(zhàn)顱’面對(duì)的對(duì)抗環(huán)境中實(shí)體多、變數(shù)多、空間大、規(guī)則復(fù)雜，對(duì)動(dòng)作、速度等精準(zhǔn)度要求極高，遠(yuǎn)超AlphaGo等人工智能所要處理場(chǎng)景的復(fù)雜度?！?/p>

好的理論推演結(jié)果曾讓馮旸赫對(duì)實(shí)戰(zhàn)效果信心滿滿。但和真人進(jìn)行實(shí)戰(zhàn)對(duì)抗時(shí)，“戰(zhàn)顱”暴露出智能化水平低、結(jié)果不穩(wěn)定的弱點(diǎn)，效果并不盡如人意。

問(wèn)題出在哪里？團(tuán)隊(duì)經(jīng)過(guò)反復(fù)試驗(yàn)后發(fā)現(xiàn)，與理論推演中設(shè)置的理想環(huán)境不同，作戰(zhàn)環(huán)境充斥著不確定性，態(tài)勢(shì)難以感知、目標(biāo)不易評(píng)判、信息不夠完全影響著“戰(zhàn)顱”的決策。團(tuán)隊(duì)認(rèn)為，單純對(duì)標(biāo)AlphaGo的研發(fā)思路，直接運(yùn)用深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等算法對(duì)“戰(zhàn)顱”行不通。

基于多年對(duì)運(yùn)籌和規(guī)劃問(wèn)題的研究積累，團(tuán)隊(duì)調(diào)整了技術(shù)路線：將傳統(tǒng)的優(yōu)化方法和智能化算法相結(jié)合，突出規(guī)則和經(jīng)驗(yàn)性知識(shí)，綜合實(shí)體模型和人的經(jīng)驗(yàn)，分階段、分場(chǎng)景處理。終于，“戰(zhàn)顱”的智能越來(lái)越強(qiáng)大，在實(shí)戰(zhàn)對(duì)抗中表現(xiàn)也越來(lái)越好。

“戰(zhàn)顱”以全勝戰(zhàn)績(jī)贏得冠軍

在人機(jī)大戰(zhàn)中，紅方“米格”戰(zhàn)機(jī)出發(fā)不久，藍(lán)方各傳感器已偵察到對(duì)方信息，迅速派出大批戰(zhàn)機(jī)升空壓制?！懊赘瘛眲傄贿M(jìn)入戰(zhàn)斗射程，藍(lán)方便發(fā)動(dòng)進(jìn)攻。一番糾纏，“戰(zhàn)顱”憑借強(qiáng)大的計(jì)算性能，不僅能利用戰(zhàn)機(jī)的盲區(qū)進(jìn)行規(guī)避，而且能抓住有利時(shí)機(jī)精準(zhǔn)打擊，紅方戰(zhàn)機(jī)接連被擊落數(shù)架。首場(chǎng)交戰(zhàn)，“戰(zhàn)顱”就以770分的高分獲勝。

這是第三屆全國(guó)兵棋推演大賽“人機(jī)挑戰(zhàn)賽”場(chǎng)景。大賽吸引了全國(guó)11名優(yōu)秀人類挑戰(zhàn)者參與，他們與“戰(zhàn)顱”展開了22場(chǎng)激烈對(duì)決，最終，“戰(zhàn)顱”以22場(chǎng)全勝戰(zhàn)績(jī)贏得冠軍，也標(biāo)志著我國(guó)走出了智能決策技術(shù)落地應(yīng)用的重要一步。

挑戰(zhàn)者王俊翔與“戰(zhàn)顱”交手后表示，“戰(zhàn)顱”的優(yōu)點(diǎn)是數(shù)據(jù)分析和學(xué)習(xí)的能力強(qiáng)，能針對(duì)人類選手的操作，根據(jù)實(shí)時(shí)態(tài)勢(shì)改變應(yīng)對(duì)策略，擅長(zhǎng)精算、細(xì)算。

實(shí)際上在開賽前，“戰(zhàn)顱”便已與48名選手對(duì)戰(zhàn)了36場(chǎng)，并保持全勝戰(zhàn)績(jī)。58場(chǎng)全勝，如此“神操作”，究竟是如何做到的？

馮旸赫介紹說(shuō)：“賽前，我們利用人與人對(duì)抗產(chǎn)生的優(yōu)質(zhì)數(shù)據(jù)和機(jī)器自打產(chǎn)生的大數(shù)據(jù)對(duì)‘戰(zhàn)顱’進(jìn)行了充分訓(xùn)練。截至參賽，‘戰(zhàn)顱’一共訓(xùn)練了136天，每天自打160余場(chǎng)?！?/p>

光鮮亮麗的背后，更多的是不為人知的付出。備戰(zhàn)比賽階段，團(tuán)隊(duì)在實(shí)驗(yàn)室安營(yíng)扎寨，每天都工作到深夜。

“從近一個(gè)月的參賽表現(xiàn)看，‘戰(zhàn)顱’不僅學(xué)會(huì)了一些人類選手的經(jīng)典戰(zhàn)法，還獨(dú)創(chuàng)了特有的戰(zhàn)法戰(zhàn)術(shù)。”團(tuán)隊(duì)負(fù)責(zé)人黃金才研究員表示，人工智能技術(shù)的應(yīng)用提高了指控系統(tǒng)的自動(dòng)化程度和打擊精度，是奪取未來(lái)戰(zhàn)場(chǎng)制高點(diǎn)的關(guān)鍵。

升級(jí)版“戰(zhàn)顱二號(hào)”戰(zhàn)法更靈活

與往屆全部使用行動(dòng)指令、控制實(shí)體作戰(zhàn)的“人人對(duì)抗賽”“人機(jī)對(duì)抗賽”不同，第四屆全國(guó)兵棋推演大賽首次設(shè)置了“機(jī)—機(jī)”智能體博弈專項(xiàng)賽，比賽采用任務(wù)級(jí)兵棋推演平臺(tái)，作戰(zhàn)任務(wù)為?？章?lián)合攻防。

團(tuán)隊(duì)派出了“戰(zhàn)顱”智能體的最新升級(jí)版本——“戰(zhàn)顱二號(hào)”。最終，“戰(zhàn)顱二號(hào)”以107分的高分排名第一，勇奪“機(jī)—機(jī)”智能博弈專項(xiàng)賽冠軍。

“在交戰(zhàn)中，我感覺(jué)到‘戰(zhàn)顱二號(hào)’的戰(zhàn)法很靈活，每一步?jīng)Q策都精準(zhǔn)到位，給人一種難以攻破、難以防守的感覺(jué)?！迸c“戰(zhàn)顱二號(hào)”交鋒的選手說(shuō)。

“‘戰(zhàn)顱二號(hào)’完成了聯(lián)合防空、對(duì)海攻擊以及空中作戰(zhàn)3個(gè)模塊的任務(wù)，通過(guò)模塊間的組織，‘戰(zhàn)顱二號(hào)’能夠面對(duì)不同的敵人選擇不同的打法，做到敵變我變?！瘪T旸赫表示，今年的比賽中，智能體不再是給飛機(jī)、艦船等實(shí)體下達(dá)“動(dòng)作級(jí)”指令，指揮它們具體往哪個(gè)方向行動(dòng)，而是憑借具有自主決策能力的智能化模型，讓實(shí)體完成如巡邏、偵察、開火等“任務(wù)級(jí)”指令。經(jīng)此改進(jìn)，實(shí)體具備了“主觀能動(dòng)性”，能像人一樣根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)機(jī)動(dòng)靈活地執(zhí)行智能體下達(dá)的命令，這不僅提高了輔助決策的效率，也有助于探索更加出其不意的戰(zhàn)法。

對(duì)抗過(guò)程中，憑借戰(zhàn)法模塊間的任務(wù)調(diào)度、力量配置、任務(wù)觸發(fā)，“戰(zhàn)顱二號(hào)”一路高歌猛進(jìn)，任憑對(duì)方智能體使出“繞后偷襲”“強(qiáng)力防守”“猛烈進(jìn)攻”“誘騙導(dǎo)彈”等多種戰(zhàn)法，它都能精準(zhǔn)研判態(tài)勢(shì)，快速形成決策，一一擊敗對(duì)手。

走下賽場(chǎng)，團(tuán)隊(duì)領(lǐng)軍專家劉忠表示，要繼續(xù)將數(shù)據(jù)、知識(shí)和機(jī)理很好地融合，將運(yùn)籌規(guī)劃和知識(shí)推理、強(qiáng)化學(xué)習(xí)等人工智能技術(shù)相結(jié)合，探索智能博弈的新機(jī)理，推動(dòng)智能規(guī)劃技術(shù)的研究落地，打造自主決策能力更強(qiáng)、學(xué)習(xí)能力更快、具有較強(qiáng)場(chǎng)景遷移能力的新一代智能體。（張強(qiáng)）

[ 責(zé)編：武玥彤]

標(biāo)簽：阿爾法戰(zhàn)場(chǎng) 輔助決策

閱讀上一篇 君智成果入列第二十七屆全國(guó)企業(yè)管理現(xiàn)代化創(chuàng)新成果 閱讀下一篇 香山科學(xué)會(huì)議聚焦碳達(dá)峰碳中和多學(xué)科專家學(xué)者跨領(lǐng)域研討

99热免费,女高潮大叫喷水流白浆,精品老肥婆88AV,美女后入视频,日韩h

遠(yuǎn)超阿爾法狗？ “戰(zhàn)顱”成戰(zhàn)場(chǎng)輔助決策“最強(qiáng)大腦”