在城市建設(shè)與發(fā)展中,地理空間優(yōu)化至關(guān)重要。從工業(yè)園區(qū)選址,到公共服務(wù)設(shè)施布局,它都發(fā)揮著關(guān)鍵作用。但傳統(tǒng)求解方法存在諸多局限,如今,深度學(xué)習(xí)技術(shù)為其帶來(lái)了新的轉(zhuǎn)機(jī)。
近日,在中國(guó)地理學(xué)會(huì)地理模型與地理信息分析專業(yè)委員會(huì) 2025 年學(xué)術(shù)年會(huì)上,來(lái)自中國(guó)科學(xué)院空天信息創(chuàng)新研究院的梁浩健博士在「地理空間優(yōu)化」這一專題下,以「基于分層深度強(qiáng)化學(xué)習(xí)的城市應(yīng)急消防設(shè)施配置優(yōu)化方法研究」為題進(jìn)行了成果匯報(bào)演講,并從地理空間優(yōu)化問題概述、面向地理空間優(yōu)化問題的深度學(xué)習(xí)方法研究 、基于分層深度強(qiáng)化學(xué)習(xí)的新探索以及未來(lái)展望 4 個(gè)方面展開了詳細(xì)介紹。
梁浩健老師演講現(xiàn)場(chǎng)
HyperAI 超神經(jīng)在不違原意的前提下,對(duì)梁浩健老師的深度分享進(jìn)行了整理匯總,以下為演講實(shí)錄。
地理空間優(yōu)化:數(shù)學(xué)與地理的深度融合
地理空間優(yōu)化是數(shù)學(xué)組合優(yōu)化與地理信息科學(xué)的結(jié)合,致力于解決空間布局、資源配置等實(shí)際問題 ,在城市建設(shè)、工業(yè)園區(qū)選址、公共服務(wù)設(shè)施選址等眾多領(lǐng)域都具有重要的研究意義。它可以被表示為一個(gè)最優(yōu)化問題,涉及決策變量、約束條件和目標(biāo)函數(shù),其中決策變量通常為整數(shù)或 0 – 1 變量。如下圖所示。
其中 ?? 為決策變量,??(x) 是不等式約束條件,??(??) 是等式約束條件,?? ?? 是目標(biāo)函數(shù)
約束(1)表示決策變量 ?? 的范圍,通常為整數(shù)或 0-1 變量。
以經(jīng)典的 p-中值問題為例,其旨在從候選設(shè)施點(diǎn)中挑選 p 個(gè)部署設(shè)施,讓所有需求點(diǎn)到最近設(shè)施點(diǎn)的總距離最小,常用于公共設(shè)施選址。傳統(tǒng)求解空間優(yōu)化問題的方法有 3 類,包括精確算法、近似算法和啟發(fā)式算法,不過它們都有各自的短板。
* 精確算法能夠獲得全局最優(yōu)解,但通常計(jì)算復(fù)雜度較高,求解時(shí)間隨問題規(guī)模呈指數(shù)級(jí)增長(zhǎng),例如分支定界法、動(dòng)態(tài)規(guī)劃等。
* 近似算法在保證一定理論性能的前提下提高求解效率,但其算法設(shè)計(jì)較為復(fù)雜,例如貪心策略、線性規(guī)劃舍入等方法。
* 啟發(fā)式算法能在較短時(shí)間內(nèi)獲得較優(yōu)解,適用于大規(guī)模復(fù)雜問題,但缺乏理論最優(yōu)性保證,常見方法包括模擬退火、禁忌搜索等。
深度學(xué)習(xí)進(jìn)軍地理空間優(yōu)化領(lǐng)域
在計(jì)算機(jī)視覺和自然語(yǔ)言處理等領(lǐng)域,利用深度模型來(lái)代替手工算法的設(shè)計(jì)取得了矚目的成果。那么,能否用它來(lái)求解空間優(yōu)化問題呢?基于這一思路,研究人員為此展開了對(duì)空間優(yōu)化(Neural Spatial Optimization)的探索,其動(dòng)機(jī)包括 3 個(gè)方面:
* 學(xué)習(xí)更快/更好的啟發(fā)式方法,利用數(shù)據(jù)驅(qū)動(dòng)實(shí)現(xiàn)快速近似代替復(fù)雜計(jì)算
* 自動(dòng)設(shè)計(jì)新啟發(fā)式算法的通用框架
* 通過歷史信息訓(xùn)練 DRL 模型來(lái)指導(dǎo)未來(lái)規(guī)劃
由此,我對(duì) NeurSPO 預(yù)設(shè)了 2 大構(gòu)想:
一是深度構(gòu)造。簡(jiǎn)單而言就是初始時(shí)為空解,而后每次選擇一個(gè)點(diǎn),直至選出目標(biāo) p 個(gè)點(diǎn),完成分步構(gòu)造解。
二是深度提升。它的本質(zhì)類似局部搜索等算法,是一個(gè)改進(jìn)解的方法,可以利用深度學(xué)習(xí)去替換解。例如在局部搜索中,選擇合適的點(diǎn)進(jìn)行交換或者優(yōu)化等。
SpoNet 模型:動(dòng)態(tài)覆蓋注意力破解選址難題
如何在探索 DRL 的方法中解決 p-Median 、 p-Center 、 MCLP 為主的目標(biāo)問題?我們首先做出了動(dòng)態(tài)覆蓋信息 + 注意力模型的嘗試,提出了一種統(tǒng)一的框架求解選址問題——SpoNet 。其構(gòu)造主要由 3 部分組成:
*在深度學(xué)習(xí)模型下,智能體與環(huán)境不斷交互,通過大量試錯(cuò)和學(xué)習(xí)策略實(shí)現(xiàn)回報(bào)最大,不需要生成標(biāo)簽信息。
* 注意力模型使模型在解碼時(shí)學(xué)會(huì)將注意力集中在輸入序列的特定部分,而不是僅僅依賴于解碼器(decoder)的輸入。
* 在節(jié)點(diǎn)覆蓋過程中,若某一節(jié)點(diǎn)已經(jīng)被覆蓋了,在該點(diǎn)選擇部署設(shè)施,可能導(dǎo)致覆蓋效率降低。在動(dòng)態(tài)覆蓋注意力模型下,對(duì)城市的靜態(tài)位置坐標(biāo)和城市之間的動(dòng)態(tài)覆蓋狀態(tài)進(jìn)行編碼,利用知識(shí)驅(qū)動(dòng),通過引入問題特有的覆蓋信息進(jìn)行編碼,提升模型對(duì)空間覆蓋關(guān)系的理解能力,從而加速求解過程。如下圖所示:
基于動(dòng)態(tài)覆蓋注意力模型求解最大覆蓋選址問題基本流程
動(dòng)態(tài)覆蓋注意力模型
在探索北京市朝陽(yáng)區(qū)應(yīng)急設(shè)施的布局優(yōu)化問題上,我們應(yīng)用了這一模型,選用了 132 個(gè)緊急設(shè)施的數(shù)據(jù)集,假設(shè)每個(gè)設(shè)施點(diǎn)的最大服務(wù)距離為 2 千米,最終在 132 個(gè)候選應(yīng)急設(shè)施中選擇了 20 個(gè)點(diǎn)作為中心樞紐點(diǎn),使得覆蓋的節(jié)點(diǎn)數(shù)量最多。
AIAM:自適應(yīng)交互注意力模型求解 p-中值問題
在當(dāng)前解的鄰域內(nèi)進(jìn)行搜索,嘗試找到更優(yōu)解的局部搜索算法模式已經(jīng)相對(duì)成熟,我們?cè)诖嘶A(chǔ)上探索了深度提升輔助搜索,即基于鄰域搜索的思想,利用 DRL 搜索策略,實(shí)現(xiàn)快速近似代替復(fù)雜計(jì)算的搜索過程。
在路徑規(guī)劃問題中不同節(jié)點(diǎn)之間存在不同的次序關(guān)系,然而 ??-中值問題中的解是設(shè)施集合的一個(gè)子集,導(dǎo)致用戶節(jié)點(diǎn)和設(shè)施點(diǎn)之間存在不同的分配關(guān)系。為衡量這一分配關(guān)系,我們?cè)O(shè)置了「用戶」和「設(shè)施」的交互,并且提出了自適應(yīng)交互注意力模型。
該模型包括交互注意力編碼器、節(jié)點(diǎn)移除解碼器、節(jié)點(diǎn)插入解碼器 3 部分,如下圖所示:
自適應(yīng)交互注意力模型
經(jīng)驗(yàn)證,該模型能夠在 2,162 個(gè)居民點(diǎn)(需求點(diǎn))和 80 個(gè)醫(yī)院(候選設(shè)施點(diǎn))中保留 15 個(gè)醫(yī)院,以最小化居民點(diǎn)到醫(yī)院的總距離,證實(shí)了 AIAM 模型在實(shí)際場(chǎng)景下的可行性。
分層 DRL 解決城市應(yīng)急消防設(shè)施配置難題
當(dāng)前,城市發(fā)展迅速,突發(fā)事件的頻率和復(fù)雜性持續(xù)攀升,城市應(yīng)急消防設(shè)施配置效率和功能性難以兼顧等問題加劇。傳統(tǒng)火災(zāi)預(yù)測(cè)方法難以處理大范圍、高精度數(shù)據(jù),導(dǎo)致風(fēng)險(xiǎn)評(píng)估精度低、響應(yīng)滯后,且消防設(shè)施布局無(wú)法實(shí)時(shí)反映城市變化和應(yīng)急需求。在此背景下,亟需引入智能化、動(dòng)態(tài)化的火災(zāi)風(fēng)險(xiǎn)預(yù)測(cè)與應(yīng)急消防設(shè)施,全面提升城市火災(zāi)防控與應(yīng)急響應(yīng)的科學(xué)性和效率。
基于此,我們將深度學(xué)習(xí)的框架理論研究轉(zhuǎn)向了對(duì)現(xiàn)實(shí)生活的應(yīng)用。為提升城市火災(zāi)防控與應(yīng)急響應(yīng)能力,研究聚焦于提高火災(zāi)風(fēng)險(xiǎn)預(yù)測(cè)精準(zhǔn)性、優(yōu)化應(yīng)急資源配置、增強(qiáng)應(yīng)急響應(yīng)及時(shí)性和靈活性。具體通過以下 3 個(gè)方面實(shí)現(xiàn)。
首先是面向城市火災(zāi)風(fēng)險(xiǎn)預(yù)測(cè)的多維時(shí)空特征挖掘與融合。
面向城市火災(zāi)風(fēng)險(xiǎn)預(yù)測(cè)的時(shí)空神經(jīng)網(wǎng)絡(luò)主要由時(shí)空特征提取模塊和融合輸出模塊組成。
* 時(shí)空特征提取模塊在前向傳播中自動(dòng)捕捉城市空間結(jié)構(gòu)、消防設(shè)施分布及火災(zāi)統(tǒng)計(jì)和氣象數(shù)據(jù)的動(dòng)態(tài)變化;
* 融合輸出模塊則通過注意力機(jī)制整合時(shí)空特征,最終輸出火災(zāi)風(fēng)險(xiǎn)預(yù)測(cè)值。如下圖所示。
時(shí)空神經(jīng)網(wǎng)絡(luò)構(gòu)成
其次是考慮不確定性和災(zāi)害損失的應(yīng)急消防設(shè)施配置優(yōu)化模型構(gòu)建。
在多重覆蓋選址中,引入火災(zāi)頻率、交通狀況和需求分布等不確定性因素,并將災(zāi)害損失納入目標(biāo)函數(shù),以提升布局方案的穩(wěn)健性。通過概率分布或區(qū)間估計(jì)描述火災(zāi)發(fā)生、交通通行與需求波動(dòng)的變化。在建模中,火災(zāi)風(fēng)險(xiǎn)結(jié)合歷史數(shù)據(jù)與地理?xiàng)l件構(gòu)建概率模型,交通響應(yīng)則基于通行能力與仿真分析形成時(shí)間分布,需求變化則通過設(shè)定波動(dòng)范圍或場(chǎng)景集應(yīng)對(duì)城市動(dòng)態(tài)發(fā)展。
第三是面向應(yīng)急消防設(shè)施布局優(yōu)化的分層 DRL 方法。
該算法采用分層策略,統(tǒng)籌消防設(shè)施的整體布局與局部調(diào)整,模型狀態(tài)包含設(shè)施分布、火災(zāi)風(fēng)險(xiǎn)和交通狀況,動(dòng)作為各時(shí)刻的建站或調(diào)度決策。
未來(lái)展望:拓展邊界,持續(xù)創(chuàng)新
科研的道路總是不斷進(jìn)步的,未來(lái)我們團(tuán)隊(duì)計(jì)劃通過跨學(xué)科合作,結(jié)合地理信息系統(tǒng)、數(shù)學(xué)優(yōu)化方法和深度學(xué)習(xí)技術(shù),深入探索更復(fù)雜、實(shí)際的地理空間優(yōu)化問題。
對(duì)此,我從以下 3 個(gè)方面做出了思考和展望:
* 引入地理計(jì)算機(jī)制,增強(qiáng)空間感知能力。
AI 賦予地理空間優(yōu)化的能力還在持續(xù)探索,僅憑當(dāng)前的研究是遠(yuǎn)遠(yuǎn)不夠的,在未來(lái),融合地形、網(wǎng)絡(luò)通達(dá)性、連通性等空間機(jī)制建模有助于提高模型對(duì)地理結(jié)構(gòu)的解釋能力與實(shí)際適應(yīng)性。
* 擴(kuò)展至大規(guī)模與跨區(qū)域應(yīng)急響應(yīng)問題。
當(dāng)前我們的研究?jī)H停留在了對(duì)于小問題的探索,所以,未來(lái)勢(shì)必會(huì)逐漸延展到大規(guī)模應(yīng)急響應(yīng)問題的探索,不斷改進(jìn)使它能夠支持城市群、省域級(jí)多中心聯(lián)動(dòng)優(yōu)化,以此提升方法的可擴(kuò)展性、穩(wěn)定性與計(jì)算效率。
* 設(shè)計(jì)更高效的 DRL 算法框架。
未來(lái)可以繼續(xù)探索優(yōu)化高/低層策略協(xié)同機(jī)制與訓(xùn)練流程,引入多智能體協(xié)同、異步訓(xùn)練、因果機(jī)制等技術(shù),實(shí)現(xiàn)更有效的實(shí)際問題求解。
綜上所述,中國(guó)科學(xué)院空天信息創(chuàng)新研究院梁浩健博士團(tuán)隊(duì)提出的分層 DRL 方法,作為地理空間優(yōu)化領(lǐng)域的 AI 革新方案,通過融合動(dòng)態(tài)覆蓋注意力模型、自適應(yīng)交互注意力模型及多維時(shí)空特征融合技術(shù),不僅破解了傳統(tǒng)消防設(shè)施布局中風(fēng)險(xiǎn)評(píng)估滯后、資源配置低效的難題,更通過分層策略實(shí)現(xiàn)了應(yīng)急設(shè)施布局的全局統(tǒng)籌與局部?jī)?yōu)化。
未來(lái),隨著地理計(jì)算機(jī)制的引入與跨區(qū)域應(yīng)急響應(yīng)模型的拓展,這一方法有望在大規(guī)模城市治理、多中心聯(lián)動(dòng)優(yōu)化等領(lǐng)域釋放更大潛力,推動(dòng)地理空間優(yōu)化與應(yīng)急管理的深度融合創(chuàng)新。相信在不斷地探索與創(chuàng)新中,地理空間優(yōu)化領(lǐng)域?qū)⑷〉酶嗤黄?,為城市發(fā)展和應(yīng)急管理提供更有力的支持。
關(guān)于中國(guó)科學(xué)院空天信息創(chuàng)新研究院
梁浩健博士是中國(guó)科學(xué)院空天信息創(chuàng)新研究院特別研究助理。研究方向主要為地理空間優(yōu)化、深度強(qiáng)化學(xué)習(xí)、遙感大數(shù)據(jù)分析和數(shù)字地球綜合應(yīng)用等。
梁浩健老師
他所在的團(tuán)隊(duì)由王少華研究員帶頭,以「推動(dòng)地理空間科學(xué)與人工智能的交叉應(yīng)用,為實(shí)現(xiàn)智慧城市和可持續(xù)發(fā)展目標(biāo)提供創(chuàng)新解決方案」為愿景,致力于利用先進(jìn)的計(jì)算方法和人工智能技術(shù)來(lái)分析和處理時(shí)空大數(shù)據(jù),以實(shí)現(xiàn)空間環(huán)境的智能化決策和優(yōu)化。近年來(lái),團(tuán)隊(duì)利用時(shí)空大數(shù)據(jù)分析、深度學(xué)習(xí)和機(jī)器學(xué)習(xí)等技術(shù),開展了地理空間優(yōu)化、遙感 AI 等多項(xiàng)研究。
王少華老師及其團(tuán)隊(duì)