區域航空客流量預測研究
時間:2022-12-21 11:21:57
導語:區域航空客流量預測研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要:鑒于在航空運輸領域中應用經濟計量模型預測航空客流量存在一定的局限性,為此本文運用粗糙集理論分析區域航空客流量。在選擇影響區域航空客流量因素的基礎上,形成了我國31個地區航空客流量的決策表,進而對決策表運用粗糙集的有關方法得出了我國31個地區的航空客流量生成規則,最后采用這些規則對區域航空客流量進行預測,取得比較好的預測結果。
關鍵詞:粗糙集;航空客流量;連續值離散化;屬性
為了識別航空客流量與其決定因素之間的關系并對前者進行預測,目前最常見的方法是建立經濟計量模型。這些傳統模型建立在各種統計假設的基礎上,因此當變量之間相互依存、變量的概率分布未知時,那么這些模型就無法得出比較準確的結果。為此本文試圖探討一種基于粗糙集理論的航空客流量預測模型。作為計算智能方法之一的粗糙集理論(Roughsetstheo-ry,簡稱RS)是波蘭數學家ZdzislawPawlak于1982年首次提出的。粗集理論誕生的30多年來,已成功地在許多領域中得到應用,然而在航空運輸領域中還沒有見到關于粗集理論的應用文獻。因此,本文在這方面作一個嘗試,并通過實例闡明粗集理論在航空客流量方面的應用是適合的。
1.基于粗糙集理論的方法
粗糙集理論中的知識表達方式一般采用信息表或稱為信息系統的形式,信息系統可用四元有序組K=(U,A,V,ρ),在該式中,U是一個非空有限的對象集合,U={X}1,X2⋯Xn稱為論域;A是一個非空有限的屬性集合,A={a}1,a2⋯an;V=∪a∈AVa是屬性A所構成的值域集合,Va是屬性a的值域;U中任一元素取屬性a在V中有唯一確定值。ρ:U×A→V被稱為信息函數,ρ:A→V,x∈U,反映了對象x在K中的完全信息,其中ρ(a)=ρ(x,a)。如果A=C∪D且C∩D=ф則信息系統又可稱為決策表,其中C為條件屬性集,D為決策屬性集,常記為(U,C∪D,V,ρ)。在決策表中,不同的條件屬性具有不同的重要程度,一些屬性提供了豐富的信息,對產生決策起到至關重要的作用,而其他一些屬性卻似乎是可有可無的。因此,在保證決策表具有正確分類能力的同時,對條件屬性進行簡約,去掉不必要的屬性。為了度量屬性集合的不確定程度,引入精度和覆蓋度兩個概念,且定義為:dR(X)i=card()-aprXi/card()---aprXi(1)dR(F)=∑card()-aprXi∑card()---aprXi(2)d'R(X)i=card()---aprXi/card(U)i(3)d'R(F)=∑card()---aprXi/card(U)(4)式(1)和(2)分別為屬性集合Xi的分類精度和覆蓋度,式(3)和(4)分別為所有屬性集合的總分類精度和總分類覆蓋度。
2.粗糙集在區域航空客流量中的應用
2.1航空客流量影響因素分析。分析我國航空運輸業特點,并結合相關已有的研究,本文采用六個影響因素來預測各地區航空客流量:人均GDP、人口、第一產業就業人員的比重、城市人口、國際旅游人數、與航空樞紐的距離等。這六個因素就是六個條件屬性,而決策屬性就是各地區的航空客流量,研究對象則是我國大陸的31個省、直轄市、自治區。每個對象由一個多值屬性(即條件屬性和決策屬性)的集合來描述,從而形成一個二維表格,即決策表,表格的“行”與對象相對應,表格的“列”對應于對象的屬性,表中為具體的屬性值。條件屬性中的“人均GDP”“人口數”和“第一產業人員比重”均為傳統需求模型中所常用的經濟變量。“城市人口數”的選取主要是考慮城市規模對航空客流量的影響。“國際旅游人數”的選取主要是考慮該屬性能間接反映某地區旅游資源的多少,它能解釋對于當地經濟并不發達的地區(如云南)卻有較多的航空客流量。關于“與航空樞紐的距離”這個屬性,從我國航空運輸格局來看,北京、上海和廣州是三大航空樞紐,因此這三個地區的該屬性值為“0”;天津離北京很近,而北京又處于河北的中心,所以天津和河北的該屬性值均為“1”,表示“特近”的含義;另外,由于江蘇的常州、無錫、蘇州、昆山等經濟重心緊靠著上海,所以其“與航空樞紐的距離”屬性為“2”,表示“近”的含義;其余地區類推,數字越大的地區表示該地區與航空樞紐的距離越遠。在決策時,把決策屬性“地區航空客流量”分成若干等級,運用粗糙集理論得出每個“地區航空客流量”等級所對應的生成規則。2.2數據離散化。在應用粗糙集理論對實際數據進行分析和獲取知識時,一般要求由實際數據構成的決策表中各個屬性值必須用離散值表達。如果某些條件屬性或決策屬性的值域為連續的,則在處理前必須經過離散化。所以對于下表1中的連續型數據需再進一步離散化成分類數據值以適用于粗糙集的方法。對粗糙集連續屬性離散化的方法一般是采用其他領域已有的離散化方法,本文采用熵方法對連續型數據進行離散化。設P⊆A,U/P={C}1,C2,⋯Ct,則U中對象x屬于等價類Ci的概率為pi=||Ci/||U,I=1,2,…,t,于是定義P對U的劃分得到的熵為:2.3決策規則。本文使用2012年至2015年四年共124個對象(共868個觀測值),使用其中60%的對象作為訓練規則用,去發現決策規則,其余的40%的對象(即50個)作為預測用,以驗證規則的有效性。在使用粗糙集方法后得出了表2中的航空客流量決策規則的主要部分。第一條規則的含義是:如果某地區人均GDP小于7198元且人口數小于2642萬人且第一產業就業人員比重大于等于50.5%且國際旅游人數小于44.5萬人,那么該地區航空客流量就小于200萬人次,其余的規則含義類推。該規則把航空客流量影響因素的定性和定量兩方面很好結合在一起,另外,同樣的航空客流量可以由多條規則產生,這符合實際情況。從規則中各屬性出現的頻次可得出各屬性的重要程度,從多到少依次是“第一產業就業人員比重”“人均GDP”“人口數”“國際旅游人數”和“與航空樞紐的距離”,而“200萬人口以上城市數”被約簡,從未出現過。運用上述公式,對用于測試的50個地區進行擬合,得出表3中的預測結果。在被測試地區總數中,等級4的上近似集合中地區實際個數是12個,被正確預測的為10個,預測精度為83%;等級3的上近似集合中地區實際個數是19個,被正確預測的為17個,預測精度為90%;等級2的上近似集合中地區實際個數是10個,被正確預測的為8個,預測精度為80%;等級1的上近似集合中地區實際個數是8個,被正確預測的為8個,預測精度為100%;全部等級的總體精度為88%。另外,等級3中有一個地區的覆蓋度為95%,從而使總體覆蓋度為98%,因此粗糙集理論應用在航空客流量預測中是可行的。
本文論述應用粗糙集理論及其模型對我我國區域航空客流量進行預測,得出了一些預測規則,其預測精度較高。與許多傳統模型需要建立各種統計假設基礎不同,該方法僅需對屬性值進行分類。區別于復雜的數學公式,該方法的分析的結果以規則形式進行描述,直觀并容易理解。此外粗糙集能夠使用定性數據,無須轉換成數值,因此可以有效地防止信息失真。當然,針對不同時間段的航空客流量數據進行動態規則的形成是有待進一步解決的問題。
參考文獻:
[1]張文修,吳偉志,梁吉業等.粗糙集理論與方法[M].北京:科學出版社,2001.
[2]張永莉,張曉全.我國城市間航空客運量影響因素的實證分析[J].經濟地理,2007,4:20-24.
[3]中國民用航空局發展計劃司.從統計看民航[M].北京:中國民航出版社,2012-2015.
[4]中華人民共和國統計局編.中國統計年鑒[M].北京:中國統計出版社,2012-2016.
作者:劉曉明 單位:南京工業職業技術學院
- 上一篇:航空微型彈藥接口技術分析
- 下一篇:淺議初中地理教學