物流公司作為一種重要的物流服務提供商,承擔著對國內(nèi)外快遞、包裹和信件進行運輸、分揀和投遞的重任。隨著電子商務的興起和物流業(yè)務的增長,H公司正面臨著日益增長的物流需求。而需求預測作為物流領(lǐng)域備受關(guān)注的課題,更是迎來了諸多挑戰(zhàn)。該任務受到全球貿(mào)易量、經(jīng)濟指標和季節(jié)變化等各種因素的動態(tài)影響而變得愈發(fā)復雜。為應對這一挑戰(zhàn),需要創(chuàng)新方法,能夠捕捉貨運需求預測固有的復雜性和非線性[1]。
物流需求預測基于過去的銷售數(shù)據(jù)、運輸數(shù)據(jù)及其他相關(guān)因素,利用數(shù)學和統(tǒng)計方法預測未來一段時間的物流需求量。準確的需求預測可以幫助H公司優(yōu)化資源配置,減少運輸成本,提高客戶滿意度。
物流需求預測的目的是對物流資源進行合理配置,因此在物流系統(tǒng)規(guī)劃中占據(jù)著重要地位。目前的物流需求預測研究許多都集中于單一的預測方法,并取得了豐富的研究成果。然而面對需求預測數(shù)據(jù)機理的復雜性,以及物流需求相關(guān)影響因素的多樣性,若沿用傳統(tǒng)的單一預測方法,將難以保證預測的精準性。
隨著研究的深入,物流需求預測將涉及復雜和動態(tài)的性質(zhì)、物流運作的不確定性,以及不精確的需求因素等問題,組合模型的優(yōu)勢將得以顯現(xiàn)。如黃建華等運用ARIMA和PCR的組合模型將自回歸移動平均法和主成分分析推廣到非線性序列中,提升了模型預測的靈活性;曹志強等通過遺傳算法優(yōu)化支持向量回歸機,采用最優(yōu)參數(shù)構(gòu)造SVR模型,證明GA-SVR與灰色預測方法相比,預測效果更優(yōu);黃敏珍等在灰色模型的基礎上應用馬爾科夫鏈,構(gòu)建灰色-馬爾科夫鏈組合模型,以此確定系統(tǒng)狀態(tài)轉(zhuǎn)移概率矩陣,有效提高了預測精度;Gao等提出了一種集成PROPHET和SVR模型的方法來預測季節(jié)性的制造業(yè)需求,通過預測季節(jié)波動和SVR的輸入變量,提高組合模型的精確性;劉智琦等將k-均值、隨機森林和分位數(shù)回歸森林算法進行結(jié)合,提出了組合機器學習方法[2][3][4][5][6][7][8][9]。
本文根據(jù)物流公司貨運量的特點,綜合考慮貨運量的關(guān)鍵影響因素,建立組合預測算法模型。利用模糊認知圖算法分析物流公司貨運量各影響因素之間的關(guān)系權(quán)值和狀態(tài)量,借助LSTM神經(jīng)網(wǎng)絡算法結(jié)合物流公司歷史貨運量數(shù)據(jù)來預測未來貨運量。
模糊認知圖具有神經(jīng)網(wǎng)絡和模糊集理論的特點,適用于獲取目標概念的因果關(guān)系并對其進行表達。因此,據(jù)此構(gòu)建的神經(jīng)模糊系統(tǒng)可以用于解決決策問題。模糊認知圖作為帶有符號的模糊有向圖,由各概念及各概念之間的關(guān)系組成。而各概念之間的聯(lián)系存儲于概念之間的關(guān)系中。概念用節(jié)點來表示,各概念之間的有向弧反映概念之間的關(guān)系,有向弧上的數(shù)值大小代表概念之間的關(guān)系強弱,而數(shù)值的正負代表了概念之間的影響方向。
圖1的模糊認知圖具有四個節(jié)點:D1,D2,D3,D4,代表了四個概念。節(jié)點之間的關(guān)系由有向弧標志。D1和D4之間的w14和w41代表D1與D4之間有邏輯傳遞。模糊認知圖通過層層迭代,計算各個概念對彼此的影響。模糊認知圖的概念屬于非線性函數(shù),概念節(jié)點采用模糊數(shù)值表示各自的狀態(tài),每個路徑利用激活函數(shù)sigmoid和一個逐點乘法操作來實現(xiàn)過濾作用。sigmoid激活層負責決定哪些信息要更新,數(shù)值將轉(zhuǎn)換成[-1,1]或者[0,1]之間的一個值。這個數(shù)值將作為節(jié)點的輸入值。當概念節(jié)點的狀態(tài)發(fā)生改變時,就會影響到存在因果依賴的節(jié)點。模糊認知圖中的各個概念節(jié)點反復反饋循環(huán),通過非線性的方式傳播,使模型最終達到一個穩(wěn)定的極限,從而得到各個概念節(jié)點之間關(guān)系權(quán)值的解。
模糊認知圖的迭代過程是隨時間進行逐步推理迭代的,每個節(jié)點的狀態(tài)值是由上一個節(jié)點的狀態(tài)值通過因果關(guān)系矩陣得出的。如圖2所示。
在模糊認知圖中,各個節(jié)點t時刻的狀態(tài)值可以表示為X(t)=[X1(t),X2(t),X3(t),...,Xn(t)],同理,在t+1時刻,各個節(jié)點的狀態(tài)值可以表示為X(t+1)=[X1(t+1),X2(t+1),X3(t+1),...,Xn(t+1)][10]。因此,模糊認知圖的迭代機制由如下公式表示。
模糊認知圖用Wij代表概念Xi和Xj之間的權(quán)值,W={W11,W12,W13,...,Wnn}表示各個節(jié)點之間所有權(quán)值的矩陣集合。因此模糊認知圖的權(quán)值矩陣表示如下。
近年來,眾多學者對物流需求預測進行了廣泛的研究,涉及的方法和模型也日益多樣化。其中,一些傳統(tǒng)統(tǒng)計模型如回歸模型、時間序列模型等被廣泛應用于物流需求預測領(lǐng)域。這些方法通過分析歷史數(shù)據(jù)的趨勢和模式來預測未來的物流需求,具有一定的準確性。然而,傳統(tǒng)統(tǒng)計模型存在對數(shù)據(jù)分布和關(guān)系的假設限制,且無法處理非線性、非穩(wěn)定和非平穩(wěn)等問題。為了克服這些問題,近些年來,一些新興技術(shù)和方法被引入物流需求預測中,如邏輯回歸、人工神經(jīng)網(wǎng)絡、隨機森林和梯度增強等方法[11]。
本文選擇將模糊認知圖與LSTM神經(jīng)網(wǎng)絡相結(jié)合作為預測物流需求的方法,旨在提高模型預測的精準性和魯棒性。通過選擇對物流需求影響相關(guān)性較高的方面,形成概念節(jié)點,然后通過模糊認知圖迭代概念節(jié)點,得到各節(jié)點的狀態(tài)值。最后結(jié)合物流公司的歷史貨運量數(shù)據(jù),利用LSTM神經(jīng)網(wǎng)絡進行迭代選擇,得到最終結(jié)果。這種組合模型能夠有效處理高復雜性、高維度的物流需求數(shù)據(jù),并且針對多種影響概念可以做到有效建模。
本文提出的FCG-LSTM模型包含兩層結(jié)構(gòu),首先對影響物流需求的相關(guān)節(jié)點及歷史物流數(shù)據(jù)進行迭代,得到各節(jié)點的狀態(tài)值。其次將得到的結(jié)果和歷史物流數(shù)據(jù)作為LSTM神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)進行預測。最后對預測結(jié)果進行評估分析,得到最終預測結(jié)果。
LSTM,即長短期記憶神經(jīng)網(wǎng)絡算法(Long Short-Term Memory),該算法存在單元狀態(tài)和多種“門”。單元狀態(tài)能夠提供信息傳輸路徑,用于傳遞序列中的相關(guān)信息,即LSTM神經(jīng)網(wǎng)絡的記憶。單元狀態(tài)通過傳輸序列中的相關(guān)信息,實現(xiàn)長短時記憶。sigmoid函數(shù)圖像如圖3所示。
sigmoid函數(shù)由上式表示,能夠幫助“門”對傳輸信息進行更新或遺忘,當“門”的輸出接近0時,表明傳遞的信息接近于遺忘,即丟失;同理,當“門”的輸出接近于1時,則表明傳遞的信息已被記住。LSTM神經(jīng)網(wǎng)絡中存在三種“門”結(jié)構(gòu),即輸入門、遺忘門、輸出門。這些“門”決定著傳遞信息是否被存儲或遺忘。LSTM結(jié)構(gòu)圖如圖4所示。
輸入門具有控制當前時刻的輸入并更新單元狀態(tài)的作用,輸入門將前一時期傳遞的隱藏狀態(tài)和當前的輸入傳輸?shù)絪igmoid函數(shù)中,得到的結(jié)果將決定更新哪些信息。此外,前一個時期傳遞的隱藏狀態(tài)和當前的輸入也會被傳到tanh函數(shù)中,產(chǎn)生新的候選值向量。最后,將兩個函數(shù)的輸出結(jié)果相乘,在相乘的過程中,sigmoid函數(shù)的輸出將決定哪些輸出值中的信息會被保留。
輸入門的計算公式為:
輸入狀態(tài)的計算公式為:
tanh的函數(shù)公式為:
當前的單元狀態(tài)是遺忘門的輸出向量與前一層的單元狀態(tài)點乘,并形成新的記憶。其計算公式為:
當單元狀態(tài)值接近于0時,新的單元狀態(tài)便會遺忘這些信息,同理,當單元狀態(tài)的值越來越接近于1時,傳輸?shù)男畔⒕驮綍恍聠卧獱顟B(tài)記住。此時,新的值與輸入門的值相加則可以得到下一個神經(jīng)元的記憶[12]。
輸出門的主要作用是確定下一個單元的隱藏狀態(tài)。首先將前一個單元的隱藏狀態(tài)和當前的輸入傳輸?shù)絪igmoid函數(shù)中,得到新的單元狀態(tài),隨后將其傳到tanh函數(shù)中。并將兩者的輸出相乘,得到下一單元的隱藏狀態(tài)所包含的數(shù)據(jù)信息,這時形成的隱藏狀態(tài)便是當前單元新的隱藏狀態(tài),新的隱藏狀態(tài)和新的單元狀態(tài)共同傳到下一時期。輸出門的計算公式為:
輸出門輸出的結(jié)果之后再與新的記憶單元點乘計算后得到下一個階段的隱藏狀態(tài):
本節(jié)將詳細介紹研究中使用的模型參數(shù)設置。模型參數(shù)的選擇和調(diào)整對于預測模型的性能和準確性至關(guān)重要。在進行模型參數(shù)設置之前,首先需要了解所使用的模型框架。本研究采用的是基于模糊認知圖和LSTM混合方法的物流需求預測模型。
首先,需要確定LSTM模型的各個參數(shù),包括隱藏層的數(shù)量、每個隱藏層的神經(jīng)元數(shù)量以及學習率等。這些參數(shù)的選擇需要根據(jù)實際問題和數(shù)據(jù)集加以調(diào)整。使用網(wǎng)格搜索方法在一系列可能的參數(shù)值中尋找最優(yōu)組合。具體而言,我們在隱藏層的數(shù)量中嘗試了1到5個隱藏層,并在每個隱藏層中嘗試了50~200個神經(jīng)元。對于學習率,我們嘗試了0.001~0.1[13]。
其次,需要確定模糊認知圖模型的參數(shù)。模糊認知圖模型的參數(shù)包括隸屬度函數(shù)的選擇和模糊推理方法的確定。在本研究中,采用了較為常見的隸屬度函數(shù),如三角隸屬度函數(shù)和高斯隸屬度函數(shù)。對于模糊推理方法,選用模糊推理的經(jīng)典方法,如最大值法和平均值法。
再次,還需要確定模型的其他參數(shù),如訓練輪數(shù)、批次大小等。本研究將訓練輪數(shù)設置為100,且每個批次包含32個樣本。
最后,在確定模型參數(shù)后,使用H公司的物流需求數(shù)據(jù)進行模型訓練和評估。將數(shù)據(jù)集分為訓練集和測試集,其中70%的數(shù)據(jù)用于訓練模型,30%的數(shù)據(jù)用于評估模型的性能。將方根誤差(RMSE)和平均絕對百分比誤差(MAPE)作為評估指標,以衡量模型預測的準確性。
在模型參數(shù)設置方面,還需要對LSTM模型的一些關(guān)鍵參數(shù)進行調(diào)整和優(yōu)化。這些參數(shù)包括隱藏層的大小、時間步的長度、學習率等[14]。
隱藏層的大小是一個重要參數(shù),控制著模型的復雜度和表達能力。隱藏層較小可能會導致欠擬合的問題,隱藏層較大則可能導致過擬合問題。因此,我們需要通過交叉驗證等方法來確定最合適的隱藏層大小。
時間步的長度決定了模型對歷史信息的記憶能力。較短的時間步可能無法捕捉長期的依賴關(guān)系,而較長的時間步則可能導致信息混淆。因此,需要在一定的時間步長度范圍內(nèi)進行嘗試和優(yōu)化,以尋找最合適的時間步長度。
學習率是控制模型在訓練過程中的參數(shù)更新速度。較低的學習率可能會導致訓練過程緩慢,較高的學習率則可能導致訓練不穩(wěn)定。因此需要通過實驗和反復調(diào)整,選擇一個適中的學習率,以保證模型的訓練效果和穩(wěn)定性。
數(shù)據(jù)集描述的主要目的是對所使用的數(shù)據(jù)集進行詳細的介紹和描述。本文將從數(shù)據(jù)來源、數(shù)據(jù)清洗與預處理以及特征選擇與工程化三個方面入手對數(shù)據(jù)集展開描述和分析。H公司物流需求預測研究的數(shù)據(jù)主要來源于湖北省郵政公司的內(nèi)部數(shù)據(jù)和外部相關(guān)數(shù)據(jù),數(shù)據(jù)內(nèi)容如表1所示。內(nèi)部數(shù)據(jù)主要指的是公司本身產(chǎn)生的各類物流數(shù)據(jù),包括快遞運單信息、倉儲信息、配送信息等。外部相關(guān)數(shù)據(jù)則涵蓋了相關(guān)的宏觀經(jīng)濟數(shù)據(jù)、物流市場數(shù)據(jù)以及天氣數(shù)據(jù)等。在對數(shù)據(jù)分析之前,對數(shù)據(jù)進行清洗和預處理必不可少。在數(shù)據(jù)清洗過程中,我們可以處理數(shù)據(jù)集中的缺失值、異常值和重復值。使用合適的統(tǒng)計方法和算法,能使我們更好地補全缺失值,剔除異常值,并削減重復值。此外,對數(shù)據(jù)格式進行轉(zhuǎn)換和歸一化處理也是數(shù)據(jù)清洗的一部分。
在數(shù)據(jù)預處理過程中,通過對數(shù)據(jù)進行分離、劃分和重組等操作,可以使數(shù)據(jù)更適用于后續(xù)的建模和分析。此外,還開展了特征選擇和特征工程的工作,從原始數(shù)據(jù)中提取具有代表性的特征,對其進行處理,以提高模型的準確性和魯棒性。
為了評估本文所提出的基于模糊認知圖和LSTM混合方法的物流需求預測模型的性能,使用以下指標對其進行評估。
均方根誤差(RMSE):用于衡量預測值與真實值之間的差異程度。計算公式如下:
RMSE=sqrt(1/n*∑(y_pred-y_true)^2),其中n表示樣本數(shù)量,y_pred表示預測值,y_true表示真實值。
平均絕對百分比誤差(MAPE):用于衡量相對誤差的大小。計算公式如下:
MAPE=1/n*∑(|(y_pred-y_true)/y_true|*100%),其中n表示樣本數(shù)量,y_pred表示預測值,y_true表示真實值[15]。
針對H公司物流需求預測的問題,本文提出了基于模糊認知圖和LSTM混合方法的模型框架。該框架的主要思想是將模糊認知圖與LSTM相結(jié)合,利用LSTM模型對時間序列數(shù)據(jù)進行建模,同時引入模糊認知圖來處理不確定性和模糊性問題。
具體而言,我們首先構(gòu)建了一個基于LSTM的時間序列預測模型,通過該模型可以捕捉到時間序列數(shù)據(jù)的長期依賴性。然后,引入模糊認知圖對預測結(jié)果進行修正和調(diào)整,以降低數(shù)據(jù)的模糊性和不確定性。
在模糊認知圖的構(gòu)建過程中,我們需要考慮多個影響因素,并將它們表示為模糊集。然后,使用經(jīng)驗法推導出與模糊集相關(guān)的模糊規(guī)則。最后,我們將這些模糊規(guī)則應用于LSTM模型的預測結(jié)果上,得到了修正后的最終預測結(jié)果。
在模型訓練與評估階段,我們首先將H公司的歷史物流需求數(shù)據(jù)作為訓練集,通過反向傳播算法來優(yōu)化模型參數(shù)。然后,我們使用一部分未知的數(shù)據(jù)作為測試集,通過計算預測結(jié)果與實際結(jié)果之間的誤差來評估模型的性能。
在訓練過程中,我們采用批量梯度下降法來更新模型的參數(shù),并使用適當?shù)膿p失函數(shù)來度量模型預測結(jié)果與實際結(jié)果的差異。通過迭代訓練和優(yōu)化,可以逐漸提高模型預測的準確性。
在評估過程中,我們計算了模型的均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)。這些指標可以有效評估模型對未知數(shù)據(jù)的預測能力和穩(wěn)定性。此外,還需要進行對比實驗,將我們的模型與其他常用物流需求預測方法進行比較。
在實驗中,我們將模型應用于H公司的物流需求預測任務,并評估其性能。表2顯示了本文所提出的模型在不同時段的預測結(jié)果及其性能評估指標(RMSE和MAPE)。
雖然本研究基于模糊認知圖和LSTM混合方法進行了H公司的物流需求預測,但仍存在一定的局限性。首先,預測研究的數(shù)據(jù)來源主要依賴于H公司的內(nèi)部數(shù)據(jù),雖然該數(shù)據(jù)具有一定的代表性,但可能無法完全覆蓋相關(guān)物流市場的整體情況。因此,研究結(jié)果可能會受到數(shù)據(jù)局限性的影響。其次,本研究所使用的模型框架設計和參數(shù)設置是基于當前的研究背景和數(shù)據(jù)條件進行的,還存在一定的改進空間。例如,可以嘗試使用其他深度學習算法或結(jié)合其他技術(shù)方法來提高物流需求預測的準確性和穩(wěn)定性。最后,本研究在特征選擇和工程化方面仍存在一些不足之處。雖然開展了一定的特征選擇和處理工作,但在特征的選取和處理方法上還存在一定的局限性。未來的研究需要進一步探索更有效的特征選擇和處理方法,以增強模型的預測性能。