拔尖研究

Less is More 讓數據盡情發揮

期刊編號:Fall 2016作者:郭 炳伸

你的模型總是無法保持資料預測的準確度嗎?

郭炳伸教授在2016年的論文中,提出了一個預測趨勢的新方式,這不是試圖尋找出一個全新的預測模式,而是提出一個嶄新的概念:如果單一樣板的模型總是在某些時間區段中適用,何不試試將模型組合成一個綜合性的模式?

現今在數據的趨勢預測中,有相當多元、各有所長的預測方法出現,然而,採用不同的預測基準,總是讓人們在預測上會遇到時準時不準的尷尬處境。這時候,當我們能將不同的基準,以各自對應且合適的權重處理,再合併成為一個模型時,就可以將預測目標物中所有的變數納入考量。而透過這樣子的組合,便能夠將辛苦蒐集到的數據,發揮最大的效果,不用總是在尋找不同情況之下,所適合的預測工具。

在這個概念之下,是想要去找到那些在某段時間表現特別好的模型,而後有效地去組合它。當進行預測時,分別使用A模型、B模型、C模型都能得到對的結果,但卻又好像三者都不對。此時,倘若切割了時間來看的話,A模型可能在a年表現比較好、B模型是b年、C模型在c年比較好,這種結果的判斷都是在事後才能夠進行準確度的檢驗,而且可以很清楚的知道何對何錯,但是在進行預測的當下,能否以過去預測的經驗來評估未來的預測可能性?

於是,在這個研究方法的概念出現後,便能夠試著以過去模型的預測表現,來計算、設定變數的權重,進而推導出最適合特定項目的專屬模型。

 

善用數據,就從現在開始

假說的形成、數據的蒐集,都需曠日廢時的努力,如果此時在你的手上,已經有了許多的假說和變數,那麼就更不應該因預測的不穩定性而去放棄。許多的假說,都是近似真實世界,誤差的存在是理所當然的,那麼,在這種時候,我們該努力的方向,便是該如何去縮小誤差,讓所擁有的數據資料都能夠被善用。

因此,當使用郭教授提出的新研究概念,去組合這些數據和模型時,其實就是試圖讓這些既有的資訊,能夠更有效率地被使用,同時也讓預測更加準確。如果仰賴單一的模型,或時常更換模型,這不僅會影響預測的準確度,更會讓資訊沒辦法完全發揮它應有的價值。

或許,經由組合過的模型,依舊會隨著時間推移,降低準確性,但正因為是一個組合性的模型,所以其中的權重是可以隨著環境不同、時間遞移,跟著進行調整,在世界變得不同時,就用權重去設定變數的不同比例。

但這,並非是告訴大家需要極力去尋找一個完美無缺陷的模型,而是希望不管在股票、匯率等極度需要趨勢分析的產業與政策中,能夠把各種不同的情報資訊加入預測過程當中,不再過度仰賴單一模型。

 

 

研究方法

本論文研究方法雖以量化作為基礎,但其實本身便是研究方法之研究。現今研究方法多元,有許多模型可供研究者進行應用,而在此作者試圖合併各模型,讓數據資料不因模型而有失效的可能。更多內榮請參考:Liu, Chu-An and Biing-Shen Kuo (2016) “Model Averaging in Predictive Regressions”, Econometrics Journal, 2, 203-231.

圖片來源:https://goo.gl/AMnF2Q

編輯者:林佳慧


 

 

如欲暢所欲言,請先申請加入會員。(僅開放有政大信箱的政大校友申請會員資格) 會員註冊