我想做個農戶固定資產投資決策的影響因素分析,手頭上有收集到的過去五年中農戶固定資產投資的金額數據(農戶并不是每年都有投資,但過去五年中有投資發生),還有今年農戶家庭的其他信息,如農戶家庭收入,家庭土地規模、資金借貸規模、家庭勞動力人數等。我的問題是假如我把五年里固定資產投資額度加總起來做被解釋變量,今年的農戶家庭收入,家庭土地規模、資金借貸規模、家庭勞動力人數等作為解釋變量,這樣做回歸行得通嗎?我個人覺得以某個年份的自變量值對加總起來的因變量值做回歸不曾見過,但是我問過身邊的一些朋友,他們說這樣做是可以的,而且我自己跑了stata回歸結果像農戶家庭收入,家庭土地規模等的回歸系數都非常的顯著。
雖然實現上沒有問題,但是我覺得是不合適的。因變量 y 為過去五年中農戶固定資產投資的金額數據,而自變量 x 是今年的數據。如果建立這樣的模型,你想得到什么結果?這樣研究得到的是將來的信息影響過去。就比如問:現在好好復習能不能讓五年前考試得高分一樣,邏輯很怪。如果你說可行,最好是能提供比較好的參考文獻。