2008年10月17日 星期五

台灣家庭收支暨所得分配訪問(二) 分析策略

分析資料也是講求策略的。考量的原因無他,就看這筆資料的結構以及問題為何。資料結構在上一篇文章提過,這裡就不加贅述。那我要處理的問題為:挑出特定變數。這些變數包括了:
1.挑出家戶長配偶
2.挑出該家戶的收入支出變項
3.計算各家庭人口數,以及老人數目

在思考這個問題的時候,要注意

1. 資料結構為家戶資料,假使照著主計處提供的SAS檔案,我們得到的是一筆一筆的家戶資料。家裡不同人口特質的變項,問卷提供近五十組的位置可以填寫,所以也不確定家戶長和其配偶在哪個變項。

2. 同時由於這筆資料在收入支出的部份是分為400組變項,每組變項都包括(收入支出代號)和(收入支出金額)這兩部份,所以我們也不確定每筆資料的收入支出會在同一個位置。

3. 沒有變項說家裡有幾個人。

當然,案主給我問題的時候,並不會特別幫我將問題依照期性質分類。是因為這三個問題在其資料結構上有其實質上的差異,所以我才會分為這三個問題。

1. 第一個問題主要是要整理家戶長及其配偶的人口資料,本質上是以人為單位的資料。

2. 收入和支出都是以家庭為單位。

3. 家裡人口數基本上可以用家庭為單位計算,或是轉換成個人資料來計算。

所以我的策略就是:

1. 加以家戶為單位的資料轉換為以個人為資料。

2. 以個人資料來處理家戶長和配偶的人口資料,同時來計算家裡人口。

3. 用家戶資料來找家庭的收入和支出。

由於案主要的是家戶資料,所以最後在將個人資料轉換成家戶資料,再將三者合併整理就好。

沒有留言:

張貼留言