2008年10月19日 星期日

自己學SAS Learning SAS by self (二) Data!Data!Data!


沒有DATA來談SAS是沒有意義的。 SAS作為處理資料的軟體,目的就是要分析資料,從中找出有意義的關係。

資料是原料、材料,透過SAS和使用者的想法,才能煮成一盤好菜。沒有原料要來學SAS其實沒有什麼太大用途。SAS的用途很多,但是不同的材料有不同的應用方法。就像大同電鍋可以煎煮炒炸,但是也要看你今天有什麼材料,想吃什麼菜才能決定用法。我們在學習使用電鍋的時候,也要先準備好材料,才有辦法使用電鍋來料理。才能看出自己的手法好不好?能不能煮成一盤好菜?

那DATA怎麼來呢?

小則個人支出帳簿、或是班上同學的成績;大到人口普查、社會變遷調查;甚至跨國、國際性的經濟數據資料,都可以當作DATA。端看您的用途來去找相應的資料。有時候找得到,有時後找不到,有的如探囊取物,有得難如登天。

因為資料的形式很多,有點難做一個統合的描述。但是因為要用SAS來處理資料,所以原始資料一定都要用數字表示。大致上來說,一份完整的資料要包括三個東西:

1. 問卷--是讓人填答問題,或者可以延伸為資料的實質意涵。
2. CodeBook--連結問卷和DATA。
3. Data--以數字為主要形式。

1. 問卷,廣義的來說就是問題。任何數字都不是憑空出現,一定會對應於一種特定的問題。
例如:帳簿上的40,他背後的問題可能是我今天吃飯花多少錢?
成績單上的65,背後的問題就是這個學生其中考考多少分

2. CodeBook,有時後數字可能代表比較複雜的東西,很難從數字來解釋,這時候就需要codebook來記錄每個數字代表的意思。
例如:你家住哪裡? 因為sas只能分析數字,我們必須設定台灣各縣市的代號,然後才能輸入sas或成為一筆data。

3. data,用以紀錄問卷結果,以及成為sas資料分析的來源。

在解讀資料的時候,就是來回查詢問題、codebook、以及data,連結三者之間的關係,才能了解data的涵義、以及這個問題在整體中的分配狀況。

沒有留言:

張貼留言