Definisi Data Panel
Dalam statistik dan ekonometrik, terminologi data panel digunakan untuk menggambarkan data yang memiliki dimensi yang banyak dan dalam bentuk runtun waktu (time series). data panel adalah gabungan data cross section atau data yang disusun berdasarkan objek penelitian seperti responden, perusahaan, kota yang dikombinasikan dengan runtun waktu (bulan, triwulan, semester, atau tahun). Mengapa kita perlu mempanelkan data? Dalam bidang ekonomi dan bisnis terutama, objek penelitian tentu tidak terlepas dari rangkaian waktu yang panjang. Penelitian akan lebih komprehensif jika meneliti perusahaan, kabupaten, responden, atau objek apapun, jika dirangkaikan dengan runtun waktunya. Sehingga dapat terlihat pengaruh waktu terhadap data yang kita teliti.
Dalam analisis data panel, kita akan menjumpai dua kondisi yaitu ketika datanya lengkap, artinya setiap objek dalam penelitian lengkap untuk setiap tahunnya, kondisi demikian disebut balanced panel (lihat gambar 1). Pada gambar 1 terlihat bahwa semua objek berada pada semua tahun. Sebaliknya mungkin juga kita menjumpai dimana data tidak lengkap di mana setiap objeknya tidak tersedia datanya untuk semua tahun atau unbalanced panel (lihat gambar 2). Pada gambar 2 terlihat bahwa semua objek tidak lengkap pada semua tahun.
Gambar 1. Ilustrasi Balanced panel (Sumber: Wikipedia)
Gambar 1. Ilustrasi Unbalanced panel (Sumber: Wikipedia)
Jika datanya sudah lengkap tentu kita dapat langsung memilih metode balanced panel. Sebaliknya jika datanya kurang lengkap, kita dapat menggunakan teknik unbalanced panel atau terlebih dahulu melakukan interpolasi data dan kembali menggunakan balanced panel ketika semua data telah terisi melalui metode interpolasi. Metode interpolasi adalah metode untuk mengisi data yang kosong dengan pendekatan data pada tahun sebelum dan sesudahnya.
Model Data Panel
Untuk menggambarkan model persamaan data panel sebagai berikut:
Y menggambarkan variabel respon, sedangkan X menggambarkan variabel penyebab atau bariabel bebas. alpha menggambarkan konstanta dan u menggabarkan nilai residu atau error atau kekeliruan.
Jika kita perhatikan model persamaan di atas, terdapat sedikit perbedaan dengan model regresi seperti biasanya. Perbedaan tersebut tertera pada indeks it. i menggamarkan jumlah cross section atau objek pengamatan atau perusahaan atau responden. sedangkan t menggambarkan runtun waktu (time series). Sehingga dengan jelas terlihat data panel adalah kombinasi antara data cross section dan time series.
Perbedaan Model Fixed Effect dan Random Effect
Dua model utama yang dikenal dalam data panel adalah model fixed effect dan model random effect. Model fixed effect adalah model dimana variabel bebas dalam model diasumsikan bersifat fixed. Artinya individu atau unit cross section masih memiliki hubungan antara variabel bebasnya. Sementara model random effect adalah model dimana variabel bebas dalam model bersifat random, atau dengan kata lain diasumsikan tidak ada korelasi antara individu dengan variabel bebasnya.
Untuk memilih mana model yang cocok dalam data panel, perlu melakukan sebuah uji yang disebut dengan Uji Hausman. Uji spesifikasi Hausman menguji dengan Ho: Model random effect lebih efisien dibandingkan model fixed effect. Sedangkan H1: Model fixed effect lebih efisien dibandingkan model random effect. Artinya jika hipotesis nol diterima maka model yang paling cocok adalah random effect.
Software Statistik untuk Data Panel
Software yang paling populer yang digunakan untuk menganalisis data panel adalah Eview dan Stata, walaupun disamping itu banyak software-software yang lain. Kedua software ini mampu mengidentifikasi model yang cocok untuk data panel apakah fixed effect atau random effect. Kedua software ini paling sering digunakan para peneliti untuk menganalisis data time series. Melalui software ini data dipandang dari dua dimensi yaitu dimensi objek dan dimensi waktu.