Regresi Linear
Apa itu Linear Regression?
Linear Regression (Regresi
Linear) adalah suatu regresi linear yang digunakan untuk mengestimasi atau
memprediksi hubungan antara dua variabel dalam penelitian kuantitatif. Dimana
regresi linear ini mampu membuat satu asumsi tambahan yang mengkorelasikan
antara variabel independen dan dependen melalui garis yang paling sesuai dari
titik data garis lurus.
Tujuan Regresi
Memiliki tujuan yaitu untuk menentukan
seberapa kuat hubungan antara dependen variable(Y) dan independent variable(X)
Jenis- Jenis Regresi
- Regresi linear sederhana (simple regression)
- Regresi multilinear (multiple regression)
- Regresi polynominal (polynominal regression)
- Support vector regression
- Decision tree regression
- Random forest regression
- GAM(Generalized Additive Models)
Y = A + BX + ϵ
Multiple/multivariate linear regression:
Y = A + B1X1 + B2X2 + B3X3 + … + BtXt +
ϵ
Keterangan:
Y = variabel yang ingin diprediksi (dependent variable).
X = variabel yang digunakan untuk memprediksi Y (independent variable).
A = intercept. Yaitu
nilai rata-rata pada variabel Y apabila nilai pada variabel X bernilai 0.
B = Slope. Yaitu nilai
seberapa besar kontribusi yang diberikan oleh variabel X terhadap variabel Y.
ϵ = error / residuals. Yaitu selisih antara nilai duga (Predictive value dinotasikan sebagai) dengan nilai pengamatan sebenarnya (Y). Intinya error adalah semua hal yang mungkin mempengaruhi variabel Y tapi tidak diamati oleh peneliti.
Kelebihan dari Linear Regression
Ketika hubungan antara
variabel independen dan dependen memiliki hubungan linear, algoritma ini adalah
yang terbaik untuk digunakan, karena ini adalah yang paling kompleks dibanding
algoritma lain yang juga menemukan hubungan antara variabel independen dan
dependen.
Metode ini mampu
digunakan untuk memprediksi nilai yang ada pada masa depan. Hal ini sejalan
dengan fungsi dari analisis regresi yang dapat digunakan untuk peramalan dan
prediksi.
Kekurangan dari Linear Regression
Pada kenyataannya, dalam
data real, jarang masalah didunia yang menunjukkan hubungan yang jelas antara
variabel dependen dan independen. Hal ini dapat membuat model yang tidak cukup
bagus, disebabkan karena kesalahan dalam memilih variabel yang digunakan untuk
analisis.
Komentar
Posting Komentar