Regresi Linear

Apa itu Linear Regression?

    Linear Regression (Regresi Linear) adalah suatu regresi linear yang digunakan untuk mengestimasi atau memprediksi hubungan antara dua variabel dalam penelitian kuantitatif. Dimana regresi linear ini mampu membuat satu asumsi tambahan yang mengkorelasikan antara variabel independen dan dependen melalui garis yang paling sesuai dari titik data garis lurus. 

 Tujuan Regresi

    Memiliki tujuan yaitu untuk menentukan seberapa kuat hubungan antara dependen variable(Y) dan independent variable(X)

Jenis- Jenis Regresi

  • Regresi linear sederhana (simple regression)
  • Regresi multilinear (multiple regression)
  • Regresi polynominal (polynominal regression)
  • Support vector regression
  • Decision tree regression
  • Random forest regression
  • GAM(Generalized Additive Models)

 Simple/univariate linear regression: 

Y = A + BX + ϵ 

Multiple/multivariate linear regression: 

Y = A + B1X1 + B2X2 + B3X3 + … + BtXt + ϵ 

Keterangan: 

Y = variabel yang ingin diprediksi (dependent variable).

X = variabel yang digunakan untuk memprediksi Y (independent variable). 

A = intercept. Yaitu nilai rata-rata pada variabel Y apabila nilai pada variabel X bernilai 0.

B = Slope. Yaitu nilai seberapa besar kontribusi yang diberikan oleh variabel X terhadap variabel Y.

ϵ = error / residuals. Yaitu selisih antara nilai duga (Predictive value dinotasikan sebagai) dengan nilai pengamatan sebenarnya (Y). Intinya error adalah semua hal yang mungkin mempengaruhi variabel Y tapi tidak diamati oleh peneliti.


Kelebihan dari Linear Regression

    Ketika hubungan antara variabel independen dan dependen memiliki hubungan linear, algoritma ini adalah yang terbaik untuk digunakan, karena ini adalah yang paling kompleks dibanding algoritma lain yang juga menemukan hubungan antara variabel independen dan dependen.

    Metode ini mampu digunakan untuk memprediksi nilai yang ada pada masa depan. Hal ini sejalan dengan fungsi dari analisis regresi yang dapat digunakan untuk peramalan dan prediksi.

Kekurangan dari Linear Regression

    Pada kenyataannya, dalam data real, jarang masalah didunia yang menunjukkan hubungan yang jelas antara variabel dependen dan independen. Hal ini dapat membuat model yang tidak cukup bagus, disebabkan karena kesalahan dalam memilih variabel yang digunakan untuk analisis.

 

Komentar

Postingan populer dari blog ini

Agglomerative Hierarchical Clustering