10.1 Deskripsi Bab
Pada Bab 9, Anda telah mempelajari interpolasi, yaitu metode untuk membangun kurva yang melewati titik-titik data. Interpolasi cocok digunakan jika data relatif akurat dan tidak banyak mengandung noise.
Namun, data nyata sering tidak sempurna. Data hasil pengukuran sensor, eksperimen laboratorium, atau pengamatan sistem biasanya mengandung error. Jika semua titik data yang mengandung noise dipaksa dilewati oleh kurva, hasilnya dapat menjadi tidak stabil dan tidak mewakili tren sebenarnya.
Bab ini membahas regresi linear, yaitu metode untuk membangun garis lurus terbaik yang mewakili pola umum data. Garis regresi tidak harus melewati semua titik data. Tujuannya adalah mencari garis yang paling baik menggambarkan hubungan antara variabel (x) dan (y).
10.2 Capaian Pembelajaran
Setelah mempelajari bab ini, mahasiswa diharapkan mampu:
- Menjelaskan pengertian regresi linear.
- Membedakan regresi dan interpolasi.
- Menjelaskan konsep garis terbaik.
- Menjelaskan prinsip metode kuadrat terkecil.
- Menghitung parameter regresi (a) dan (b).
- Menginterpretasikan slope dan intercept.
- Menghitung residual dan Sum of Squared Errors.
- Menerapkan regresi linear pada data eksperimen teknik elektro.
10.3 Materi Inti
10.3.1 Apa Itu Regresi?
Regresi adalah teknik untuk membangun model yang mewakili hubungan antara sekumpulan data. Dalam regresi linear, model yang dibangun berupa garis lurus.
Bentuk umum regresi linear sederhana adalah:
Keterangan:
| Simbol | Makna |
|---|---|
| (y) | Variabel yang diprediksi |
| (x) | Variabel bebas |
| (a) | Intercept atau nilai (y) saat (x=0) |
| (b) | Slope atau kemiringan garis |
Tujuan regresi bukan membuat garis melewati semua titik data, melainkan membuat garis yang paling mewakili tren data secara keseluruhan.
10.3.2 Perbedaan Regresi dan Interpolasi
Regresi dan interpolasi sama-sama digunakan untuk memahami data, tetapi tujuan keduanya berbeda.
| Aspek | Interpolasi | Regresi |
|---|---|---|
| Tujuan | Memperkirakan nilai di antara titik data | Menangkap tren umum data |
| Kurva | Harus melewati semua titik data | Tidak harus melewati semua titik data |
| Cocok untuk | Data akurat dan sedikit noise | Data eksperimen yang mengandung noise |
| Hasil utama | Nilai pendekatan pada titik tertentu | Persamaan model |
| Contoh | Tabel kalibrasi yang sangat presisi | Hubungan arus dan tegangan hasil eksperimen |
Jika data mengandung noise, regresi biasanya lebih sesuai daripada interpolasi karena regresi tidak memaksa garis melewati setiap titik.
10.3.3 Konsep Garis Terbaik
Misalkan terdapat beberapa titik data:
Kita ingin mencari garis:
yang paling mewakili titik-titik tersebut.
Untuk setiap titik data, terdapat selisih antara nilai data sebenarnya dan nilai prediksi dari garis regresi. Selisih ini disebut residual.
Jika nilai prediksi pada titik (x_i) adalah:
maka residualnya adalah:
atau:
Garis terbaik adalah garis yang membuat total kuadrat residual sekecil mungkin.
10.3.4 Sum of Squared Errors
Sum of Squared Errors atau SSE adalah jumlah kuadrat residual.
atau:
Mengapa residual dikuadratkan?
Jika residual hanya dijumlahkan biasa, residual positif dan negatif dapat saling menghilangkan. Akibatnya, jumlah residual bisa kecil atau bahkan nol, padahal garis belum tentu baik. Dengan menguadratkan residual, semua error dihitung sebagai nilai positif.
| Residual | Jika Dijumlahkan | Jika Dikuadratkan |
|---|---|---|
| Positif | Bisa menambah total | Menambah total error |
| Negatif | Bisa mengurangi total | Tetap menambah total error |
| Nol | Tidak berpengaruh | Tidak berpengaruh |
Semakin kecil nilai SSE, semakin baik garis regresi mewakili data.
10.3.5 Metode Kuadrat Terkecil
Metode kuadrat terkecil atau least squares method adalah metode untuk mencari garis regresi yang meminimumkan SSE.
Bentuk garis regresi:
Parameter (a) dan (b) dihitung dengan rumus:
atau:
Keterangan:
| Simbol | Makna |
|---|---|
| (n) | Jumlah data |
| (\sum x_i) | Jumlah seluruh nilai (x) |
| (\sum y_i) | Jumlah seluruh nilai (y) |
| (\sum x_i y_i) | Jumlah hasil kali (x_i) dan (y_i) |
| (\sum x_i^2) | Jumlah kuadrat nilai (x_i) |
| (\bar{x}) | Rata-rata nilai (x) |
| (\bar{y}) | Rata-rata nilai (y) |
10.3.6 Langkah Praktis Menghitung Regresi Linear
Langkah-langkah menghitung regresi linear adalah:
-
Susun data dalam bentuk pasangan ((x_i,y_i)).
-
Buat tabel bantu yang memuat (x_i), (y_i), (x_i y_i), dan (x_i^2).
-
Hitung (\sum x_i), (\sum y_i), (\sum x_i y_i), dan (\sum x_i^2).
-
Hitung nilai (b) menggunakan rumus slope.
-
Hitung nilai (a) menggunakan rumus intercept.
-
Bentuk persamaan regresi:
-
Hitung residual dan SSE jika ingin menilai kualitas garis regresi.
10.3.7 Interpretasi Parameter (a) dan (b)
Parameter (a) dan (b) tidak hanya angka. Keduanya memiliki makna yang dapat ditafsirkan.
| Parameter | Nama | Makna |
|---|---|---|
| (a) | Intercept | Nilai prediksi (y) ketika (x=0) |
| (b) | Slope atau gradien | Perubahan (y) untuk setiap kenaikan satu satuan (x) |
Jika (b>0), hubungan antara (x) dan (y) cenderung searah. Ketika (x) naik, (y) juga cenderung naik.
Jika (b<0), hubungan antara (x) dan (y) cenderung berlawanan arah. Ketika (x) naik, (y) cenderung turun.
Dalam teknik elektro, jika regresi dilakukan pada hubungan tegangan dan arus:
maka slope (b) dapat ditafsirkan sebagai resistansi.
10.3.8 Residual dan Kualitas Model
Setelah persamaan regresi diperoleh, residual setiap titik dapat dihitung dengan:
Residual menunjukkan jarak vertikal antara titik data dan garis regresi.
| Kondisi Residual | Interpretasi |
|---|---|
| Residual kecil | Prediksi dekat dengan data |
| Residual besar | Prediksi jauh dari data |
| Residual positif | Data berada di atas garis regresi |
| Residual negatif | Data berada di bawah garis regresi |
SSE digunakan sebagai ukuran sederhana untuk melihat kualitas model. SSE yang lebih kecil menunjukkan bahwa garis regresi lebih dekat terhadap titik-titik data.
10.3.9 Aplikasi Regresi Linear dalam Teknik Elektro
Regresi linear sering digunakan dalam data eksperimen teknik elektro. Beberapa contoh aplikasinya adalah:
| Aplikasi | Tujuan Regresi |
|---|---|
| Verifikasi Hukum Ohm | Menentukan resistansi dari data arus dan tegangan |
| Kalibrasi sensor | Mencari hubungan antara input fisik dan output tegangan |
| Karakterisasi komponen | Mengetahui hubungan antarvariabel hasil pengukuran |
| Prediksi respons sistem | Membuat model sederhana dari data eksperimen |
| Analisis konsumsi energi | Melihat tren penggunaan daya terhadap waktu atau beban |
Contoh penting adalah Hukum Ohm:
Jika (V) menjadi variabel (y) dan (I) menjadi variabel (x), maka bentuknya sesuai dengan regresi linear:
Jika (a) mendekati nol dan (b) bernilai sekitar resistansi, maka data eksperimen konsisten dengan Hukum Ohm.
10.3.10 Pengantar Jenis Regresi Lain
Regresi linear sederhana hanya membahas hubungan satu variabel bebas dan satu variabel terikat dalam bentuk garis lurus. Pada data nyata, hubungan antarvariabel tidak selalu linear.
Beberapa jenis regresi lain adalah:
| Jenis Regresi | Bentuk Umum | Cocok Untuk |
|---|---|---|
| Regresi polinomial | (y=a_0+a_1x+a_2x^2+\cdots+a_nx^n) | Data melengkung |
| Regresi multivariabel | (y=a+b_1x_1+b_2x_2+\cdots+b_kx_k) | Data dengan banyak variabel bebas |
| Regresi eksponensial | (y=ae^{bx}) | Pertumbuhan atau peluruhan |
| Regresi logaritmik | (y=a+b\ln(x)) | Perubahan cepat di awal lalu melambat |
| Regresi pangkat | (y=ax^b) | Hubungan empiris berbentuk pangkat |
Beberapa model non-linear dapat diubah menjadi bentuk linear melalui transformasi. Misalnya:
dapat diubah menjadi:
Setelah ditransformasi, metode kuadrat terkecil dapat digunakan kembali.
10.4 Fitur Interaktif
Bagian ini dapat digunakan sebagai rancangan komponen interaktif pada halaman web.
10.4.1 Input Titik Data
Mahasiswa dapat memasukkan titik data dalam bentuk tabel.
Contoh:
| (x) | (y) |
|---|---|
| 1 | 2 |
| 2 | 4 |
| 3 | 5 |
| 4 | 4 |
| 5 | 5 |
Sistem kemudian menghitung:
- Nilai slope (b).
- Nilai intercept (a).
- Persamaan regresi.
- Residual tiap titik.
- SSE.
10.4.2 Garis Regresi Otomatis
Setelah data dimasukkan, graph panel menampilkan:
- Titik-titik data.
- Garis regresi.
- Residual sebagai garis vertikal dari titik data ke garis regresi.
- Nilai (a), (b), dan SSE.
Visualisasi ini membantu mahasiswa memahami bahwa regresi tidak memaksa garis melewati semua titik.
10.4.3 Titik Data Bisa Digeser
Mahasiswa dapat menggeser titik data pada grafik. Sistem secara otomatis memperbarui:
- Garis regresi.
- Nilai slope.
- Nilai intercept.
- Residual per titik.
- Nilai SSE.
Fitur ini membantu mahasiswa melihat pengaruh satu titik data terhadap garis regresi.
10.4.4 Residual per Titik
Sistem dapat menampilkan residual dalam tabel.
| (x_i) | (y_i) | (\hat{y_i}) | (d_i) | (d_i^2) |
|---|---|---|---|---|
| 1 | 2 | 2,8 | -0,8 | 0,64 |
| 2 | 4 | 3,4 | 0,6 | 0,36 |
| 3 | 5 | 4,0 | 1,0 | 1,00 |
Mahasiswa dapat melihat titik mana yang paling jauh dari garis regresi.
10.4.5 Mini Quiz Interaktif
Contoh pertanyaan interaktif:
- Apa perbedaan regresi dan interpolasi?
- Apa makna slope pada garis regresi?
- Kapan regresi linear cocok digunakan?
- Apa arti residual positif?
- Mengapa residual dikuadratkan dalam SSE?
10.5 Contoh Soal
Contoh 10.1 Regresi Linear Sederhana
Diberikan data:
Tentukan persamaan regresi linear:
Penyelesaian
Buat tabel bantu:
| (i) | (x_i) | (y_i) | (x_i y_i) | (x_i^2) |
|---|---|---|---|---|
| 1 | 1 | 2 | 2 | 1 |
| 2 | 2 | 4 | 8 | 4 |
| 3 | 3 | 5 | 15 | 9 |
| 4 | 4 | 4 | 16 | 16 |
| 5 | 5 | 5 | 25 | 25 |
| (\sum) | 15 | 20 | 66 | 55 |
Diketahui:
Hitung slope:
Hitung intercept:
Jadi, persamaan regresinya adalah:
Contoh 10.2 Menghitung Residual dan SSE
Gunakan hasil dari Contoh 10.1:
Hitung residual dan SSE.
Penyelesaian
| (x_i) | (y_i) | (\hat{y_i}=2{,}2+0{,}6x_i) | (d_i=y_i-\hat{y_i}) | (d_i^2) |
|---|---|---|---|---|
| 1 | 2 | 2,8 | -0,8 | 0,64 |
| 2 | 4 | 3,4 | 0,6 | 0,36 |
| 3 | 5 | 4,0 | 1,0 | 1,00 |
| 4 | 4 | 4,6 | -0,6 | 0,36 |
| 5 | 5 | 5,2 | -0,2 | 0,04 |
Maka:
Interpretasi: nilai SSE sebesar (2{,}40) menunjukkan bahwa garis regresi tidak melewati semua titik data secara sempurna, tetapi cukup mewakili tren data secara umum.
Contoh 10.3 Regresi pada Data Kalibrasi Sensor
Sebuah sensor suhu dikalibrasi dengan data berikut:
| Suhu (T) dalam °C | Tegangan (V) dalam volt |
|---|---|
| 20 | 1,02 |
| 40 | 2,05 |
| 60 | 3,07 |
| 80 | 4,11 |
Cari persamaan kalibrasi:
lalu gunakan untuk memprediksi suhu saat:
Penyelesaian
Tabel bantu:
| (T) | (V) | (T \cdot V) | (T^2) |
|---|---|---|---|
| 20 | 1,02 | 20,40 | 400 |
| 40 | 2,05 | 82,00 | 1600 |
| 60 | 3,07 | 184,20 | 3600 |
| 80 | 4,11 | 328,80 | 6400 |
| (\sum) | 10,25 | 615,40 | 12000 |
Diketahui:
Hitung slope:
Hitung intercept:
Persamaan kalibrasi:
Untuk (V=2{,}5):
Jadi, jika sensor membaca (2{,}5) V, suhu diperkirakan sekitar:
Contoh 10.4 Regresi untuk Estimasi Resistansi
Sebuah resistor diuji dengan data arus dan tegangan berikut.
| Arus (I) dalam A | Tegangan (V) dalam V |
|---|---|
| 0,10 | 0,95 |
| 0,20 | 2,10 |
| 0,30 | 2,95 |
| 0,40 | 4,05 |
| 0,50 | 5,00 |
Jika digunakan model:
maka (b) dapat ditafsirkan sebagai resistansi.
Dari perhitungan regresi, diperoleh:
dan:
Maka persamaan regresinya adalah:
Jadi, resistansi resistor diperkirakan:
Karena intercept hampir nol, hasil ini konsisten dengan Hukum Ohm.
10.6 Kuis
Pilihlah satu jawaban yang paling tepat.
-
Perbedaan utama regresi dan interpolasi adalah...
a. Regresi selalu melewati semua titik data
b. Interpolasi tidak menggunakan data
c. Regresi mewakili tren data dan tidak harus melewati semua titik
d. Regresi hanya digunakan untuk dua titik -
Bentuk umum regresi linear sederhana adalah...
a. (y=ax^2+bx+c)
b. (y=a+bx)
c. (y=ae^x)
d. (y=\frac{a}{x}) -
Tujuan metode kuadrat terkecil adalah...
a. Memaksimumkan jumlah residual
b. Meminimumkan jumlah kuadrat residual
c. Membuat semua residual bernilai negatif
d. Menghapus data yang tidak sesuai -
Rumus slope (b) pada regresi linear adalah...
a. (\frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{n\sum x_i^2 - (\sum x_i)^2})
b. (\frac{\sum y_i}{\sum x_i})
c. (\sum x_i + \sum y_i)
d. (\frac{x_i-y_i}{n}) -
Parameter (a) dalam (y=a+bx) menyatakan...
a. Kemiringan garis
b. Nilai prediksi (y) ketika (x=0)
c. Jumlah data
d. Nilai SSE -
Jika (b>0), maka hubungan antara (x) dan (y) cenderung...
a. Searah
b. Berlawanan arah
c. Tidak dapat dihitung
d. Selalu nol -
Residual adalah...
a. Hasil penjumlahan semua data
b. Selisih antara nilai data dan nilai prediksi
c. Kemiringan garis regresi
d. Titik pusat data -
SSE adalah...
a. Jumlah kuadrat residual
b. Jumlah seluruh nilai (x)
c. Nilai rata-rata (y)
d. Nilai intercept -
Regresi linear cocok digunakan jika...
a. Data menunjukkan tren mendekati garis lurus
b. Data harus dilewati semua titiknya
c. Data hanya berisi satu titik
d. Data tidak memiliki hubungan apa pun -
Pada model (V=a+bI), nilai (b) dapat ditafsirkan sebagai...
a. Kapasitansi
b. Resistansi
c. Frekuensi
d. Daya maksimum
10.7 Latihan
Kerjakan latihan berikut secara sistematis.
-
Lima siswa memiliki data jam belajar dan nilai ujian sebagai berikut:
Bangun persamaan regresi linear (y=a+bx). Hitung nilai (a), (b), dan interpretasikan maknanya.
-
Dari hasil latihan nomor 1, hitung residual setiap titik dan nilai SSE.
-
Sebuah resistor diuji dengan data berikut:
Gunakan regresi linear (V=a+bI) untuk mengestimasi resistansi resistor.
-
Jelaskan mengapa regresi linear lebih cocok daripada interpolasi untuk data eksperimen yang mengandung noise.
-
Pada percobaan pengisian kapasitor, diperoleh data:
(t) dalam s (V) dalam V 1 6,3 2 8,7 3 9,5 4 9,8 5 9,9 Apakah regresi linear cocok untuk data ini? Jelaskan alasannya.
-
Buat satu contoh kasus teknik elektro di mana regresi linear dapat digunakan untuk kalibrasi sensor.
-
Jelaskan mengapa jumlah residual biasa tidak cukup untuk menilai kualitas garis regresi.
10.8 Rangkuman
- Regresi adalah metode untuk membangun model yang mewakili tren data.
- Regresi linear sederhana menggunakan model (y=a+bx).
- Berbeda dengan interpolasi, regresi tidak harus melewati semua titik data.
- Regresi cocok untuk data eksperimen yang mengandung noise.
- Metode kuadrat terkecil mencari garis yang meminimumkan jumlah kuadrat residual.
- Rumus slope adalah (b=\frac{n\sum x_i y_i-(\sum x_i)(\sum y_i)}{n\sum x_i^2-(\sum x_i)^2}).
- Rumus intercept adalah (a=\frac{\sum y_i-b\sum x_i}{n}).
- Parameter (a) menunjukkan nilai prediksi (y) saat (x=0).
- Parameter (b) menunjukkan perubahan (y) untuk setiap kenaikan satu satuan (x).
- Residual adalah selisih antara nilai data dan nilai prediksi regresi.
- SSE adalah jumlah kuadrat residual dan digunakan untuk menilai kualitas model.
- Regresi linear banyak digunakan dalam teknik elektro, seperti verifikasi Hukum Ohm, kalibrasi sensor, karakterisasi komponen, dan prediksi respons sistem.