Modul utama

Materi 10

Bab 10: Regresi Linear

Modul pembelajaran Metode Numerik tentang regresi linear, metode kuadrat terkecil, slope, intercept, residual, SSE, dan aplikasi regresi pada data eksperimen teknik elektro.

Laboratorium interaktif

Geser, klik, dan bereksperimen dulu — konsep bab ini jauh lebih mudah dipahami setelah kamu melihatnya bergerak.

simulasi · bab 10

Pemburu Garis Terbaik

Setiap titik menyetor 'denda' sebesar kuadrat jaraknya ke garis — terlihat sebagai kotak kuning. Atur sendiri kemiringan garis dan coba kecilkan total luas kotak, lalu biarkan metode kuadrat terkecil menunjukkan garis yang tak terkalahkan.

012345678-1012345678
data pengukuran (seret naik–turun!)garis tebakanmukuadrat residual (denda)

Mode garis

Total luas kotak (SSE)

garis saat ini16,14
garis terbaik1,134

Persamaan garis

y = 0,4 + 0,5x

Selisih dari optimal

15,006

Misi: kecilkan total luas kotak kuning di bawah 1,18. Rumus kuadrat terkecil menemukan minimum ini langsung, tanpa coba-coba.

10.1 Deskripsi Bab

Pada Bab 9, Anda telah mempelajari interpolasi, yaitu metode untuk membangun kurva yang melewati titik-titik data. Interpolasi cocok digunakan jika data relatif akurat dan tidak banyak mengandung noise.

Namun, data nyata sering tidak sempurna. Data hasil pengukuran sensor, eksperimen laboratorium, atau pengamatan sistem biasanya mengandung error. Jika semua titik data yang mengandung noise dipaksa dilewati oleh kurva, hasilnya dapat menjadi tidak stabil dan tidak mewakili tren sebenarnya.

Bab ini membahas regresi linear, yaitu metode untuk membangun garis lurus terbaik yang mewakili pola umum data. Garis regresi tidak harus melewati semua titik data. Tujuannya adalah mencari garis yang paling baik menggambarkan hubungan antara variabel (x) dan (y).


10.2 Capaian Pembelajaran

Setelah mempelajari bab ini, mahasiswa diharapkan mampu:

  1. Menjelaskan pengertian regresi linear.
  2. Membedakan regresi dan interpolasi.
  3. Menjelaskan konsep garis terbaik.
  4. Menjelaskan prinsip metode kuadrat terkecil.
  5. Menghitung parameter regresi (a) dan (b).
  6. Menginterpretasikan slope dan intercept.
  7. Menghitung residual dan Sum of Squared Errors.
  8. Menerapkan regresi linear pada data eksperimen teknik elektro.

10.3 Materi Inti

10.3.1 Apa Itu Regresi?

Regresi adalah teknik untuk membangun model yang mewakili hubungan antara sekumpulan data. Dalam regresi linear, model yang dibangun berupa garis lurus.

Bentuk umum regresi linear sederhana adalah:

y=a+bxy = a + bx

Keterangan:

SimbolMakna
(y)Variabel yang diprediksi
(x)Variabel bebas
(a)Intercept atau nilai (y) saat (x=0)
(b)Slope atau kemiringan garis

Tujuan regresi bukan membuat garis melewati semua titik data, melainkan membuat garis yang paling mewakili tren data secara keseluruhan.


10.3.2 Perbedaan Regresi dan Interpolasi

Regresi dan interpolasi sama-sama digunakan untuk memahami data, tetapi tujuan keduanya berbeda.

AspekInterpolasiRegresi
TujuanMemperkirakan nilai di antara titik dataMenangkap tren umum data
KurvaHarus melewati semua titik dataTidak harus melewati semua titik data
Cocok untukData akurat dan sedikit noiseData eksperimen yang mengandung noise
Hasil utamaNilai pendekatan pada titik tertentuPersamaan model
ContohTabel kalibrasi yang sangat presisiHubungan arus dan tegangan hasil eksperimen

Jika data mengandung noise, regresi biasanya lebih sesuai daripada interpolasi karena regresi tidak memaksa garis melewati setiap titik.


10.3.3 Konsep Garis Terbaik

Misalkan terdapat beberapa titik data:

(x1,y1),(x2,y2),,(xn,yn)(x_1,y_1), (x_2,y_2), \ldots, (x_n,y_n)

Kita ingin mencari garis:

y=a+bxy = a + bx

yang paling mewakili titik-titik tersebut.

Untuk setiap titik data, terdapat selisih antara nilai data sebenarnya dan nilai prediksi dari garis regresi. Selisih ini disebut residual.

Jika nilai prediksi pada titik (x_i) adalah:

yi^=a+bxi\hat{y_i}=a+bx_i

maka residualnya adalah:

di=yiyi^d_i = y_i - \hat{y_i}

atau:

di=yi(a+bxi)d_i = y_i - (a+bx_i)

Garis terbaik adalah garis yang membuat total kuadrat residual sekecil mungkin.


10.3.4 Sum of Squared Errors

Sum of Squared Errors atau SSE adalah jumlah kuadrat residual.

SSE=di2SSE = \sum d_i^2

atau:

SSE=(yi(a+bxi))2SSE = \sum \left(y_i - (a+bx_i)\right)^2

Mengapa residual dikuadratkan?

Jika residual hanya dijumlahkan biasa, residual positif dan negatif dapat saling menghilangkan. Akibatnya, jumlah residual bisa kecil atau bahkan nol, padahal garis belum tentu baik. Dengan menguadratkan residual, semua error dihitung sebagai nilai positif.

ResidualJika DijumlahkanJika Dikuadratkan
PositifBisa menambah totalMenambah total error
NegatifBisa mengurangi totalTetap menambah total error
NolTidak berpengaruhTidak berpengaruh

Semakin kecil nilai SSE, semakin baik garis regresi mewakili data.


10.3.5 Metode Kuadrat Terkecil

Metode kuadrat terkecil atau least squares method adalah metode untuk mencari garis regresi yang meminimumkan SSE.

Bentuk garis regresi:

y=a+bxy = a + bx

Parameter (a) dan (b) dihitung dengan rumus:

b=nxiyi(xi)(yi)nxi2(xi)2b = \frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{n\sum x_i^2 - (\sum x_i)^2} a=yibxina = \frac{\sum y_i - b\sum x_i}{n}

atau:

a=yˉbxˉa = \bar{y} - b\bar{x}

Keterangan:

SimbolMakna
(n)Jumlah data
(\sum x_i)Jumlah seluruh nilai (x)
(\sum y_i)Jumlah seluruh nilai (y)
(\sum x_i y_i)Jumlah hasil kali (x_i) dan (y_i)
(\sum x_i^2)Jumlah kuadrat nilai (x_i)
(\bar{x})Rata-rata nilai (x)
(\bar{y})Rata-rata nilai (y)

10.3.6 Langkah Praktis Menghitung Regresi Linear

Langkah-langkah menghitung regresi linear adalah:

  1. Susun data dalam bentuk pasangan ((x_i,y_i)).

  2. Buat tabel bantu yang memuat (x_i), (y_i), (x_i y_i), dan (x_i^2).

  3. Hitung (\sum x_i), (\sum y_i), (\sum x_i y_i), dan (\sum x_i^2).

  4. Hitung nilai (b) menggunakan rumus slope.

  5. Hitung nilai (a) menggunakan rumus intercept.

  6. Bentuk persamaan regresi:

    y=a+bxy = a + bx
  7. Hitung residual dan SSE jika ingin menilai kualitas garis regresi.


10.3.7 Interpretasi Parameter (a) dan (b)

Parameter (a) dan (b) tidak hanya angka. Keduanya memiliki makna yang dapat ditafsirkan.

ParameterNamaMakna
(a)InterceptNilai prediksi (y) ketika (x=0)
(b)Slope atau gradienPerubahan (y) untuk setiap kenaikan satu satuan (x)

Jika (b>0), hubungan antara (x) dan (y) cenderung searah. Ketika (x) naik, (y) juga cenderung naik.

Jika (b<0), hubungan antara (x) dan (y) cenderung berlawanan arah. Ketika (x) naik, (y) cenderung turun.

Dalam teknik elektro, jika regresi dilakukan pada hubungan tegangan dan arus:

V=a+bIV = a + bI

maka slope (b) dapat ditafsirkan sebagai resistansi.


10.3.8 Residual dan Kualitas Model

Setelah persamaan regresi diperoleh, residual setiap titik dapat dihitung dengan:

di=yi(a+bxi)d_i = y_i - (a+bx_i)

Residual menunjukkan jarak vertikal antara titik data dan garis regresi.

Kondisi ResidualInterpretasi
Residual kecilPrediksi dekat dengan data
Residual besarPrediksi jauh dari data
Residual positifData berada di atas garis regresi
Residual negatifData berada di bawah garis regresi

SSE digunakan sebagai ukuran sederhana untuk melihat kualitas model. SSE yang lebih kecil menunjukkan bahwa garis regresi lebih dekat terhadap titik-titik data.


10.3.9 Aplikasi Regresi Linear dalam Teknik Elektro

Regresi linear sering digunakan dalam data eksperimen teknik elektro. Beberapa contoh aplikasinya adalah:

AplikasiTujuan Regresi
Verifikasi Hukum OhmMenentukan resistansi dari data arus dan tegangan
Kalibrasi sensorMencari hubungan antara input fisik dan output tegangan
Karakterisasi komponenMengetahui hubungan antarvariabel hasil pengukuran
Prediksi respons sistemMembuat model sederhana dari data eksperimen
Analisis konsumsi energiMelihat tren penggunaan daya terhadap waktu atau beban

Contoh penting adalah Hukum Ohm:

V=IRV = IR

Jika (V) menjadi variabel (y) dan (I) menjadi variabel (x), maka bentuknya sesuai dengan regresi linear:

V=a+bIV = a + bI

Jika (a) mendekati nol dan (b) bernilai sekitar resistansi, maka data eksperimen konsisten dengan Hukum Ohm.


10.3.10 Pengantar Jenis Regresi Lain

Regresi linear sederhana hanya membahas hubungan satu variabel bebas dan satu variabel terikat dalam bentuk garis lurus. Pada data nyata, hubungan antarvariabel tidak selalu linear.

Beberapa jenis regresi lain adalah:

Jenis RegresiBentuk UmumCocok Untuk
Regresi polinomial(y=a_0+a_1x+a_2x^2+\cdots+a_nx^n)Data melengkung
Regresi multivariabel(y=a+b_1x_1+b_2x_2+\cdots+b_kx_k)Data dengan banyak variabel bebas
Regresi eksponensial(y=ae^{bx})Pertumbuhan atau peluruhan
Regresi logaritmik(y=a+b\ln(x))Perubahan cepat di awal lalu melambat
Regresi pangkat(y=ax^b)Hubungan empiris berbentuk pangkat

Beberapa model non-linear dapat diubah menjadi bentuk linear melalui transformasi. Misalnya:

y=aebxy=ae^{bx}

dapat diubah menjadi:

ln(y)=ln(a)+bx\ln(y)=\ln(a)+bx

Setelah ditransformasi, metode kuadrat terkecil dapat digunakan kembali.


10.4 Fitur Interaktif

Bagian ini dapat digunakan sebagai rancangan komponen interaktif pada halaman web.

10.4.1 Input Titik Data

Mahasiswa dapat memasukkan titik data dalam bentuk tabel.

Contoh:

(x)(y)
12
24
35
44
55

Sistem kemudian menghitung:

  1. Nilai slope (b).
  2. Nilai intercept (a).
  3. Persamaan regresi.
  4. Residual tiap titik.
  5. SSE.

10.4.2 Garis Regresi Otomatis

Setelah data dimasukkan, graph panel menampilkan:

  1. Titik-titik data.
  2. Garis regresi.
  3. Residual sebagai garis vertikal dari titik data ke garis regresi.
  4. Nilai (a), (b), dan SSE.

Visualisasi ini membantu mahasiswa memahami bahwa regresi tidak memaksa garis melewati semua titik.


10.4.3 Titik Data Bisa Digeser

Mahasiswa dapat menggeser titik data pada grafik. Sistem secara otomatis memperbarui:

  1. Garis regresi.
  2. Nilai slope.
  3. Nilai intercept.
  4. Residual per titik.
  5. Nilai SSE.

Fitur ini membantu mahasiswa melihat pengaruh satu titik data terhadap garis regresi.


10.4.4 Residual per Titik

Sistem dapat menampilkan residual dalam tabel.

(x_i)(y_i)(\hat{y_i})(d_i)(d_i^2)
122,8-0,80,64
243,40,60,36
354,01,01,00

Mahasiswa dapat melihat titik mana yang paling jauh dari garis regresi.


10.4.5 Mini Quiz Interaktif

Contoh pertanyaan interaktif:

  1. Apa perbedaan regresi dan interpolasi?
  2. Apa makna slope pada garis regresi?
  3. Kapan regresi linear cocok digunakan?
  4. Apa arti residual positif?
  5. Mengapa residual dikuadratkan dalam SSE?

10.5 Contoh Soal

Contoh 10.1 Regresi Linear Sederhana

Diberikan data:

(1,2),(2,4),(3,5),(4,4),(5,5)(1,2), (2,4), (3,5), (4,4), (5,5)

Tentukan persamaan regresi linear:

y=a+bxy=a+bx

Penyelesaian

Buat tabel bantu:

(i)(x_i)(y_i)(x_i y_i)(x_i^2)
11221
22484
335159
4441616
5552525
(\sum)15206655

Diketahui:

n=5n=5 xi=15\sum x_i=15 yi=20\sum y_i=20 xiyi=66\sum x_i y_i=66 xi2=55\sum x_i^2=55

Hitung slope:

b=nxiyi(xi)(yi)nxi2(xi)2b = \frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{n\sum x_i^2 - (\sum x_i)^2} b=5(66)15(20)5(55)152b = \frac{5(66)-15(20)}{5(55)-15^2} b=330300275225b = \frac{330-300}{275-225} b=3050=0,6b = \frac{30}{50}=0{,}6

Hitung intercept:

a=yibxina = \frac{\sum y_i - b\sum x_i}{n} a=200,6(15)5a = \frac{20 - 0{,}6(15)}{5} a=2095a = \frac{20-9}{5} a=2,2a = 2{,}2

Jadi, persamaan regresinya adalah:

y=2,2+0,6xy = 2{,}2 + 0{,}6x

Contoh 10.2 Menghitung Residual dan SSE

Gunakan hasil dari Contoh 10.1:

y=2,2+0,6xy = 2{,}2 + 0{,}6x

Hitung residual dan SSE.

Penyelesaian

(x_i)(y_i)(\hat{y_i}=2{,}2+0{,}6x_i)(d_i=y_i-\hat{y_i})(d_i^2)
122,8-0,80,64
243,40,60,36
354,01,01,00
444,6-0,60,36
555,2-0,20,04

Maka:

SSE=0,64+0,36+1,00+0,36+0,04SSE = 0{,}64+0{,}36+1{,}00+0{,}36+0{,}04 SSE=2,40SSE = 2{,}40

Interpretasi: nilai SSE sebesar (2{,}40) menunjukkan bahwa garis regresi tidak melewati semua titik data secara sempurna, tetapi cukup mewakili tren data secara umum.


Contoh 10.3 Regresi pada Data Kalibrasi Sensor

Sebuah sensor suhu dikalibrasi dengan data berikut:

Suhu (T) dalam °CTegangan (V) dalam volt
201,02
402,05
603,07
804,11

Cari persamaan kalibrasi:

V=a+bTV = a + bT

lalu gunakan untuk memprediksi suhu saat:

V=2,5 VV = 2{,}5 \text{ V}

Penyelesaian

Tabel bantu:

(T)(V)(T \cdot V)(T^2)
201,0220,40400
402,0582,001600
603,07184,203600
804,11328,806400
(\sum)10,25615,4012000

Diketahui:

n=4n=4 T=200\sum T=200 V=10,25\sum V=10{,}25 TV=615,40\sum TV=615{,}40 T2=12000\sum T^2=12000

Hitung slope:

b=4(615,40)200(10,25)4(12000)2002b = \frac{4(615{,}40)-200(10{,}25)}{4(12000)-200^2} b=2461,620504800040000b = \frac{2461{,}6-2050}{48000-40000} b=411,68000b = \frac{411{,}6}{8000} b0,05145b \approx 0{,}05145

Hitung intercept:

a=10,250,05145(200)4a = \frac{10{,}25 - 0{,}05145(200)}{4} a0,01a \approx -0{,}01

Persamaan kalibrasi:

V0,01+0,05145TV \approx -0{,}01 + 0{,}05145T

Untuk (V=2{,}5):

2,5=0,01+0,05145T2{,}5 = -0{,}01 + 0{,}05145T T=2,5+0,010,05145T = \frac{2{,}5+0{,}01}{0{,}05145} T48,8CT \approx 48{,}8^\circ C

Jadi, jika sensor membaca (2{,}5) V, suhu diperkirakan sekitar:

48,8C48{,}8^\circ C

Contoh 10.4 Regresi untuk Estimasi Resistansi

Sebuah resistor diuji dengan data arus dan tegangan berikut.

Arus (I) dalam ATegangan (V) dalam V
0,100,95
0,202,10
0,302,95
0,404,05
0,505,00

Jika digunakan model:

V=a+bIV = a + bI

maka (b) dapat ditafsirkan sebagai resistansi.

Dari perhitungan regresi, diperoleh:

b10,05b \approx 10{,}05

dan:

a0,0050a \approx -0{,}005 \approx 0

Maka persamaan regresinya adalah:

V0+10,05IV \approx 0 + 10{,}05I

Jadi, resistansi resistor diperkirakan:

R10,05ΩR \approx 10{,}05 \Omega

Karena intercept hampir nol, hasil ini konsisten dengan Hukum Ohm.


10.6 Kuis

Pilihlah satu jawaban yang paling tepat.

  1. Perbedaan utama regresi dan interpolasi adalah...

    a. Regresi selalu melewati semua titik data
    b. Interpolasi tidak menggunakan data
    c. Regresi mewakili tren data dan tidak harus melewati semua titik
    d. Regresi hanya digunakan untuk dua titik

  2. Bentuk umum regresi linear sederhana adalah...

    a. (y=ax^2+bx+c)
    b. (y=a+bx)
    c. (y=ae^x)
    d. (y=\frac{a}{x})

  3. Tujuan metode kuadrat terkecil adalah...

    a. Memaksimumkan jumlah residual
    b. Meminimumkan jumlah kuadrat residual
    c. Membuat semua residual bernilai negatif
    d. Menghapus data yang tidak sesuai

  4. Rumus slope (b) pada regresi linear adalah...

    a. (\frac{n\sum x_i y_i - (\sum x_i)(\sum y_i)}{n\sum x_i^2 - (\sum x_i)^2})
    b. (\frac{\sum y_i}{\sum x_i})
    c. (\sum x_i + \sum y_i)
    d. (\frac{x_i-y_i}{n})

  5. Parameter (a) dalam (y=a+bx) menyatakan...

    a. Kemiringan garis
    b. Nilai prediksi (y) ketika (x=0)
    c. Jumlah data
    d. Nilai SSE

  6. Jika (b>0), maka hubungan antara (x) dan (y) cenderung...

    a. Searah
    b. Berlawanan arah
    c. Tidak dapat dihitung
    d. Selalu nol

  7. Residual adalah...

    a. Hasil penjumlahan semua data
    b. Selisih antara nilai data dan nilai prediksi
    c. Kemiringan garis regresi
    d. Titik pusat data

  8. SSE adalah...

    a. Jumlah kuadrat residual
    b. Jumlah seluruh nilai (x)
    c. Nilai rata-rata (y)
    d. Nilai intercept

  9. Regresi linear cocok digunakan jika...

    a. Data menunjukkan tren mendekati garis lurus
    b. Data harus dilewati semua titiknya
    c. Data hanya berisi satu titik
    d. Data tidak memiliki hubungan apa pun

  10. Pada model (V=a+bI), nilai (b) dapat ditafsirkan sebagai...

a. Kapasitansi
b. Resistansi
c. Frekuensi
d. Daya maksimum


10.7 Latihan

Kerjakan latihan berikut secara sistematis.

  1. Lima siswa memiliki data jam belajar dan nilai ujian sebagai berikut:

    (2,65),(4,72),(6,78),(8,85),(10,88)(2,65), (4,72), (6,78), (8,85), (10,88)

    Bangun persamaan regresi linear (y=a+bx). Hitung nilai (a), (b), dan interpretasikan maknanya.

  2. Dari hasil latihan nomor 1, hitung residual setiap titik dan nilai SSE.

  3. Sebuah resistor diuji dengan data berikut:

    (0,2,1,01),(0,4,2,03),(0,6,3,02),(0,8,4,04)(0{,}2,1{,}01), (0{,}4,2{,}03), (0{,}6,3{,}02), (0{,}8,4{,}04)

    Gunakan regresi linear (V=a+bI) untuk mengestimasi resistansi resistor.

  4. Jelaskan mengapa regresi linear lebih cocok daripada interpolasi untuk data eksperimen yang mengandung noise.

  5. Pada percobaan pengisian kapasitor, diperoleh data:

    (t) dalam s(V) dalam V
    16,3
    28,7
    39,5
    49,8
    59,9

    Apakah regresi linear cocok untuk data ini? Jelaskan alasannya.

  6. Buat satu contoh kasus teknik elektro di mana regresi linear dapat digunakan untuk kalibrasi sensor.

  7. Jelaskan mengapa jumlah residual biasa tidak cukup untuk menilai kualitas garis regresi.


10.8 Rangkuman

  1. Regresi adalah metode untuk membangun model yang mewakili tren data.
  2. Regresi linear sederhana menggunakan model (y=a+bx).
  3. Berbeda dengan interpolasi, regresi tidak harus melewati semua titik data.
  4. Regresi cocok untuk data eksperimen yang mengandung noise.
  5. Metode kuadrat terkecil mencari garis yang meminimumkan jumlah kuadrat residual.
  6. Rumus slope adalah (b=\frac{n\sum x_i y_i-(\sum x_i)(\sum y_i)}{n\sum x_i^2-(\sum x_i)^2}).
  7. Rumus intercept adalah (a=\frac{\sum y_i-b\sum x_i}{n}).
  8. Parameter (a) menunjukkan nilai prediksi (y) saat (x=0).
  9. Parameter (b) menunjukkan perubahan (y) untuk setiap kenaikan satu satuan (x).
  10. Residual adalah selisih antara nilai data dan nilai prediksi regresi.
  11. SSE adalah jumlah kuadrat residual dan digunakan untuk menilai kualitas model.
  12. Regresi linear banyak digunakan dalam teknik elektro, seperti verifikasi Hukum Ohm, kalibrasi sensor, karakterisasi komponen, dan prediksi respons sistem.