Confidence level / statistical significance

Disarikan dari sini
alternatif tontonan

Kasus: Beli kayu sepanjang 8 kaki
L=8
Hipotesis alternatif: Penjualnya curang, panjang kayunya kurang dari 8 kaki
Ha = L<8
Null hypothesis: Ho: L>=8

Cari: p-value

Misal, p-value 0.05, maka
– confidence level = 95%
– 95% sure that the null hypothesis is false as a minimum for statistical significance
– 95% yakin bahwa Ho salah sebagai minimum untuk statistical significance
– berarti dalam 20 kali eksperiment, 1 kali salah

Cara mencari p-value
1. Cari rata-rata/mean/average: miu
miu = sum of observations / number of measurement = sigma-from-1-to-n xn / n

2. Cari standar deviasi: s
– akar {[sigma-from-1-to-n (miu – xn)^2] / n-1}

3. Cari standar normal: z
– z = (miu – Ho)/s

4. Bandingkan nilai z ini dengan nilai z untuk confidence level
– kalau nilai Z lebih negatif dari -1.645 (dari mana ya?), maka hipotesis bahwa ukuran papan lebih kecil dari 8 kaki memiliki confidence level lebih besar dari 95%
if Z < -1.645, then Confidence Level > 95%
– berarti: rejecting null hypothesis, Ho
– berarti miu statistically significant

Advertisements

Estimasi statistik

Disarikan dari sini

KONSEP DASAR

1. Peluang

  >> Ruang peluang (probability space)
>> Distribusi dan kepadatan (density)
>> Variabel acak Gaussian (Gaussian RV)
>> Pengkondisian
>> Ekspektasi kondisional
>> Aturan Bayes

2. Masalah estimasi

Konsep solusi umum:
– Deterministic framework (least-square problem)
– Non-bayesian framework (MLE)
– Bayesian framework (MAP, MMSE)

3. Framework Bayes

Diketahui:
– prior distribution
– conditional distribution

Solusi umum:
– Mean Square Error (MSE) estimator
– Maximum a-Posteriori (MAP) estimator

4. MMSE Estimator

Rumit

5. Linear MMSE (LMMSE) Estimator

6. ML Estimator

Non-Bayesian setting

 

Prior probability dan posterior probability

Disarikan dari sini, direvisi dengan membaca contoh di sini dan di sini

Sering bingung bedanya prior probability sama posterior probability? Kerjain soal berikut 🙂
Ever wonder what is the difference between prior probability and posterior probability? Try to solve the question below:

Diketahui dalam suatu populasi, 0.01 penduduknya mengidap kanker.
Jika seseorang menjalani suatu test dengan sensitivitas test 99% dan spesifisitas 95%, maka:
Berapakah peluang seseorang tersebut mengidap kanker jika diketahui hasil test-nya positif?

A population has proportion of cancer-infected individuals 0.01.
If a cancer test has specificity 95% and sensitivity 99%, then:
What is the conditional probability that a person has cancer if he/she has tested positive?

Answer: 0.1667 atau 16.67%

More detail (with 4 approaches): click here

Apa yang bisa ditarik dari soal di atas?
bahwa suatu experiment/test bisa merubah nilai peluang/probabilitas suatu event

PENINGKATAN PELUANG
– pada soal di atas, peluang seseorang mengidap kanker sebelum dites adalah 1%, atau 0.01
– setelah di-tes dan hasilnya positif, peluangnya naik dari 1% menjadi 16.67%

PENURUNAN PELUANG
– walaupun hasil tes medis seseorang positif, dengan sensitivitas test 99% dan spesifisitas 95%, peluang seseorang mengidap kanker (diketahui prior probability nya 1%) bukan 100% tapi 16.67%
– penurunan peluang ini disebabkan oleh
>> rendahnya peluang seseorang mengidap kanker dalam populasi tersebut (1%)
>> ada kemungkinan ketidak-akuratan hasil tes, ditunjukkan dengan nilai sensitivitas dan spesifisitas yang tidak mencapai 100%

Applied Statistic

Pertama kali dapet statistik yang “neko2”, saya pikir “buat apa sih?”
Apalagi contohnya kartu dan dadu.. hehehe.. kan kepikirannya: saya ga ada rencana judi kok, atau ngitung peluang cuaca, misalnya.

Ternyata ngerjain speech dan banyak tipe data-processing lainnya (misal image processing untuk robot) butuh banget statistik jenis advanced begini. Kualitas suatu sistem dapat diperbaiki jika kita belajar dari data2 yang sudah kita peroleh sebelumnya.

Akhirnya hari ini iseng2 bikin pdf untuk applied statistic, lumayan buat pegangan klo lupa lagi..
Disusun dengan gaya bahasa yang bisa dimengerti diri sendiri..

Meliputi random variable, bayes, covariance, correlation, cross correlation, dsb.

monggo diklik di AppliedStatistics