Bayesian statistic adalah teori dalam bidang statistik berdasarkan interpretasi bayes yang mengekspresikan probabilitas sebagai derajat kepercayaan pada sebuah event. Derajat kepercayaan ini dapat didasarkan kepada pengetahuan prior dari event tersebut seperti hasil dari eksperimen sebelumnya atau kepercayaan personal mengenai sebuah event. Hal ini berbeda dengan interpretasi dari pendekatan probabilitas lainnya seperti frekuentist yang memandang probabilitas sebagai limit dari frekuensi relatif event setelah melakukan banyak percobaan.
Metode statistik ini menggunakan teorema bayes untuk menghitung dan mengupdate probabilitas setelah mendapatkan data baru. Teorema bayes menggambarkan probabilitas bersyarat dari suatu peristiwa berdasarkan data maupun informasi/kepercayaan tentang kondisi yang berhubungan dengan peristiwa tersebut.
Dalam paradigma bayesian, semuanya adalah variabel acak. Dalam konteks reinforcement learning, reward dapat dari rata-rata, dan rata-rata tersebut didapatkan dari sebuah distribusi. Karena semuanya adalah random variabel maka semuanya memiliki distribusi.
Untuk menentukan distibusi dari rata-rata yang kemudian kita sebut sebagai \[ \vec{A} = 5\hat{x} + 4\hat{y} \]
Tidak ada komentar:
Posting Komentar