AulaPro menggunakan cookie untuk memberikan pengalaman yang lebih baik kepada penggunanya. Anda bisa mendapatkan informasi lebih lanjut di sini, atau cukup klik "Saya menerima" atau di luar pemberitahuan ini untuk melanjutkan penelusuran.
Kursus virtual "Prediksi dan Kontrol dengan Perkiraan Fungsi - Kursus Virtual - Coursera", adalah kursus dengan konten berbeda dan menawarkan kelas video . Jelajahi fitur-fitur pentingnya, dan klik tombol oranye untuk informasi mendetail di platform e-Learning Coursera.
Dalam kursus ini, Anda akan belajar memecahkan masalah dengan ruang keadaan besar, berdimensi tinggi, dan berpotensi tak terbatas. Anda akan melihat bahwa estimasi fungsi nilai dapat diubah menjadi masalah pembelajaran yang diawasi (perkiraan fungsi), memungkinkan Anda membuat agen yang menyeimbangkan generalisasi dan diskriminasi dengan hati-hati untuk memaksimalkan hasil. Kami akan memulai perjalanan ini dengan menyelidiki bagaimana evaluasi kebijakan atau metode prediksi kami seperti Monte Carlo dan TD dapat diperluas ke konfigurasi fungsi perkiraan. Anda akan belajar tentang teknik konstruksi fitur untuk RL dan pembelajaran representasi melalui jaringan saraf dan backprop. Kami mengakhiri kursus ini dengan mendalami metode gradien kebijakan; cara untuk mempelajari kebijakan secara langsung tanpa mempelajari fungsi nilai. Dalam kursus ini, Anda akan menyelesaikan dua tugas kontrol keadaan berkelanjutan dan menyelidiki manfaat metode gradien kebijakan dalam lingkungan tindakan berkelanjutan. Prasyarat: Kursus ini sangat dibangun di atas dasar Kursus 1 dan 2, dan siswa harus telah menyelesaikannya sebelum memulai kursus ini. Siswa juga harus terbiasa dengan probabilitas dan ekspektasi, aljabar linier dasar, kalkulus dasar, Python 3.0 (setidaknya 1 tahun), dan mengimplementasikan algoritme dari kodesemu. Pada akhir kursus ini, Anda akan dapat: -Memahami bagaimana menggunakan pendekatan pembelajaran terawasi untuk memperkirakan fungsi nilai -Memahami tujuan untuk prediksi (estimasi nilai) di bawah perkiraan fungsi -Menerapkan TD dengan perkiraan fungsi (agregasi keadaan),
Persiapkan diri Anda dari rumah dengan universitas paling bergengsi di dunia.
Kualitas kursus Coursera didukung oleh instrukturnya yang sering menjadi dekan dan bergelar doktor.
Lebih dari 85% siswa Coursera melaporkan manfaat karir, seperti promosi atau kenaikan gaji.
Jutaan siswa di seluruh dunia memenuhi tujuan pribadi dan profesional mereka dengan Coursera.
Coursera menawarkan kursus dari lebih dari 200 universitas dan perusahaan terkemuka untuk memberikan pembelajaran online di seluruh dunia. Dengan berlangganan Coursera Plus, Anda mendapatkan akses tak terbatas ke lebih dari 90% dari semua kursus, dan sertifikat dan spesialisasi profesional paling populer di Coursera.
Ilmu data, pengembangan bisnis dan pribadi. Anda dapat mendaftar di beberapa kursus sekaligus, mendapatkan sertifikat tanpa batas, dan mempelajari keterampilan kerja yang dibutuhkan untuk memulai, mengembangkan, dan bahkan mengubah karier.
TEMUKAN CARA MENDAPATKAN PALING BANYAK, DAN HEMAT LEBIH DARI USD $500 DENGAN BERLANGGANAN TAHUNAN KE COURSERA PLUS*
*Anda menghemat hingga USD$500 dalam 12 bulan, mulai dari membayar USD$59 untuk langganan bulanan, menjadi langganan tahunan dengan promosi ini. Langganan tahunan normal adalah USD $399. Dengan promosi ini, Anda hanya akan membayar USD $299. Cari tahu semuanya dengan mengklik tombol kuning.
Halo ada yang bisa saya bantu? Apakah Anda tertarik dengan kursus? Tentang mata pelajaran apa?
AulaPro menggunakan cookie untuk memberikan pengalaman yang lebih baik kepada penggunanya. Anda bisa mendapatkan informasi lebih lanjut di sini, atau cukup klik "Saya menerima" atau di luar pemberitahuan ini untuk melanjutkan penelusuran.
Menambahkan review