Implementasi Agent Deep Reinforcement Learning Menggunakan Proximal Policy Optimization Dengan Reward Shaping Dan Evaluasi Multi – Metrik Pada Environment Humanoid.

C2255201075