Implementasi Agent Deep Reinforcement Learning Menggunakan Proximal Policy Optimization Dengan Reward Shaping Dan Evaluasi Multi – Metrik Pada Environment Humanoid

C2255201075