Deep reinforcement learning main components that enable the estimation of the expected reward of any action of the action space of the agent conditioned to any state perceived by the agent.

<p>The learnt policy function is encoded by a deep neural network, enabling continuous-valued actions and spaces and any complexity of its mapping.</p>

محفوظ في:
التفاصيل البيبلوغرافية
المؤلف الرئيسي: Alejandra de-la-Rica-Escudero (20570535) (author)
مؤلفون آخرون: Eduardo C. Garrido-Merchán (18830597) (author), María Coronado-Vaca (20570538) (author)
منشور في: 2025
الموضوعات:
الوسوم: إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!