تخطي إلى المحتوى
VuFind
  • تسجيل الدخول
    • English
    • اللغة العربية
بحث متقدم
  • The win rate curves of <i>Lazy...
  • استشهد بهذا
  • أرسل هذا في رسالة قصيرة
  • أرسل هذا بالبريد الإلكتروني
  • طباعة
  • تصدير التسجيلة
    • تصدير إلى RefWorks
    • تصدير إلى EndNoteWeb
    • تصدير إلى EndNote
  • أضف إلى المفضلة
  • رابط دائم
The win rate curves of <i>LazyAct</i> and MAPPO.

The win rate curves of <i>LazyAct</i> and MAPPO.

<p><i>LazyAct</i> starts training from an unconstrained pre-trained model.</p>

محفوظ في:
التفاصيل البيبلوغرافية
المؤلف الرئيسي: Hongjie Zhang (136127) (author)
مؤلفون آخرون: Zhenyu Chen (2359471) (author), Hourui Deng (20685396) (author), Chaosheng Feng (20685399) (author)
منشور في: 2025
الموضوعات:
Medicine
Biotechnology
Sociology
Developmental Biology
Science Policy
Environmental Sciences not elsewhere classified
Biological Sciences not elsewhere classified
Information Systems not elsewhere classified
state skipping branch
h ?\ rlkey
h ?% 5crlkey
establish optimization objectives
deep reinforcement learning
achieved significant success
high computational cost
div >< p
algorithm significantly reduces
computational cost
utilize pre
tuning techniques
practical application
policies based
minimal impact
mappo frameworks
making tasks
making patterns
linear increase
lazy actor
involve reasoning
human decision
flops required
decision made
continuous decision
complex decision
complete tasks
approximately 80
actor network
الوسوم: إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
  • المقتنيات
  • الوصف
  • التعليقات
  • مواد مشابهة
  • عرض للأخصائي

مواد مشابهة

  • The data of LazyAct.
    حسب: Hongjie Zhang (136127)
    منشور في: (2025)
  • The source code of LazyAct.
    حسب: Hongjie Zhang (136127)
    منشور في: (2025)
  • Single agent and multi-agents tasks for <i>LazyAct</i>.
    حسب: Hongjie Zhang (136127)
    منشور في: (2025)
  • Visualization on SMAC-25m based on <i>LazyAct</i>.
    حسب: Hongjie Zhang (136127)
    منشور في: (2025)
  • The score curves of <i>LazyAct</i>, IMPALA and TempoRL.
    حسب: Hongjie Zhang (136127)
    منشور في: (2025)

ابحث عن المزيد

  • استعراض الفهرس
  • استعرض أبجدياً
  • اكتشف القنوات
  • الحجز الأكاديمي
  • مواد جديدة
Cannot write session to /tmp/vufind_sessions/sess_pv002qqknvarik5el49lgsrhc6