Improving Generalization and Data Efficiency with Diffusion in Offline Multi-agent RL

Zhuoran Li, Ling Pan, Jiatai Huang, Longbo Huang

Thursday at 04:00

5 Visningar

0 Kommentarer

arXiv:2307.01472v2 Announce Type: replace Abstract: We present a novel Diffusion Offline Multi-agent Model (DOM2) for offline Multi-Agent Reinforcement Learning (MARL). Different from existing algorithms that rely mainly on conservatism in policy design, DOM2 enhances policy expressiveness and diversity based on diffusion model. Specifically, we...

Läs hela artikeln hos källan.

Läs originalartikeln

Var detta hjälpsamt?

Dela:

Kommentarer (0)

Vänligen logga in för att publicera en kommentar

Inga kommentarer ännu. Bli först med att kommentera!

Relaterade nyheter

Myndighed frygter forbud om ransomware-betaling: »Vi får et mindre korrekt billede af situationen«

14 hours ago

Bläddra efter kategori

blog crypto news privacy sysadmin technology

Länk kopierad till urklipp

Improving Generalization and Data Efficiency with Diffusion in Offline Multi-agent RL

Kommentarer (0)

Relaterade nyheter

Chipmaker Nvidia seeks to raise over $25B in first bond deal since 2021

De vann kärnkraftskampen – Viktigast: hålla tid och budget

[Ekstra] Sopra Steria: Hun er ny leder

Kurven knækker efter rekordår: Mystisk fald i smitte med dødelig vandbakterie

Myndighed frygter forbud om ransomware-betaling: »Vi får et mindre korrekt billede af situationen«

Bläddra efter kategori