Glossário


Contribua com o glossário

multiarmed

Educação
Verbete 1 de 1

adjetivo

Contexto: "The multiarmed bandit problem is a fundamental framework in reinforcement learning, where an agent must balance exploration and exploitation across multiple actions to maximize cumulative reward over time."
Fonte: Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction. MIT Press.

Termo equivalente: Multiopcional

Definição: "Multiarmed refers to a scenario involving multiple choices or options, often used in decision-making problems where each option has an associated but uncertain reward."
Fonte: Lattimore, T., & Szepesvári, C. (2020). Bandit Algorithms. Cambridge University Press.

Definição em português: "Multiarmed refere-se a um cenário com múltiplas opções ou ações, frequentemente empregado em problemas de tomada de decisão onde cada opção possui uma recompensa incerta associada."