multiarmed
Educação
Verbete 1 de 1
adjetivo
Contexto: "The multiarmed bandit problem is a fundamental framework in
reinforcement learning, where an agent must balance exploration and exploitation
across multiple actions to maximize cumulative reward over time."
Fonte: Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction. MIT Press.
Fonte: Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction. MIT Press.
Termo equivalente: Multiopcional
Definição: "Multiarmed refers to a scenario involving multiple choices or
options, often used in decision-making problems where each option has an associated
but uncertain reward."
Fonte: Lattimore, T., & Szepesvári, C. (2020). Bandit Algorithms. Cambridge University Press.
Fonte: Lattimore, T., & Szepesvári, C. (2020). Bandit Algorithms. Cambridge University Press.
Definição em português: "Multiarmed refere-se a um cenário com múltiplas opções ou ações, frequentemente empregado em problemas de tomada de decisão onde cada opção possui uma recompensa incerta associada."