`Learning.sumRewards`🔗

`sumRewards`🔗

DefinitionLearning.sumRewards

Details

Sum of rewards obtained when pulling action a up to time t (exclusive).

def

Learning.sumRewards.{u_1, u_3} {𝓐 : Type u_1} {Ω : Type u_3}
  [DecidableEq 𝓐] (A : ℕ → Ω → 𝓐) (R' : ℕ → Ω → ℝ) (a : 𝓐) (t : ℕ)
  (ω : Ω) : ℝ
Learning.sumRewards.{u_1, u_3}
  {𝓐 : Type u_1} {Ω : Type u_3}
  [DecidableEq 𝓐] (A : ℕ → Ω → 𝓐)
  (R' : ℕ → Ω → ℝ) (a : 𝓐) (t : ℕ)
  (ω : Ω) : ℝ

Code

def sumRewards (A : ℕ → Ω → 𝓐) (R' : ℕ → Ω → ℝ) (a : 𝓐) (t : ℕ) (ω : Ω) : ℝ :=
  ∑ s ∈ range t, if A s ω = a then R' s ω else 0

Used by (44)

probReal_sumRewards_le_sumRewards_le
prob_exists_pullCount_eq_and_sumRewards_mem_le
prob_pullCount_eq_and_sumRewards_mem_le
prob_pullCount_mem_and_sumRewards_mem_le
prob_pullCount_prod_sumRewards_mem_le
prob_sumRewards_mem_le
prob_sumRewards_sub_pullCount_mul_ge_le
prob_sumRewards_sub_pullCount_mul_ge_le_of_Fintype
prob_sumRewards_sub_pullCount_mul_le_le
sumRewards_eq_comp
empMean
empMean_add_one_eq_empMean'
empMean_eq_empMean'
measurable_empMean
measurable_sumRewards
measurable_uncurry_empMean_comp
measurable_uncurry_sumRewards_comp
sumRewards_add_one
sumRewards_add_one_eq_sumRewards'
sumRewards_eq_of_pullCount_eq
sumRewards_eq_pullCount_mul_empMean
sumRewards_eq_sumRewards'
sumRewards_sub_pullCount_mul_eq_sum
sumRewards_zero
sum_rewardByCount_eq_sumRewards
probReal_sumRewards_le_sumRewards_le
prob_exists_pullCount_eq_and_sumRewards_mem_le
prob_pullCount_mem_and_sumRewards_mem_le
prob_pullCount_prod_sumRewards_mem_le
prob_sumRewards_le_sumRewards_le
sumRewards_eq
probReal_sumRewards_le_sumRewards_le
prob_arm_mul_eq_le
sumRewards_bestArm_le_of_arm_mul_eq
adapted_sumRewards_add_one
identDistrib_pullCount_sumRewards
isPredictable_empMean
isPredictable_sumRewards
law_pullCount_sumRewards_unique
law_pullCount_sumRewards_unique'
law_sumRewards_unique
stronglyAdapted_sumRewards_add_one
prob_empMean_bestAction_sub_actionMean_le_le
prob_empMean_sub_actionMean_ge_le

Actions: Source · Open Issue

Learning.sumRewards🔗

sumRewards🔗

`Learning.sumRewards`🔗

`sumRewards`🔗