SequentialLearning.EvaluationEnv

`onlineEvalEnv`🔗

DefinitionLearning.onlineEvalEnv

Details

The evaluation environment where the feedback is given by evaluating a fixed measurable function f at the chosen action.

def

Learning.onlineEvalEnv.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨} (g : ℕ → 𝓐 → 𝓨)
  (hg : ∀ (n : ℕ), Measurable (g n)) : Environment 𝓐 𝓨
Learning.onlineEvalEnv.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} (g : ℕ → 𝓐 → 𝓨)
  (hg : ∀ (n : ℕ), Measurable (g n)) :
  Environment 𝓐 𝓨

Code

noncomputable def onlineEvalEnv (g : ℕ → 𝓐 → 𝓨) (hg : ∀ n, Measurable (g n)) :=
  obliviousEnv (fun n ↦ Kernel.deterministic (g n) (hg n))

Type uses (1)

Environment

Body uses (1)

obliviousEnv

Used by (11)

Actions: Source · Open Issue

`instIsObliviousEnvOnlineEvalEnv`🔗

InstanceLearning.instIsObliviousEnvOnlineEvalEnv

Details

No docstring.

theorem

Learning.instIsObliviousEnvOnlineEvalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {g : ℕ → 𝓐 → 𝓨} {hg : ∀ (n : ℕ), Measurable (g n)} :
  IsObliviousEnv (onlineEvalEnv g hg)
Learning.instIsObliviousEnvOnlineEvalEnv.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)} :
  IsObliviousEnv (onlineEvalEnv g hg)

Code

instance : IsObliviousEnv (onlineEvalEnv g hg)

Type uses (2)

Body uses (1)

Environment

Used by (3)

Actions: Source · Open Issue

Proof

⟨⟨fun n ↦ Kernel.deterministic (g n) (hg n), fun _ ↦ inferInstance, rfl, fun _ ↦ rfl⟩⟩

`instIsDeterministicEnvOnlineEvalEnv`🔗

InstanceLearning.instIsDeterministicEnvOnlineEvalEnv

Details

No docstring.

theorem

Learning.instIsDeterministicEnvOnlineEvalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {g : ℕ → 𝓐 → 𝓨} {hg : ∀ (n : ℕ), Measurable (g n)} :
  IsDeterministicEnv (onlineEvalEnv g hg)
Learning.instIsDeterministicEnvOnlineEvalEnv.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)} :
  IsDeterministicEnv (onlineEvalEnv g hg)

Code

instance : IsDeterministicEnv (onlineEvalEnv g hg) where
  exists_f0

Type uses (2)

Body uses (1)

Environment

Used by (3)

Actions: Source · Open Issue

Proof

⟨g 0, hg 0, rfl⟩
  exists_f n := ⟨fun p ↦ g (n + 1) p.2, by fun_prop, rfl⟩

`feedbackCondAction_onlineEvalEnv`🔗

LemmaLearning.feedbackCondAction_onlineEvalEnv

Details

No docstring.

theorem

Learning.feedbackCondAction_onlineEvalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {g : ℕ → 𝓐 → 𝓨} {hg : ∀ (n : ℕ), Measurable (g n)} (n : ℕ) :
  feedbackCondAction (onlineEvalEnv g hg) n =
    ProbabilityTheory.Kernel.deterministic (g n) ⋯
Learning.feedbackCondAction_onlineEvalEnv.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)}
  (n : ℕ) :
  feedbackCondAction (onlineEvalEnv g hg)
      n =
    ProbabilityTheory.Kernel.deterministic
      (g n) ⋯

Code

lemma feedbackCondAction_onlineEvalEnv (n : ℕ) :
    feedbackCondAction (onlineEvalEnv g hg) n = Kernel.deterministic (g n) (hg n)

Type uses (3)

Body uses (1)

feedbackCondAction_obliviousEnv

Used by (2)

Actions: Source · Open Issue

Proof

by
  simp [onlineEvalEnv]

`feedbackFunZero_onlineEvalEnv`🔗

LemmaLearning.feedbackFunZero_onlineEvalEnv

Details

No docstring.

theorem

Learning.feedbackFunZero_onlineEvalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {g : ℕ → 𝓐 → 𝓨} {hg : ∀ (n : ℕ), Measurable (g n)}
  [MeasurableSpace.SeparatesPoints 𝓨] :
  feedbackFunZero (onlineEvalEnv g hg) = g 0
Learning.feedbackFunZero_onlineEvalEnv.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)}
  [MeasurableSpace.SeparatesPoints 𝓨] :
  feedbackFunZero (onlineEvalEnv g hg) =
    g 0

Code

lemma feedbackFunZero_onlineEvalEnv [MeasurableSpace.SeparatesPoints 𝓨] :
    feedbackFunZero (onlineEvalEnv g hg) = g 0

Type uses (3)

Body uses (6)

Used by (1)

feedbackFunZero_evalEnv

Actions: Source · Open Issue

Proof

by
  have h_eq := ν0_eq_deterministic (onlineEvalEnv g hg)
  simpa only [onlineEvalEnv, ν0_obliviousEnv, Kernel.prodMkLeft_deterministic,
    Kernel.deterministic_inj] using h_eq.symm

`feedbackFun_onlineEvalEnv`🔗

LemmaLearning.feedbackFun_onlineEvalEnv

Details

No docstring.

theorem

Learning.feedbackFun_onlineEvalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {g : ℕ → 𝓐 → 𝓨} {hg : ∀ (n : ℕ), Measurable (g n)}
  [MeasurableSpace.SeparatesPoints 𝓨] (n : ℕ) :
  feedbackFun (onlineEvalEnv g hg) n = fun p => g (n + 1) (Prod.snd p)
Learning.feedbackFun_onlineEvalEnv.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)}
  [MeasurableSpace.SeparatesPoints 𝓨]
  (n : ℕ) :
  feedbackFun (onlineEvalEnv g hg) n =
    fun p => g (n + 1) (Prod.snd p)

Code

lemma feedbackFun_onlineEvalEnv [MeasurableSpace.SeparatesPoints 𝓨] (n : ℕ) :
    feedbackFun (onlineEvalEnv g hg) n = fun p ↦ g (n + 1) p.2

Type uses (3)

Body uses (7)

Used by (1)

feedbackFun_evalEnv

Actions: Source · Open Issue

Proof

by
  have h_eq := feedback_eq_deterministic (onlineEvalEnv g hg) n
  simpa only [onlineEvalEnv, feedback_obliviousEnv, Kernel.prodMkLeft_deterministic,
    Kernel.deterministic_inj] using h_eq.symm

`hascondDistrib_feedback_onlineEvalEnv`🔗

LemmaLearning.hascondDistrib_feedback_onlineEvalEnv

Details

No docstring.

theorem

Learning.hascondDistrib_feedback_onlineEvalEnv.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)} {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P] {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  (h : IsAlgEnvSeq A Y alg (onlineEvalEnv g hg) P) (n : ℕ) :
  ProbabilityTheory.HasCondDistrib (Y n) (A n)
    (ProbabilityTheory.Kernel.deterministic (g n) ⋯) P
Learning.hascondDistrib_feedback_onlineEvalEnv.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  (h :
    IsAlgEnvSeq A Y alg
      (onlineEvalEnv g hg) P)
  (n : ℕ) :
  ProbabilityTheory.HasCondDistrib (Y n)
    (A n)
    (ProbabilityTheory.Kernel.deterministic
      (g n) ⋯)
    P

Code

lemma hascondDistrib_feedback_onlineEvalEnv
    (h : IsAlgEnvSeq A Y alg (onlineEvalEnv g hg) P) (n : ℕ) :
    HasCondDistrib (Y n) (A n) (Kernel.deterministic (g n) (hg n)) P

Type uses (3)

Body uses (4)

Used by (1)

feedback_onlineEvalEnv_ae_eq_eval_action

Actions: Source · Open Issue

Proof

by
  simpa using IsObliviousEnv.hasCondDistrib_feedback h n

`feedback_onlineEvalEnv_ae_eq_eval_action`🔗

LemmaLearning.feedback_onlineEvalEnv_ae_eq_eval_action

Details

No docstring.

theorem

Learning.feedback_onlineEvalEnv_ae_eq_eval_action.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)} {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P] {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [StandardBorelSpace 𝓨] [Nonempty 𝓨]
  (h : IsAlgEnvSeq A Y alg (onlineEvalEnv g hg) P) (n : ℕ) :
  Y n =ᵐ[P] g n ∘ A n
Learning.feedback_onlineEvalEnv_ae_eq_eval_action.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [StandardBorelSpace 𝓨] [Nonempty 𝓨]
  (h :
    IsAlgEnvSeq A Y alg
      (onlineEvalEnv g hg) P)
  (n : ℕ) : Y n =ᵐ[P] g n ∘ A n

Code

lemma feedback_onlineEvalEnv_ae_eq_eval_action [StandardBorelSpace 𝓨] [Nonempty 𝓨]
    (h : IsAlgEnvSeq A Y alg (onlineEvalEnv g hg) P) (n : ℕ) :
    Y n =ᵐ[P] g n ∘ A n

Type uses (3)

Body uses (4)

Used by (2)

Actions: Source · Open Issue

Proof

ae_eq_of_condDistrib_eq_deterministic (hg n) (h.measurable_action n).aemeasurable
    (h.measurable_feedback n).aemeasurable
    (hascondDistrib_feedback_onlineEvalEnv h n).condDistrib_eq

`forall_feedback_onlineEvalEnv_ae_eq_eval_action`🔗

LemmaLearning.forall_feedback_onlineEvalEnv_ae_eq_eval_action

Details

No docstring.

theorem

Learning.forall_feedback_onlineEvalEnv_ae_eq_eval_action.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)} {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P] {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [StandardBorelSpace 𝓨] [Nonempty 𝓨]
  (h : IsAlgEnvSeq A Y alg (onlineEvalEnv g hg) P) :
  ∀ᵐ (ω : Ω) ∂P, ∀ (n : ℕ), Y n ω = g n (A n ω)
Learning.forall_feedback_onlineEvalEnv_ae_eq_eval_action.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {g : ℕ → 𝓐 → 𝓨}
  {hg : ∀ (n : ℕ), Measurable (g n)}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [StandardBorelSpace 𝓨] [Nonempty 𝓨]
  (h :
    IsAlgEnvSeq A Y alg
      (onlineEvalEnv g hg) P) :
  ∀ᵐ (ω : Ω) ∂P,
    ∀ (n : ℕ), Y n ω = g n (A n ω)

Code

lemma forall_feedback_onlineEvalEnv_ae_eq_eval_action [StandardBorelSpace 𝓨] [Nonempty 𝓨]
    (h : IsAlgEnvSeq A Y alg (onlineEvalEnv g hg) P) :
    ∀ᵐ ω ∂P, ∀ n, Y n ω = g n (A n ω)

Type uses (3)

Body uses (1)

feedback_onlineEvalEnv_ae_eq_eval_action

Used by (1)

forall_feedback_evalEnv_ae_eq_eval_action

Actions: Source · Open Issue

Proof

by
  rw [ae_all_iff]
  intro n
  exact feedback_onlineEvalEnv_ae_eq_eval_action h n

`evalEnv`🔗

DefinitionLearning.evalEnv

Details

The evaluation environment where the feedback is given by evaluating a fixed measurable function f at the chosen action.

def

Learning.evalEnv.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨} (f : 𝓐 → 𝓨)
  (hf : Measurable f) : Environment 𝓐 𝓨
Learning.evalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} (f : 𝓐 → 𝓨)
  (hf : Measurable f) : Environment 𝓐 𝓨

Code

noncomputable def evalEnv (f : 𝓐 → 𝓨) (hf : Measurable f) := onlineEvalEnv (fun _ ↦ f) (fun _ ↦ hf)

Type uses (1)

Environment

Body uses (1)

onlineEvalEnv

Used by (9)

Actions: Source · Open Issue

`instIsObliviousEnvEvalEnv`🔗

InstanceLearning.instIsObliviousEnvEvalEnv

Details

No docstring.

theorem

Learning.instIsObliviousEnvEvalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {f : 𝓐 → 𝓨} {hf : Measurable f} : IsObliviousEnv (evalEnv f hf)
Learning.instIsObliviousEnvEvalEnv.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f} :
  IsObliviousEnv (evalEnv f hf)

Code

instance : IsObliviousEnv (evalEnv f hf)

Type uses (2)

Body uses (2)

Used by (2)

Actions: Source · Open Issue

Proof

by unfold evalEnv; infer_instance

`instIsDeterministicEnvEvalEnv`🔗

InstanceLearning.instIsDeterministicEnvEvalEnv

Details

No docstring.

theorem

Learning.instIsDeterministicEnvEvalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {f : 𝓐 → 𝓨} {hf : Measurable f} : IsDeterministicEnv (evalEnv f hf)
Learning.instIsDeterministicEnvEvalEnv.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f} :
  IsDeterministicEnv (evalEnv f hf)

Code

instance : IsDeterministicEnv (evalEnv f hf)

Type uses (2)

Body uses (2)

Used by (2)

Actions: Source · Open Issue

Proof

by unfold evalEnv; infer_instance

`feedbackCondAction_evalEnv`🔗

LemmaLearning.feedbackCondAction_evalEnv

Details

No docstring.

theorem

Learning.feedbackCondAction_evalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {f : 𝓐 → 𝓨} {hf : Measurable f} (n : ℕ) :
  feedbackCondAction (evalEnv f hf) n =
    ProbabilityTheory.Kernel.deterministic f hf
Learning.feedbackCondAction_evalEnv.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f} (n : ℕ) :
  feedbackCondAction (evalEnv f hf) n =
    ProbabilityTheory.Kernel.deterministic
      f hf

Code

lemma feedbackCondAction_evalEnv (n : ℕ) :
    feedbackCondAction (evalEnv f hf) n = Kernel.deterministic f hf

Type uses (3)

Body uses (1)

feedbackCondAction_onlineEvalEnv

Used by (1)

hascondDistrib_feedback_evalEnv

Actions: Source · Open Issue

Proof

by simp [evalEnv]

`feedbackFunZero_evalEnv`🔗

LemmaLearning.feedbackFunZero_evalEnv

Details

No docstring.

theorem

Learning.feedbackFunZero_evalEnv.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {f : 𝓐 → 𝓨} {hf : Measurable f} [MeasurableSpace.SeparatesPoints 𝓨] :
  feedbackFunZero (evalEnv f hf) = f
Learning.feedbackFunZero_evalEnv.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f}
  [MeasurableSpace.SeparatesPoints 𝓨] :
  feedbackFunZero (evalEnv f hf) = f

Code

lemma feedbackFunZero_evalEnv [MeasurableSpace.SeparatesPoints 𝓨] :
    feedbackFunZero (evalEnv f hf) = f

Type uses (3)

Body uses (1)

feedbackFunZero_onlineEvalEnv

Actions: Source · Open Issue

Proof

by simp [evalEnv]

`feedbackFun_evalEnv`🔗

LemmaLearning.feedbackFun_evalEnv

Details

No docstring.

theorem

Learning.feedbackFun_evalEnv.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f} [MeasurableSpace.SeparatesPoints 𝓨] (n : ℕ) :
  feedbackFun (evalEnv f hf) n = fun p => f (Prod.snd p)
Learning.feedbackFun_evalEnv.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f}
  [MeasurableSpace.SeparatesPoints 𝓨]
  (n : ℕ) :
  feedbackFun (evalEnv f hf) n = fun p =>
    f (Prod.snd p)

Code

lemma feedbackFun_evalEnv [MeasurableSpace.SeparatesPoints 𝓨] (n : ℕ) :
    feedbackFun (evalEnv f hf) n = fun p ↦ f p.2

Type uses (3)

Body uses (1)

feedbackFun_onlineEvalEnv

Actions: Source · Open Issue

Proof

by simp [evalEnv]

`hascondDistrib_feedback_evalEnv`🔗

LemmaLearning.hascondDistrib_feedback_evalEnv

Details

No docstring.

theorem

Learning.hascondDistrib_feedback_evalEnv.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {Ω : Type u_3} {mΩ : MeasurableSpace Ω} {alg : Algorithm 𝓐 𝓨}
  {f : 𝓐 → 𝓨} {hf : Measurable f} {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P] {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  (h : IsAlgEnvSeq A Y alg (evalEnv f hf) P) (n : ℕ) :
  ProbabilityTheory.HasCondDistrib (Y n) (A n)
    (ProbabilityTheory.Kernel.deterministic f hf) P
Learning.hascondDistrib_feedback_evalEnv.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  (h :
    IsAlgEnvSeq A Y alg (evalEnv f hf) P)
  (n : ℕ) :
  ProbabilityTheory.HasCondDistrib (Y n)
    (A n)
    (ProbabilityTheory.Kernel.deterministic
      f hf)
    P

Code

lemma hascondDistrib_feedback_evalEnv (h : IsAlgEnvSeq A Y alg (evalEnv f hf) P) (n : ℕ) :
    HasCondDistrib (Y n) (A n) (Kernel.deterministic f hf) P

Type uses (3)

Body uses (4)

Actions: Source · Open Issue

Proof

by
  simpa using IsObliviousEnv.hasCondDistrib_feedback h n

`feedback_evalEnv_ae_eq_eval_action`🔗

LemmaLearning.feedback_evalEnv_ae_eq_eval_action

Details

No docstring.

theorem

Learning.feedback_evalEnv_ae_eq_eval_action.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {f : 𝓐 → 𝓨} {hf : Measurable f}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [StandardBorelSpace 𝓨] [Nonempty 𝓨]
  (h : IsAlgEnvSeq A Y alg (evalEnv f hf) P) (n : ℕ) : Y n =ᵐ[P] f ∘ A n
Learning.feedback_evalEnv_ae_eq_eval_action.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [StandardBorelSpace 𝓨] [Nonempty 𝓨]
  (h :
    IsAlgEnvSeq A Y alg (evalEnv f hf) P)
  (n : ℕ) : Y n =ᵐ[P] f ∘ A n

Code

lemma feedback_evalEnv_ae_eq_eval_action [StandardBorelSpace 𝓨] [Nonempty 𝓨]
  (h : IsAlgEnvSeq A Y alg (evalEnv f hf) P) (n : ℕ) :
    Y n =ᵐ[P] f ∘ A n

Type uses (3)

Body uses (1)

feedback_onlineEvalEnv_ae_eq_eval_action

Actions: Source · Open Issue

Proof

feedback_onlineEvalEnv_ae_eq_eval_action h n

`forall_feedback_evalEnv_ae_eq_eval_action`🔗

LemmaLearning.forall_feedback_evalEnv_ae_eq_eval_action

Details

No docstring.

theorem

Learning.forall_feedback_evalEnv_ae_eq_eval_action.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {f : 𝓐 → 𝓨} {hf : Measurable f}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [StandardBorelSpace 𝓨] [Nonempty 𝓨]
  (h : IsAlgEnvSeq A Y alg (evalEnv f hf) P) :
  ∀ᵐ (ω : Ω) ∂P, ∀ (n : ℕ), Y n ω = f (A n ω)
Learning.forall_feedback_evalEnv_ae_eq_eval_action.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [StandardBorelSpace 𝓨] [Nonempty 𝓨]
  (h :
    IsAlgEnvSeq A Y alg (evalEnv f hf)
      P) :
  ∀ᵐ (ω : Ω) ∂P,
    ∀ (n : ℕ), Y n ω = f (A n ω)

Code

lemma forall_feedback_evalEnv_ae_eq_eval_action [StandardBorelSpace 𝓨] [Nonempty 𝓨]
    (h : IsAlgEnvSeq A Y alg (evalEnv f hf) P) :
    ∀ᵐ ω ∂P, ∀ n, Y n ω = f (A n ω)

Type uses (3)

Body uses (1)

forall_feedback_onlineEvalEnv_ae_eq_eval_action

Used by (1)

feedback_evalEnv_ae_eq_eval_action_comp

Actions: Source · Open Issue

Proof

forall_feedback_onlineEvalEnv_ae_eq_eval_action h

`feedback_evalEnv_ae_eq_eval_action_comp`🔗

LemmaLearning.feedback_evalEnv_ae_eq_eval_action_comp

Details

No docstring.

theorem

Learning.feedback_evalEnv_ae_eq_eval_action_comp.{u_1, u_2, u_3, u_4}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {f : 𝓐 → 𝓨} {hf : Measurable f}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {β : Type u_4} [StandardBorelSpace 𝓨]
  [Nonempty 𝓨] (h : IsAlgEnvSeq A Y alg (evalEnv f hf) P) {n : ℕ}
  (g : (↥(Finset.Iic n) → 𝓨) → β) :
  ∀ᵐ (ω : Ω) ∂P, (g fun i => Y (↑i) ω) = g fun i => f (A (↑i) ω)
Learning.feedback_evalEnv_ae_eq_eval_action_comp.{u_1,
    u_2, u_3, u_4}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {f : 𝓐 → 𝓨}
  {hf : Measurable f}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  {β : Type u_4} [StandardBorelSpace 𝓨]
  [Nonempty 𝓨]
  (h :
    IsAlgEnvSeq A Y alg (evalEnv f hf) P)
  {n : ℕ}
  (g : (↥(Finset.Iic n) → 𝓨) → β) :
  ∀ᵐ (ω : Ω) ∂P,
    (g fun i => Y (↑i) ω) =
      g fun i => f (A (↑i) ω)

Code

lemma feedback_evalEnv_ae_eq_eval_action_comp {β : Type*} [StandardBorelSpace 𝓨] [Nonempty 𝓨]
    (h : IsAlgEnvSeq A Y alg (evalEnv f hf) P) {n : ℕ} (g : (Iic n → 𝓨) → β) :
    ∀ᵐ ω ∂P, g (fun i ↦ Y i ω) = g (fun i ↦ f (A i ω))

Type uses (3)

Body uses (1)

forall_feedback_evalEnv_ae_eq_eval_action

Actions: Source · Open Issue

Proof

by
  filter_upwards [forall_feedback_evalEnv_ae_eq_eval_action h] with ω hω
  simp_rw [hω]

LeanMachineLearning exposition

3.12. SequentialLearning.EvaluationEnv🔗

`onlineEvalEnv`🔗

`instIsObliviousEnvOnlineEvalEnv`🔗

`instIsDeterministicEnvOnlineEvalEnv`🔗

`feedbackCondAction_onlineEvalEnv`🔗

`feedbackFunZero_onlineEvalEnv`🔗

`feedbackFun_onlineEvalEnv`🔗

`hascondDistrib_feedback_onlineEvalEnv`🔗

`feedback_onlineEvalEnv_ae_eq_eval_action`🔗

`forall_feedback_onlineEvalEnv_ae_eq_eval_action`🔗

`evalEnv`🔗

`instIsObliviousEnvEvalEnv`🔗

`instIsDeterministicEnvEvalEnv`🔗

`feedbackCondAction_evalEnv`🔗

`feedbackFunZero_evalEnv`🔗

`feedbackFun_evalEnv`🔗

`hascondDistrib_feedback_evalEnv`🔗

`feedback_evalEnv_ae_eq_eval_action`🔗

`forall_feedback_evalEnv_ae_eq_eval_action`🔗

`feedback_evalEnv_ae_eq_eval_action_comp`🔗

3.12. SequentialLearning.EvaluationEnv🔗

onlineEvalEnv🔗

instIsObliviousEnvOnlineEvalEnv🔗

instIsDeterministicEnvOnlineEvalEnv🔗

feedbackCondAction_onlineEvalEnv🔗

feedbackFunZero_onlineEvalEnv🔗

feedbackFun_onlineEvalEnv🔗

hascondDistrib_feedback_onlineEvalEnv🔗

feedback_onlineEvalEnv_ae_eq_eval_action🔗

forall_feedback_onlineEvalEnv_ae_eq_eval_action🔗

evalEnv🔗

instIsObliviousEnvEvalEnv🔗

instIsDeterministicEnvEvalEnv🔗

feedbackCondAction_evalEnv🔗

feedbackFunZero_evalEnv🔗

feedbackFun_evalEnv🔗

hascondDistrib_feedback_evalEnv🔗

feedback_evalEnv_ae_eq_eval_action🔗

forall_feedback_evalEnv_ae_eq_eval_action🔗

feedback_evalEnv_ae_eq_eval_action_comp🔗

`onlineEvalEnv`🔗

`instIsObliviousEnvOnlineEvalEnv`🔗

`instIsDeterministicEnvOnlineEvalEnv`🔗

`feedbackCondAction_onlineEvalEnv`🔗

`feedbackFunZero_onlineEvalEnv`🔗

`feedbackFun_onlineEvalEnv`🔗

`hascondDistrib_feedback_onlineEvalEnv`🔗

`feedback_onlineEvalEnv_ae_eq_eval_action`🔗

`forall_feedback_onlineEvalEnv_ae_eq_eval_action`🔗

`evalEnv`🔗

`instIsObliviousEnvEvalEnv`🔗

`instIsDeterministicEnvEvalEnv`🔗

`feedbackCondAction_evalEnv`🔗

`feedbackFunZero_evalEnv`🔗

`feedbackFun_evalEnv`🔗

`hascondDistrib_feedback_evalEnv`🔗

`feedback_evalEnv_ae_eq_eval_action`🔗

`forall_feedback_evalEnv_ae_eq_eval_action`🔗

`feedback_evalEnv_ae_eq_eval_action_comp`🔗