SequentialLearning.Deterministic

`IsDeterministicAlg`🔗

Type ClassLearning.IsDeterministicAlg

Details

An algorithm is deterministic if its initial action and subsequent actions are determined by measurable functions (and not possibly random kernels).

type class

Learning.IsDeterministicAlg.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) : Prop
Learning.IsDeterministicAlg.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) : Prop

Code

class IsDeterministicAlg (alg : Algorithm 𝓐 𝓨) : Prop where
  exists_action0 : ∃ action0, alg.p0 = Measure.dirac action0
  exists_nextAction n : ∃ (nextAction : (Iic n → 𝓐 × 𝓨) → 𝓐) (h_meas : Measurable nextAction),
    alg.policy n = Kernel.deterministic nextAction h_meas

Type uses (1)

Algorithm

Used by (14)

Actions: Source · Open Issue

`actionZero`🔗

DefinitionLearning.actionZero

Details

The initial action of a deterministic algorithm.

def

Learning.actionZero.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) [h_det : IsDeterministicAlg alg] : 𝓐
Learning.actionZero.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨)
  [h_det : IsDeterministicAlg alg] : 𝓐

Code

noncomputable
def actionZero (alg : Algorithm 𝓐 𝓨) [h_det : IsDeterministicAlg alg] : 𝓐 :=
  h_det.exists_action0.choose

Type uses (2)

Used by (12)

Actions: Source · Open Issue

`nextAction`🔗

DefinitionLearning.nextAction

Details

The next action of a deterministic algorithm after step n.

def

Learning.nextAction.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) [h_det : IsDeterministicAlg alg] (n : ℕ) :
  (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐
Learning.nextAction.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨)
  [h_det : IsDeterministicAlg alg]
  (n : ℕ) : (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐

Code

noncomputable
def nextAction (alg : Algorithm 𝓐 𝓨) [h_det : IsDeterministicAlg alg] (n : ℕ) :
    (Iic n → 𝓐 × 𝓨) → 𝓐 :=
  (h_det.exists_nextAction n).choose

Type uses (2)

Used by (9)

Actions: Source · Open Issue

`measurable_nextAction`🔗

LemmaLearning.measurable_nextAction

Details

No docstring.

theorem

Learning.measurable_nextAction.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) [IsDeterministicAlg alg] (n : ℕ) :
  Measurable (nextAction alg n)
Learning.measurable_nextAction.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨)
  [IsDeterministicAlg alg] (n : ℕ) :
  Measurable (nextAction alg n)

Code

lemma measurable_nextAction (alg : Algorithm 𝓐 𝓨) [IsDeterministicAlg alg] (n : ℕ) :
    Measurable (nextAction alg n)

Type uses (3)

Used by (3)

Actions: Source · Open Issue

Proof

(IsDeterministicAlg.exists_nextAction n).choose_spec.choose

`p0_eq_dirac`🔗

LemmaLearning.p0_eq_dirac

Details

No docstring.

theorem

Learning.p0_eq_dirac.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) [h_det : IsDeterministicAlg alg] :
  Algorithm.p0 alg = MeasureTheory.Measure.dirac (actionZero alg)
Learning.p0_eq_dirac.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨)
  [h_det : IsDeterministicAlg alg] :
  Algorithm.p0 alg =
    MeasureTheory.Measure.dirac
      (actionZero alg)

Code

lemma p0_eq_dirac (alg : Algorithm 𝓐 𝓨) [h_det : IsDeterministicAlg alg] :
    alg.p0 = Measure.dirac (actionZero alg)

Type uses (3)

Used by (3)

Actions: Source · Open Issue

Proof

h_det.exists_action0.choose_spec

`policy_eq_deterministic`🔗

LemmaLearning.policy_eq_deterministic

Details

No docstring.

theorem

Learning.policy_eq_deterministic.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) [h_det : IsDeterministicAlg alg] (n : ℕ) :
  Algorithm.policy alg n =
    ProbabilityTheory.Kernel.deterministic (nextAction alg n) ⋯
Learning.policy_eq_deterministic.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨)
  [h_det : IsDeterministicAlg alg]
  (n : ℕ) :
  Algorithm.policy alg n =
    ProbabilityTheory.Kernel.deterministic
      (nextAction alg n) ⋯

Code

lemma policy_eq_deterministic (alg : Algorithm 𝓐 𝓨) [h_det : IsDeterministicAlg alg] (n : ℕ) :
    alg.policy n = Kernel.deterministic (nextAction alg n) (measurable_nextAction alg n)

Type uses (4)

Used by (2)

Actions: Source · Open Issue

Proof

(IsDeterministicAlg.exists_nextAction n).choose_spec.choose_spec

`hasLaw_action_zero_of_IsAlgEnvSeqUntil`🔗

LemmaLearning.IsDeterministicAlg.hasLaw_action_zero_of_IsAlgEnvSeqUntil

Details

No docstring.

theorem

Learning.IsDeterministicAlg.hasLaw_action_zero_of_IsAlgEnvSeqUntil.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {N : ℕ}
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeqUntil A Y alg env P N) :
  ProbabilityTheory.HasLaw (A 0)
    (MeasureTheory.Measure.dirac (actionZero alg)) P
Learning.IsDeterministicAlg.hasLaw_action_zero_of_IsAlgEnvSeqUntil.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {N : ℕ}
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeqUntil A Y alg env P N) :
  ProbabilityTheory.HasLaw (A 0)
    (MeasureTheory.Measure.dirac
      (actionZero alg))
    P

Code

lemma hasLaw_action_zero_of_IsAlgEnvSeqUntil [h_det : IsDeterministicAlg alg]
    (h : IsAlgEnvSeqUntil A Y alg env P N) :
    HasLaw (A 0) (Measure.dirac (actionZero alg)) P where
  aemeasurable

Type uses (5)

Body uses (1)

p0_eq_dirac

Used by (2)

Actions: Source · Open Issue

Proof

have hA := h.measurable_action; by fun_prop
  map_eq := (h.hasLaw_action_zero).map_eq.trans (p0_eq_dirac alg)

`action_zero_of_IsAlgEnvSeqUntil`🔗

LemmaLearning.IsDeterministicAlg.action_zero_of_IsAlgEnvSeqUntil

Details

No docstring.

theorem

Learning.IsDeterministicAlg.action_zero_of_IsAlgEnvSeqUntil.{u_1, u_2,
    u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {N : ℕ} [MeasurableEq 𝓐]
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeqUntil A Y alg env P N) :
  A 0 =ᵐ[P] fun x => actionZero alg
Learning.IsDeterministicAlg.action_zero_of_IsAlgEnvSeqUntil.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {N : ℕ}
  [MeasurableEq 𝓐]
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeqUntil A Y alg env P N) :
  A 0 =ᵐ[P] fun x => actionZero alg

Code

lemma action_zero_of_IsAlgEnvSeqUntil [MeasurableEq 𝓐] [h_det : IsDeterministicAlg alg]
    (h : IsAlgEnvSeqUntil A Y alg env P N) :
    A 0 =ᵐ[P] fun _ ↦ actionZero alg

Type uses (5)

Body uses (1)

hasLaw_action_zero_of_IsAlgEnvSeqUntil

Used by (2)

Actions: Source · Open Issue

Proof

by
  have h_eq : ∀ᵐ x ∂(P.map (A 0)), x = actionZero alg := by
    simp [(hasLaw_action_zero_of_IsAlgEnvSeqUntil h).map_eq]
  have hA := h.measurable_action
  exact ae_of_ae_map (by fun_prop) h_eq

`action_ae_eq_of_IsAlgEnvSeqUntil`🔗

LemmaLearning.IsDeterministicAlg.action_ae_eq_of_IsAlgEnvSeqUntil

Details

No docstring.

theorem

Learning.IsDeterministicAlg.action_ae_eq_of_IsAlgEnvSeqUntil.{u_1, u_2,
    u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {n N : ℕ} [MeasurableEq 𝓐]
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeqUntil A Y alg env P N) (hn : n < N) :
  A (n + 1) =ᵐ[P] fun ω => nextAction alg n (history A Y n ω)
Learning.IsDeterministicAlg.action_ae_eq_of_IsAlgEnvSeqUntil.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  {n N : ℕ} [MeasurableEq 𝓐]
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeqUntil A Y alg env P N)
  (hn : n < N) :
  A (n + 1) =ᵐ[P] fun ω =>
    nextAction alg n (history A Y n ω)

Code

lemma action_ae_eq_of_IsAlgEnvSeqUntil [MeasurableEq 𝓐]
    [h_det : IsDeterministicAlg alg] (h : IsAlgEnvSeqUntil A Y alg env P N) (hn : n < N) :
    A (n + 1) =ᵐ[P] fun ω ↦ nextAction alg n (history A Y n ω)

Type uses (6)

Body uses (3)

Used by (2)

Actions: Source · Open Issue

Proof

by
  have h_eq := (h.hasCondDistrib_action n hn)
  rw [policy_eq_deterministic alg n] at h_eq
  exact ae_eq_of_hasCondDistrib_deterministic (measurable_nextAction _ _) (by fun_prop)
    (by fun_prop) h_eq

`hasLaw_action_zero`🔗

LemmaLearning.IsDeterministicAlg.hasLaw_action_zero

Details

No docstring.

theorem

Learning.IsDeterministicAlg.hasLaw_action_zero.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeq A Y alg env P) :
  ProbabilityTheory.HasLaw (A 0)
    (MeasureTheory.Measure.dirac (actionZero alg)) P
Learning.IsDeterministicAlg.hasLaw_action_zero.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeq A Y alg env P) :
  ProbabilityTheory.HasLaw (A 0)
    (MeasureTheory.Measure.dirac
      (actionZero alg))
    P

Code

lemma hasLaw_action_zero [h_det : IsDeterministicAlg alg] (h : IsAlgEnvSeq A Y alg env P) :
    HasLaw (A 0) (Measure.dirac (actionZero alg)) P where
  aemeasurable

Type uses (5)

Body uses (1)

p0_eq_dirac

Used by (1)

hasLaw_action_zero_detAlgorithm

Actions: Source · Open Issue

Proof

have hA := h.measurable_action; by fun_prop
  map_eq := (h.hasLaw_action_zero).map_eq.trans (p0_eq_dirac alg)

`action_zero_ae_eq`🔗

LemmaLearning.IsDeterministicAlg.action_zero_ae_eq

Details

No docstring.

theorem

Learning.IsDeterministicAlg.action_zero_ae_eq.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [MeasurableEq 𝓐]
  [h_det : IsDeterministicAlg alg] (h : IsAlgEnvSeq A Y alg env P) :
  A 0 =ᵐ[P] fun x => actionZero alg
Learning.IsDeterministicAlg.action_zero_ae_eq.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [MeasurableEq 𝓐]
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeq A Y alg env P) :
  A 0 =ᵐ[P] fun x => actionZero alg

Code

lemma action_zero_ae_eq [MeasurableEq 𝓐] [h_det : IsDeterministicAlg alg]
    (h : IsAlgEnvSeq A Y alg env P) :
    A 0 =ᵐ[P] fun _ ↦ actionZero alg

Type uses (5)

Body uses (2)

Used by (2)

Actions: Source · Open Issue

Proof

action_zero_of_IsAlgEnvSeqUntil (h.isAlgEnvSeqUntil 0)

`action_ae_eq`🔗

LemmaLearning.IsDeterministicAlg.action_ae_eq

Details

No docstring.

theorem

Learning.IsDeterministicAlg.action_ae_eq.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {Ω : Type u_3} {mΩ : MeasurableSpace Ω} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨} {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P] {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [MeasurableEq 𝓐] [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) :
  A (n + 1) =ᵐ[P] fun ω => nextAction alg n (history A Y n ω)
Learning.IsDeterministicAlg.action_ae_eq.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [MeasurableEq 𝓐]
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeq A Y alg env P)
  (n : ℕ) :
  A (n + 1) =ᵐ[P] fun ω =>
    nextAction alg n (history A Y n ω)

Code

lemma action_ae_eq [MeasurableEq 𝓐] [h_det : IsDeterministicAlg alg]
    (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) :
    A (n + 1) =ᵐ[P] fun ω ↦ nextAction alg n (history A Y n ω)

Type uses (6)

Body uses (2)

Used by (2)

Actions: Source · Open Issue

Proof

action_ae_eq_of_IsAlgEnvSeqUntil (h.isAlgEnvSeqUntil (n + 1)) (by simp)

`action_ae_all_eq`🔗

LemmaLearning.IsDeterministicAlg.action_ae_all_eq

Details

No docstring.

theorem

Learning.IsDeterministicAlg.action_ae_all_eq.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [MeasurableEq 𝓐]
  [h_det : IsDeterministicAlg alg] (h : IsAlgEnvSeq A Y alg env P) :
  ∀ᵐ (ω : Ω) ∂P,
    A 0 ω = actionZero alg ∧
      ∀ (n : ℕ), A (n + 1) ω = nextAction alg n (history A Y n ω)
Learning.IsDeterministicAlg.action_ae_all_eq.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [MeasurableEq 𝓐]
  [h_det : IsDeterministicAlg alg]
  (h : IsAlgEnvSeq A Y alg env P) :
  ∀ᵐ (ω : Ω) ∂P,
    A 0 ω = actionZero alg ∧
      ∀ (n : ℕ),
        A (n + 1) ω =
          nextAction alg n
            (history A Y n ω)

Code

lemma action_ae_all_eq [MeasurableEq 𝓐] [h_det : IsDeterministicAlg alg]
    (h : IsAlgEnvSeq A Y alg env P) :
    ∀ᵐ ω ∂P, A 0 ω = actionZero alg ∧ ∀ n, A (n + 1) ω = nextAction alg n (history A Y n ω)

Type uses (7)

Body uses (2)

Used by (1)

action_detAlgorithm_ae_all_eq

Actions: Source · Open Issue

Proof

by
  rw [eventually_and, ae_all_iff]
  exact ⟨action_zero_ae_eq h, action_ae_eq h⟩

`IsDeterministicEnv`🔗

Type ClassLearning.IsDeterministicEnv

Details

An environment is deterministic if its initial feedbacks are determined by measurable functions (and not possibly random kernels).

type class

Learning.IsDeterministicEnv.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) : Prop
Learning.IsDeterministicEnv.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) : Prop

Code

class IsDeterministicEnv (env : Environment 𝓐 𝓨) : Prop where
  exists_f0 : ∃ (f0 : 𝓐 → 𝓨) (hf0 : Measurable f0), env.ν0 = Kernel.deterministic f0 hf0
  exists_f : ∀ n, ∃ (f : ((Iic n → 𝓐 × 𝓨) × 𝓐) → 𝓨) (hf : Measurable f),
    env.feedback n = Kernel.deterministic f hf

Type uses (1)

Environment

Used by (11)

Actions: Source · Open Issue

`feedbackFunZero`🔗

DefinitionLearning.feedbackFunZero

Details

The initial feedback function of a deterministic environment.

def

Learning.feedbackFunZero.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) [h_det : IsDeterministicEnv env] : 𝓐 → 𝓨
Learning.feedbackFunZero.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨)
  [h_det : IsDeterministicEnv env] : 𝓐 → 𝓨

Code

noncomputable
def feedbackFunZero (env : Environment 𝓐 𝓨) [h_det : IsDeterministicEnv env] : 𝓐 → 𝓨 :=
  h_det.exists_f0.choose

Type uses (2)

Used by (6)

Actions: Source · Open Issue

`measurable_feedbackFunZero`🔗

LemmaLearning.measurable_feedbackFunZero

Details

No docstring.

theorem

Learning.measurable_feedbackFunZero.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) [IsDeterministicEnv env] :
  Measurable (feedbackFunZero env)
Learning.measurable_feedbackFunZero.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨)
  [IsDeterministicEnv env] :
  Measurable (feedbackFunZero env)

Code

lemma measurable_feedbackFunZero (env : Environment 𝓐 𝓨) [IsDeterministicEnv env] :
    Measurable (feedbackFunZero env)

Type uses (3)

Used by (4)

Actions: Source · Open Issue

Proof

(IsDeterministicEnv.exists_f0).choose_spec.choose

`ν0_eq_deterministic`🔗

LemmaLearning.ν0_eq_deterministic

Details

No docstring.

theorem

Learning.ν0_eq_deterministic.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) [IsDeterministicEnv env] :
  Environment.ν0 env =
    ProbabilityTheory.Kernel.deterministic (feedbackFunZero env) ⋯
Learning.ν0_eq_deterministic.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨)
  [IsDeterministicEnv env] :
  Environment.ν0 env =
    ProbabilityTheory.Kernel.deterministic
      (feedbackFunZero env) ⋯

Code

lemma ν0_eq_deterministic (env : Environment 𝓐 𝓨) [IsDeterministicEnv env] :
    env.ν0 = Kernel.deterministic (feedbackFunZero env) (measurable_feedbackFunZero env)

Type uses (4)

Used by (3)

Actions: Source · Open Issue

Proof

(IsDeterministicEnv.exists_f0).choose_spec.choose_spec

`feedbackFun`🔗

DefinitionLearning.feedbackFun

Details

The feedback function of a deterministic environment at step n.

def

Learning.feedbackFun.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) [h_det : IsDeterministicEnv env] (n : ℕ) :
  (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨
Learning.feedbackFun.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨)
  [h_det : IsDeterministicEnv env]
  (n : ℕ) :
  (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨

Code

noncomputable
def feedbackFun (env : Environment 𝓐 𝓨) [h_det : IsDeterministicEnv env] (n : ℕ) :
    ((Iic n → 𝓐 × 𝓨) × 𝓐) → 𝓨 :=
  (h_det.exists_f n).choose

Type uses (2)

Used by (6)

Actions: Source · Open Issue

`measurable_feedbackFun`🔗

LemmaLearning.measurable_feedbackFun

Details

No docstring.

theorem

Learning.measurable_feedbackFun.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) [IsDeterministicEnv env] (n : ℕ) :
  Measurable (feedbackFun env n)
Learning.measurable_feedbackFun.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨)
  [IsDeterministicEnv env] (n : ℕ) :
  Measurable (feedbackFun env n)

Code

lemma measurable_feedbackFun (env : Environment 𝓐 𝓨) [IsDeterministicEnv env] (n : ℕ) :
    Measurable (feedbackFun env n)

Type uses (3)

Used by (4)

Actions: Source · Open Issue

Proof

(IsDeterministicEnv.exists_f n).choose_spec.choose

`feedback_eq_deterministic`🔗

LemmaLearning.feedback_eq_deterministic

Details

No docstring.

theorem

Learning.feedback_eq_deterministic.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) [IsDeterministicEnv env] (n : ℕ) :
  Environment.feedback env n =
    ProbabilityTheory.Kernel.deterministic (feedbackFun env n) ⋯
Learning.feedback_eq_deterministic.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨)
  [IsDeterministicEnv env] (n : ℕ) :
  Environment.feedback env n =
    ProbabilityTheory.Kernel.deterministic
      (feedbackFun env n) ⋯

Code

lemma feedback_eq_deterministic (env : Environment 𝓐 𝓨) [IsDeterministicEnv env] (n : ℕ) :
    env.feedback n = Kernel.deterministic (feedbackFun env n) (measurable_feedbackFun env n)

Type uses (4)

Used by (3)

Actions: Source · Open Issue

Proof

(IsDeterministicEnv.exists_f n).choose_spec.choose_spec

`hasCondDistrib_feedback_zero`🔗

LemmaLearning.IsDeterministicEnv.hasCondDistrib_feedback_zero

Details

No docstring.

theorem

Learning.IsDeterministicEnv.hasCondDistrib_feedback_zero.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [h_det : IsDeterministicEnv env]
  (h : IsAlgEnvSeq A Y alg env P) :
  ProbabilityTheory.HasCondDistrib (Y 0) (A 0)
    (ProbabilityTheory.Kernel.deterministic (feedbackFunZero env) ⋯) P
Learning.IsDeterministicEnv.hasCondDistrib_feedback_zero.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [h_det : IsDeterministicEnv env]
  (h : IsAlgEnvSeq A Y alg env P) :
  ProbabilityTheory.HasCondDistrib (Y 0)
    (A 0)
    (ProbabilityTheory.Kernel.deterministic
      (feedbackFunZero env) ⋯)
    P

Code

lemma hasCondDistrib_feedback_zero [h_det : IsDeterministicEnv env]
    (h : IsAlgEnvSeq A Y alg env P) :
    HasCondDistrib (Y 0) (A 0)
      (Kernel.deterministic (feedbackFunZero env) (measurable_feedbackFunZero env)) P

Type uses (6)

Body uses (1)

ν0_eq_deterministic

Actions: Source · Open Issue

Proof

by
  rw [← ν0_eq_deterministic]
  exact h.hasCondDistrib_feedback_zero

`hasCondDistrib_feedback`🔗

LemmaLearning.IsDeterministicEnv.hasCondDistrib_feedback

Details

No docstring.

theorem

Learning.IsDeterministicEnv.hasCondDistrib_feedback.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [h_det : IsDeterministicEnv env]
  (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) :
  ProbabilityTheory.HasCondDistrib (Y (n + 1))
    (fun ω => (history A Y n ω, A (n + 1) ω))
    (ProbabilityTheory.Kernel.deterministic (feedbackFun env n) ⋯) P
Learning.IsDeterministicEnv.hasCondDistrib_feedback.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {Ω : Type u_3}
  {mΩ : MeasurableSpace Ω}
  {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [h_det : IsDeterministicEnv env]
  (h : IsAlgEnvSeq A Y alg env P)
  (n : ℕ) :
  ProbabilityTheory.HasCondDistrib
    (Y (n + 1))
    (fun ω =>
      (history A Y n ω, A (n + 1) ω))
    (ProbabilityTheory.Kernel.deterministic
      (feedbackFun env n) ⋯)
    P

Code

lemma hasCondDistrib_feedback [h_det : IsDeterministicEnv env]
    (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) :
    HasCondDistrib (Y (n + 1)) (fun ω ↦ (history A Y n ω, A (n + 1) ω))
      (Kernel.deterministic (feedbackFun env n) (measurable_feedbackFun env n)) P

Type uses (7)

Body uses (1)

feedback_eq_deterministic

Actions: Source · Open Issue

Proof

by
  rw [← feedback_eq_deterministic]
  exact h.hasCondDistrib_feedback n

`detAlgorithm`🔗

DefinitionLearning.detAlgorithm

Details

A deterministic algorithm, which chooses the action given by the function nextAction.

def

Learning.detAlgorithm.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐)
  (h_next : ∀ (n : ℕ), Measurable (nextA n)) (action0 : 𝓐) :
  Algorithm 𝓐 𝓨
Learning.detAlgorithm.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐)
  (h_next :
    ∀ (n : ℕ), Measurable (nextA n))
  (action0 : 𝓐) : Algorithm 𝓐 𝓨

Code

noncomputable
def detAlgorithm (nextA : (n : ℕ) → (Iic n → 𝓐 × 𝓨) → 𝓐)
    (h_next : ∀ n, Measurable (nextA n)) (action0 : 𝓐) :
    Algorithm 𝓐 𝓨 where
  policy n := Kernel.deterministic (nextA n) (h_next n)
  p0 := Measure.dirac action0

Type uses (1)

Algorithm

Used by (15)

Actions: Source · Open Issue

`detAlgorithm_p0`🔗

LemmaLearning.detAlgorithm_p0

Details

No docstring.

theorem

Learning.detAlgorithm_p0.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐)
  (h_next : ∀ (n : ℕ), Measurable (nextA n)) (action0 : 𝓐) :
  Algorithm.p0 (detAlgorithm nextA h_next action0) =
    MeasureTheory.Measure.dirac action0
Learning.detAlgorithm_p0.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐)
  (h_next :
    ∀ (n : ℕ), Measurable (nextA n))
  (action0 : 𝓐) :
  Algorithm.p0
      (detAlgorithm nextA h_next
        action0) =
    MeasureTheory.Measure.dirac action0

Code

theorem detAlgorithm_p0 : ∀ {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐) (h_next : ∀ (n : ℕ), Measurable (nextA n)) (action0 : 𝓐),
  (Learning.detAlgorithm nextA h_next action0).p0 = MeasureTheory.Measure.dirac action0

Type uses (2)

Actions: Source · Open Issue

Proof

@[simps]

`detAlgorithm_policy`🔗

LemmaLearning.detAlgorithm_policy

Details

No docstring.

theorem

Learning.detAlgorithm_policy.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐)
  (h_next : ∀ (n : ℕ), Measurable (nextA n)) (action0 : 𝓐) (n : ℕ) :
  Algorithm.policy (detAlgorithm nextA h_next action0) n =
    ProbabilityTheory.Kernel.deterministic (nextA n) ⋯
Learning.detAlgorithm_policy.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐)
  (h_next :
    ∀ (n : ℕ), Measurable (nextA n))
  (action0 : 𝓐) (n : ℕ) :
  Algorithm.policy
      (detAlgorithm nextA h_next action0)
      n =
    ProbabilityTheory.Kernel.deterministic
      (nextA n) ⋯

Code

theorem detAlgorithm_policy : ∀ {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐) (h_next : ∀ (n : ℕ), Measurable (nextA n)) (action0 : 𝓐) (n : ℕ),
  (Learning.detAlgorithm nextA h_next action0).policy n = ProbabilityTheory.Kernel.deterministic (nextA n) ⋯

Type uses (2)

Used by (2)

Actions: Source · Open Issue

Proof

@[simps]

`instIsDeterministicAlgDetAlgorithm`🔗

InstanceLearning.instIsDeterministicAlgDetAlgorithm

Details

No docstring.

theorem

Learning.instIsDeterministicAlgDetAlgorithm.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐} :
  IsDeterministicAlg (detAlgorithm nextA h_next action0)
Learning.instIsDeterministicAlgDetAlgorithm.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐} :
  IsDeterministicAlg
    (detAlgorithm nextA h_next action0)

Code

instance : IsDeterministicAlg (detAlgorithm nextA h_next action0) where
  exists_action0

Type uses (2)

Body uses (1)

Algorithm

Used by (9)

Actions: Source · Open Issue

Proof

⟨action0, rfl⟩
  exists_nextAction n := ⟨nextA n, h_next n, rfl⟩

`actionZero_detAlgorithm`🔗

LemmaLearning.actionZero_detAlgorithm

Details

No docstring.

theorem

Learning.actionZero_detAlgorithm.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐}
  [MeasurableSpace.SeparatesPoints 𝓐] :
  actionZero (detAlgorithm nextA h_next action0) = action0
Learning.actionZero_detAlgorithm.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐}
  [MeasurableSpace.SeparatesPoints 𝓐] :
  actionZero
      (detAlgorithm nextA h_next
        action0) =
    action0

Code

lemma actionZero_detAlgorithm [MeasurableSpace.SeparatesPoints 𝓐] :
    actionZero (detAlgorithm nextA h_next action0) = action0

Type uses (3)

Body uses (3)

Used by (5)

Actions: Source · Open Issue

Proof

by
  have h_eq := p0_eq_dirac (detAlgorithm nextA h_next action0)
  simp only [detAlgorithm] at h_eq
  rw [dirac_eq_dirac_iff] at h_eq
  exact h_eq.symm

`nextAction_detAlgorithm`🔗

LemmaLearning.nextAction_detAlgorithm

Details

No docstring.

theorem

Learning.nextAction_detAlgorithm.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐}
  [MeasurableSpace.SeparatesPoints 𝓐] (n : ℕ) :
  nextAction (detAlgorithm nextA h_next action0) n = nextA n
Learning.nextAction_detAlgorithm.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐}
  [MeasurableSpace.SeparatesPoints 𝓐]
  (n : ℕ) :
  nextAction
      (detAlgorithm nextA h_next action0)
      n =
    nextA n

Code

lemma nextAction_detAlgorithm [MeasurableSpace.SeparatesPoints 𝓐] (n : ℕ) :
    nextAction (detAlgorithm nextA h_next action0) n = nextA n

Type uses (3)

Body uses (4)

Used by (3)

Actions: Source · Open Issue

Proof

by
  have h_eq := policy_eq_deterministic (detAlgorithm nextA h_next action0) n
  simpa [detAlgorithm] using h_eq.symm

`detEnvironment`🔗

DefinitionLearning.detEnvironment

Details

A deterministic environment, where the feedback is given by evaluating fixed measurable functions.

def

Learning.detEnvironment.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨} (f0 : 𝓐 → 𝓨)
  (hf0 : Measurable f0)
  (f : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨)
  (hf : ∀ (n : ℕ), Measurable (f n)) : Environment 𝓐 𝓨
Learning.detEnvironment.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} (f0 : 𝓐 → 𝓨)
  (hf0 : Measurable f0)
  (f :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨)
  (hf : ∀ (n : ℕ), Measurable (f n)) :
  Environment 𝓐 𝓨

Code

noncomputable def detEnvironment
    (f0 : 𝓐 → 𝓨) (hf0 : Measurable f0)
    (f : (n : ℕ) → ((Iic n → 𝓐 × 𝓨) × 𝓐) → 𝓨) (hf : ∀ n, Measurable (f n)) :
    Environment 𝓐 𝓨 where
  feedback n := (Kernel.deterministic (f n) (hf n))
  ν0 := Kernel.deterministic f0 hf0

Type uses (1)

Environment

Used by (3)

Actions: Source · Open Issue

`instIsDeterministicEnvDetEnvironment`🔗

InstanceLearning.instIsDeterministicEnvDetEnvironment

Details

No docstring.

theorem

Learning.instIsDeterministicEnvDetEnvironment.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {f0 : 𝓐 → 𝓨} {hf0 : Measurable f0}
  {f : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨}
  {hf : ∀ (n : ℕ), Measurable (f n)} :
  IsDeterministicEnv (detEnvironment f0 hf0 f hf)
Learning.instIsDeterministicEnvDetEnvironment.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {f0 : 𝓐 → 𝓨}
  {hf0 : Measurable f0}
  {f :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨}
  {hf : ∀ (n : ℕ), Measurable (f n)} :
  IsDeterministicEnv
    (detEnvironment f0 hf0 f hf)

Code

instance : IsDeterministicEnv (detEnvironment f0 hf0 f hf) where
  exists_f0

Type uses (2)

Body uses (1)

Environment

Used by (2)

Actions: Source · Open Issue

Proof

⟨f0, hf0, rfl⟩
  exists_f n := ⟨f n, hf n, rfl⟩

`feedbackFunZero_detEnvironment`🔗

LemmaLearning.feedbackFunZero_detEnvironment

Details

No docstring.

theorem

Learning.feedbackFunZero_detEnvironment.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {f0 : 𝓐 → 𝓨} {hf0 : Measurable f0}
  {f : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨}
  {hf : ∀ (n : ℕ), Measurable (f n)}
  [MeasurableSpace.SeparatesPoints 𝓨] :
  feedbackFunZero (detEnvironment f0 hf0 f hf) = f0
Learning.feedbackFunZero_detEnvironment.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {f0 : 𝓐 → 𝓨}
  {hf0 : Measurable f0}
  {f :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨}
  {hf : ∀ (n : ℕ), Measurable (f n)}
  [MeasurableSpace.SeparatesPoints 𝓨] :
  feedbackFunZero
      (detEnvironment f0 hf0 f hf) =
    f0

Code

lemma feedbackFunZero_detEnvironment [MeasurableSpace.SeparatesPoints 𝓨] :
    feedbackFunZero (detEnvironment f0 hf0 f hf) = f0

Type uses (3)

Body uses (4)

Actions: Source · Open Issue

Proof

by
  simpa [detEnvironment] using (ν0_eq_deterministic (detEnvironment f0 hf0 f hf)).symm

`feedbackFun_detEnvironment`🔗

LemmaLearning.feedbackFun_detEnvironment

Details

No docstring.

theorem

Learning.feedbackFun_detEnvironment.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {f0 : 𝓐 → 𝓨} {hf0 : Measurable f0}
  {f : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨}
  {hf : ∀ (n : ℕ), Measurable (f n)} [MeasurableSpace.SeparatesPoints 𝓨]
  (n : ℕ) : feedbackFun (detEnvironment f0 hf0 f hf) n = f n
Learning.feedbackFun_detEnvironment.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {f0 : 𝓐 → 𝓨}
  {hf0 : Measurable f0}
  {f :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) × 𝓐 → 𝓨}
  {hf : ∀ (n : ℕ), Measurable (f n)}
  [MeasurableSpace.SeparatesPoints 𝓨]
  (n : ℕ) :
  feedbackFun (detEnvironment f0 hf0 f hf)
      n =
    f n

Code

lemma feedbackFun_detEnvironment [MeasurableSpace.SeparatesPoints 𝓨] (n : ℕ) :
    feedbackFun (detEnvironment f0 hf0 f hf) n = f n

Type uses (3)

Body uses (4)

Actions: Source · Open Issue

Proof

by
  simpa [detEnvironment] using (feedback_eq_deterministic (detEnvironment f0 hf0 f hf) n).symm

`hasLaw_action_zero_detAlgorithm`🔗

LemmaLearning.IsAlgEnvSeq.hasLaw_action_zero_detAlgorithm

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.hasLaw_action_zero_detAlgorithm.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐}
  {env : Environment 𝓐 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [MeasurableEq 𝓐]
  (h : IsAlgEnvSeq A Y (detAlgorithm nextA h_next action0) env P) :
  ProbabilityTheory.HasLaw (A 0) (MeasureTheory.Measure.dirac action0) P
Learning.IsAlgEnvSeq.hasLaw_action_zero_detAlgorithm.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐} {env : Environment 𝓐 𝓨}
  {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [MeasurableEq 𝓐]
  (h :
    IsAlgEnvSeq A Y
      (detAlgorithm nextA h_next action0)
      env P) :
  ProbabilityTheory.HasLaw (A 0)
    (MeasureTheory.Measure.dirac action0)
    P

Code

lemma hasLaw_action_zero_detAlgorithm [MeasurableEq 𝓐]
    (h : IsAlgEnvSeq A Y (detAlgorithm nextA h_next action0) env P) :
    HasLaw (A 0) (Measure.dirac action0) P

Type uses (3)

Body uses (4)

Actions: Source · Open Issue

Proof

by
  simpa using IsDeterministicAlg.hasLaw_action_zero h

`action_zero_detAlgorithm`🔗

LemmaLearning.IsAlgEnvSeq.action_zero_detAlgorithm

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.action_zero_detAlgorithm.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐}
  {env : Environment 𝓐 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [MeasurableEq 𝓐]
  (h : IsAlgEnvSeq A Y (detAlgorithm nextA h_next action0) env P) :
  A 0 =ᵐ[P] fun x => action0
Learning.IsAlgEnvSeq.action_zero_detAlgorithm.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐} {env : Environment 𝓐 𝓨}
  {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [MeasurableEq 𝓐]
  (h :
    IsAlgEnvSeq A Y
      (detAlgorithm nextA h_next action0)
      env P) :
  A 0 =ᵐ[P] fun x => action0

Code

lemma action_zero_detAlgorithm [MeasurableEq 𝓐]
    (h : IsAlgEnvSeq A Y (detAlgorithm nextA h_next action0) env P) :
    A 0 =ᵐ[P] fun _ ↦ action0

Type uses (3)

Body uses (4)

Actions: Source · Open Issue

Proof

(IsDeterministicAlg.action_zero_ae_eq h).trans (by simp)

`action_detAlgorithm_ae_eq`🔗

LemmaLearning.IsAlgEnvSeq.action_detAlgorithm_ae_eq

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.action_detAlgorithm_ae_eq.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐}
  {env : Environment 𝓐 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [MeasurableEq 𝓐]
  (h : IsAlgEnvSeq A Y (detAlgorithm nextA h_next action0) env P)
  (n : ℕ) : A (n + 1) =ᵐ[P] fun ω => nextA n (history A Y n ω)
Learning.IsAlgEnvSeq.action_detAlgorithm_ae_eq.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐} {env : Environment 𝓐 𝓨}
  {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [MeasurableEq 𝓐]
  (h :
    IsAlgEnvSeq A Y
      (detAlgorithm nextA h_next action0)
      env P)
  (n : ℕ) :
  A (n + 1) =ᵐ[P] fun ω =>
    nextA n (history A Y n ω)

Code

lemma action_detAlgorithm_ae_eq [MeasurableEq 𝓐]
    (h : IsAlgEnvSeq A Y (detAlgorithm nextA h_next action0) env P) (n : ℕ) :
    A (n + 1) =ᵐ[P] fun ω ↦ nextA n (history A Y n ω)

Type uses (4)

Body uses (4)

Used by (2)

Actions: Source · Open Issue

Proof

(IsDeterministicAlg.action_ae_eq h n).trans (by simp)

`action_detAlgorithm_ae_all_eq`🔗

LemmaLearning.IsAlgEnvSeq.action_detAlgorithm_ae_all_eq

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.action_detAlgorithm_ae_all_eq.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐}
  {env : Environment 𝓐 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} [MeasurableEq 𝓐]
  (h : IsAlgEnvSeq A Y (detAlgorithm nextA h_next action0) env P) :
  ∀ᵐ (ω : Ω) ∂P,
    A 0 ω = action0 ∧ ∀ (n : ℕ), A (n + 1) ω = nextA n (history A Y n ω)
Learning.IsAlgEnvSeq.action_detAlgorithm_ae_all_eq.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐} {env : Environment 𝓐 𝓨}
  {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  [MeasurableEq 𝓐]
  (h :
    IsAlgEnvSeq A Y
      (detAlgorithm nextA h_next action0)
      env P) :
  ∀ᵐ (ω : Ω) ∂P,
    A 0 ω = action0 ∧
      ∀ (n : ℕ),
        A (n + 1) ω =
          nextA n (history A Y n ω)

Code

lemma action_detAlgorithm_ae_all_eq [MeasurableEq 𝓐]
    (h : IsAlgEnvSeq A Y (detAlgorithm nextA h_next action0) env P) :
    ∀ᵐ ω ∂P, A 0 ω = action0 ∧ ∀ n, A (n + 1) ω = nextA n (history A Y n ω)

Type uses (4)

Body uses (6)

Actions: Source · Open Issue

Proof

by
  filter_upwards [IsDeterministicAlg.action_ae_all_eq h] with ω hω using by simp [hω]

`hasLaw_action_zero_detAlgorithm`🔗

LemmaLearning.IsAlgEnvSeqUntil.hasLaw_action_zero_detAlgorithm

Details

No docstring.

theorem

Learning.IsAlgEnvSeqUntil.hasLaw_action_zero_detAlgorithm.{u_1, u_2,
    u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐}
  {env : Environment 𝓐 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {N : ℕ} [MeasurableEq 𝓐]
  (h :
    IsAlgEnvSeqUntil A Y (detAlgorithm nextA h_next action0) env P N) :
  ProbabilityTheory.HasLaw (A 0) (MeasureTheory.Measure.dirac action0) P
Learning.IsAlgEnvSeqUntil.hasLaw_action_zero_detAlgorithm.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐} {env : Environment 𝓐 𝓨}
  {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {N : ℕ}
  [MeasurableEq 𝓐]
  (h :
    IsAlgEnvSeqUntil A Y
      (detAlgorithm nextA h_next action0)
      env P N) :
  ProbabilityTheory.HasLaw (A 0)
    (MeasureTheory.Measure.dirac action0)
    P

Code

lemma hasLaw_action_zero_detAlgorithm [MeasurableEq 𝓐]
    (h : IsAlgEnvSeqUntil A Y (detAlgorithm nextA h_next action0) env P N) :
    HasLaw (A 0) (Measure.dirac action0) P

Type uses (3)

Body uses (4)

Actions: Source · Open Issue

Proof

by
  simpa using IsDeterministicAlg.hasLaw_action_zero_of_IsAlgEnvSeqUntil h

`action_zero_detAlgorithm`🔗

LemmaLearning.IsAlgEnvSeqUntil.action_zero_detAlgorithm

Details

No docstring.

theorem

Learning.IsAlgEnvSeqUntil.action_zero_detAlgorithm.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐}
  {env : Environment 𝓐 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {N : ℕ} [MeasurableEq 𝓐]
  (h :
    IsAlgEnvSeqUntil A Y (detAlgorithm nextA h_next action0) env P N) :
  A 0 =ᵐ[P] fun x => action0
Learning.IsAlgEnvSeqUntil.action_zero_detAlgorithm.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐} {env : Environment 𝓐 𝓨}
  {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {N : ℕ}
  [MeasurableEq 𝓐]
  (h :
    IsAlgEnvSeqUntil A Y
      (detAlgorithm nextA h_next action0)
      env P N) :
  A 0 =ᵐ[P] fun x => action0

Code

lemma action_zero_detAlgorithm [MeasurableEq 𝓐]
    (h : IsAlgEnvSeqUntil A Y (detAlgorithm nextA h_next action0) env P N) :
    A 0 =ᵐ[P] fun _ ↦ action0

Type uses (3)

Body uses (4)

Used by (1)

action_zero

Actions: Source · Open Issue

Proof

(IsDeterministicAlg.action_zero_of_IsAlgEnvSeqUntil h).trans (by simp)

`action_detAlgorithm_ae_eq`🔗

LemmaLearning.IsAlgEnvSeqUntil.action_detAlgorithm_ae_eq

Details

No docstring.

theorem

Learning.IsAlgEnvSeqUntil.action_detAlgorithm_ae_eq.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA : (n : ℕ) → (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next : ∀ (n : ℕ), Measurable (nextA n)} {action0 : 𝓐}
  {env : Environment 𝓐 𝓨} {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {N n : ℕ} [MeasurableEq 𝓐]
  (h : IsAlgEnvSeqUntil A Y (detAlgorithm nextA h_next action0) env P N)
  (hn : n < N) : A (n + 1) =ᵐ[P] fun ω => nextA n (history A Y n ω)
Learning.IsAlgEnvSeqUntil.action_detAlgorithm_ae_eq.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {nextA :
    (n : ℕ) →
      (↥(Finset.Iic n) → 𝓐 × 𝓨) → 𝓐}
  {h_next :
    ∀ (n : ℕ), Measurable (nextA n)}
  {action0 : 𝓐} {env : Environment 𝓐 𝓨}
  {Ω : Type u_3} {mΩ : MeasurableSpace Ω}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  {N n : ℕ} [MeasurableEq 𝓐]
  (h :
    IsAlgEnvSeqUntil A Y
      (detAlgorithm nextA h_next action0)
      env P N)
  (hn : n < N) :
  A (n + 1) =ᵐ[P] fun ω =>
    nextA n (history A Y n ω)

Code

lemma action_detAlgorithm_ae_eq [MeasurableEq 𝓐]
    (h : IsAlgEnvSeqUntil A Y (detAlgorithm nextA h_next action0) env P N) (hn : n < N) :
    A (n + 1) =ᵐ[P] fun ω ↦ nextA n (history A Y n ω)

Type uses (4)

Body uses (4)

Used by (1)

action_ae_eq_roundRobinNextAction

Actions: Source · Open Issue

Proof

(IsDeterministicAlg.action_ae_eq_of_IsAlgEnvSeqUntil h hn).trans (by simp)

3.7. SequentialLearning.Deterministic🔗

IsDeterministicAlg🔗

actionZero🔗

nextAction🔗

measurable_nextAction🔗

p0_eq_dirac🔗

policy_eq_deterministic🔗

hasLaw_action_zero_of_IsAlgEnvSeqUntil🔗

action_zero_of_IsAlgEnvSeqUntil🔗

action_ae_eq_of_IsAlgEnvSeqUntil🔗

hasLaw_action_zero🔗

action_zero_ae_eq🔗

action_ae_eq🔗

action_ae_all_eq🔗

IsDeterministicEnv🔗

feedbackFunZero🔗

measurable_feedbackFunZero🔗

ν0_eq_deterministic🔗

feedbackFun🔗

measurable_feedbackFun🔗

feedback_eq_deterministic🔗

hasCondDistrib_feedback_zero🔗

hasCondDistrib_feedback🔗

detAlgorithm🔗

detAlgorithm_p0🔗

detAlgorithm_policy🔗

instIsDeterministicAlgDetAlgorithm🔗

actionZero_detAlgorithm🔗

nextAction_detAlgorithm🔗

detEnvironment🔗

instIsDeterministicEnvDetEnvironment🔗

feedbackFunZero_detEnvironment🔗

feedbackFun_detEnvironment🔗

hasLaw_action_zero_detAlgorithm🔗

action_zero_detAlgorithm🔗

action_detAlgorithm_ae_eq🔗

action_detAlgorithm_ae_all_eq🔗

hasLaw_action_zero_detAlgorithm🔗

action_zero_detAlgorithm🔗

action_detAlgorithm_ae_eq🔗

`IsDeterministicAlg`🔗

`actionZero`🔗

`nextAction`🔗

`measurable_nextAction`🔗

`p0_eq_dirac`🔗

`policy_eq_deterministic`🔗

`hasLaw_action_zero_of_IsAlgEnvSeqUntil`🔗

`action_zero_of_IsAlgEnvSeqUntil`🔗

`action_ae_eq_of_IsAlgEnvSeqUntil`🔗

`hasLaw_action_zero`🔗

`action_zero_ae_eq`🔗

`action_ae_eq`🔗

`action_ae_all_eq`🔗

`IsDeterministicEnv`🔗

`feedbackFunZero`🔗

`measurable_feedbackFunZero`🔗

`ν0_eq_deterministic`🔗

`feedbackFun`🔗

`measurable_feedbackFun`🔗

`feedback_eq_deterministic`🔗

`hasCondDistrib_feedback_zero`🔗

`hasCondDistrib_feedback`🔗

`detAlgorithm`🔗

`detAlgorithm_p0`🔗

`detAlgorithm_policy`🔗

`instIsDeterministicAlgDetAlgorithm`🔗

`actionZero_detAlgorithm`🔗

`nextAction_detAlgorithm`🔗

`detEnvironment`🔗

`instIsDeterministicEnvDetEnvironment`🔗

`feedbackFunZero_detEnvironment`🔗

`feedbackFun_detEnvironment`🔗

`hasLaw_action_zero_detAlgorithm`🔗

`action_zero_detAlgorithm`🔗

`action_detAlgorithm_ae_eq`🔗

`action_detAlgorithm_ae_all_eq`🔗

`hasLaw_action_zero_detAlgorithm`🔗

`action_zero_detAlgorithm`🔗

`action_detAlgorithm_ae_eq`🔗