SequentialLearning.Algorithm

`Algorithm`🔗

StructureLearning.Algorithm

Details

A stochastic, sequential algorithm.

structure

Learning.Algorithm.{u_4, u_5} (𝓐 : Type u_4) (𝓨 : Type u_5)
  [MeasurableSpace 𝓐] [MeasurableSpace 𝓨] : Type (max u_4 u_5)
Learning.Algorithm.{u_4, u_5}
  (𝓐 : Type u_4) (𝓨 : Type u_5)
  [MeasurableSpace 𝓐]
  [MeasurableSpace 𝓨] : Type (max u_4 u_5)

Code

structure Algorithm (𝓐 𝓨 : Type*) [MeasurableSpace 𝓐] [MeasurableSpace 𝓨] where
  /-- Policy or sampling rule: distribution of the next action. -/
  policy : (n : ℕ) → Kernel (Iic n → 𝓐 × 𝓨) 𝓐
  /-- The policy is a Markov kernel. -/
  [h_policy : ∀ n, IsMarkovKernel (policy n)]
  /-- Distribution of the first action. -/
  p0 : Measure 𝓐
  /-- The first action distribution is a probability measure. -/
  [hp0 : IsProbabilityMeasure p0]

Used by (216)

Actions: Source · Open Issue

`instIsMarkovKernelForallSubtypeNatMemFinsetIicProdPolicy`🔗

InstanceLearning.instIsMarkovKernelForallSubtypeNatMemFinsetIicProdPolicy

Details

No docstring.

theorem

Learning.instIsMarkovKernelForallSubtypeNatMemFinsetIicProdPolicy.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} (alg : Algorithm 𝓐 𝓨) (n : ℕ) :
  ProbabilityTheory.IsMarkovKernel (Algorithm.policy alg n)
Learning.instIsMarkovKernelForallSubtypeNatMemFinsetIicProdPolicy.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) (n : ℕ) :
  ProbabilityTheory.IsMarkovKernel
    (Algorithm.policy alg n)

Code

instance (alg : Algorithm 𝓐 𝓨) (n : ℕ) : IsMarkovKernel (alg.policy n)

Type uses (1)

Algorithm

Used by (14)

Actions: Source · Open Issue

Proof

alg.h_policy n

`instIsProbabilityMeasureP0`🔗

InstanceLearning.instIsProbabilityMeasureP0

Details

No docstring.

theorem

Learning.instIsProbabilityMeasureP0.{u_1, u_2} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) :
  MeasureTheory.IsProbabilityMeasure (Algorithm.p0 alg)
Learning.instIsProbabilityMeasureP0.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) :
  MeasureTheory.IsProbabilityMeasure
    (Algorithm.p0 alg)

Code

instance (alg : Algorithm 𝓐 𝓨) : IsProbabilityMeasure alg.p0

Type uses (1)

Algorithm

Used by (13)

Actions: Source · Open Issue

Proof

alg.hp0

`prodLeft`🔗

DefinitionLearning.Algorithm.prodLeft

Details

An algorithm with observations in 𝓧 × 𝓨 obtained from an algorithm with observations in 𝓨 by ignoring the 𝓧 component of each observation.

def

Learning.Algorithm.prodLeft.{u_1, u_2, u_4} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (𝓧 : Type u_4) [MeasurableSpace 𝓧] (alg : Algorithm 𝓐 𝓨) :
  Algorithm 𝓐 (𝓧 × 𝓨)
Learning.Algorithm.prodLeft.{u_1, u_2,
    u_4}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} (𝓧 : Type u_4)
  [MeasurableSpace 𝓧]
  (alg : Algorithm 𝓐 𝓨) :
  Algorithm 𝓐 (𝓧 × 𝓨)

Code

def Algorithm.prodLeft (𝓧 : Type*) [MeasurableSpace 𝓧] (alg : Algorithm 𝓐 𝓨) :
    Algorithm 𝓐 (𝓧 × 𝓨) where
  policy n := (alg.policy n).comap (fun h i ↦ ((h i).1, (h i).2.2)) (by fun_prop)
  p0 := alg.p0

Type uses (1)

Algorithm

Body uses (2)

Used by (6)

Actions: Source · Open Issue

`prodLeft_p0`🔗

LemmaLearning.Algorithm.prodLeft_p0

Details

No docstring.

theorem

Learning.Algorithm.prodLeft_p0.{u_1, u_2, u_4} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (𝓧 : Type u_4) [MeasurableSpace 𝓧] (alg : Algorithm 𝓐 𝓨) :
  p0 (prodLeft 𝓧 alg) = p0 alg
Learning.Algorithm.prodLeft_p0.{u_1, u_2,
    u_4}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} (𝓧 : Type u_4)
  [MeasurableSpace 𝓧]
  (alg : Algorithm 𝓐 𝓨) :
  p0 (prodLeft 𝓧 alg) = p0 alg

Code

theorem prodLeft_p0 : ∀ {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨} (𝓧 : Type u_4)
  [inst : MeasurableSpace 𝓧] (alg : Learning.Algorithm 𝓐 𝓨), (Learning.Algorithm.prodLeft 𝓧 alg).p0 = alg.p0

Type uses (2)

Actions: Source · Open Issue

Proof

@[simps]

`prodLeft_policy`🔗

LemmaLearning.Algorithm.prodLeft_policy

Details

No docstring.

theorem

Learning.Algorithm.prodLeft_policy.{u_1, u_2, u_4} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (𝓧 : Type u_4) [MeasurableSpace 𝓧] (alg : Algorithm 𝓐 𝓨) (n : ℕ) :
  policy (prodLeft 𝓧 alg) n =
    ProbabilityTheory.Kernel.comap (policy alg n)
      (fun h i => (Prod.fst (h i), Prod.snd (Prod.snd (h i)))) ⋯
Learning.Algorithm.prodLeft_policy.{u_1,
    u_2, u_4}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} (𝓧 : Type u_4)
  [MeasurableSpace 𝓧]
  (alg : Algorithm 𝓐 𝓨) (n : ℕ) :
  policy (prodLeft 𝓧 alg) n =
    ProbabilityTheory.Kernel.comap
      (policy alg n)
      (fun h i =>
        (Prod.fst (h i),
          Prod.snd (Prod.snd (h i))))
      ⋯

Code

theorem prodLeft_policy : ∀ {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨} (𝓧 : Type u_4)
  [inst : MeasurableSpace 𝓧] (alg : Learning.Algorithm 𝓐 𝓨) (n : ℕ),
  (Learning.Algorithm.prodLeft 𝓧 alg).policy n = (alg.policy n).comap (fun h i => ((h i).1, (h i).2.2)) ⋯

Type uses (2)

Actions: Source · Open Issue

Proof

@[simps]

`Environment`🔗

StructureLearning.Environment

Details

A stochastic environment.

structure

Learning.Environment.{u_4, u_5} (𝓐 : Type u_4) (𝓨 : Type u_5)
  [MeasurableSpace 𝓐] [MeasurableSpace 𝓨] : Type (max u_4 u_5)
Learning.Environment.{u_4, u_5}
  (𝓐 : Type u_4) (𝓨 : Type u_5)
  [MeasurableSpace 𝓐]
  [MeasurableSpace 𝓨] : Type (max u_4 u_5)

Code

structure Environment (𝓐 𝓨 : Type*) [MeasurableSpace 𝓐] [MeasurableSpace 𝓨] where
  /-- Distribution of the next observation as function of the past history. -/
  feedback : (n : ℕ) → Kernel ((Iic n → 𝓐 × 𝓨) × 𝓐) 𝓨
  /-- The feedback kernels are Markov kernels. -/
  [h_feedback : ∀ n, IsMarkovKernel (feedback n)]
  /-- Distribution of the first observation given the first action. -/
  ν0 : Kernel 𝓐 𝓨
  /-- The initial observation kernel is a Markov kernel. -/
  [hp0 : IsMarkovKernel ν0]

Used by (128)

Actions: Source · Open Issue

`instIsMarkovKernelProdForallSubtypeNatMemFinsetIicFeedback`🔗

InstanceLearning.instIsMarkovKernelProdForallSubtypeNatMemFinsetIicFeedback

Details

No docstring.

theorem

Learning.instIsMarkovKernelProdForallSubtypeNatMemFinsetIicFeedback.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} (env : Environment 𝓐 𝓨) (n : ℕ) :
  ProbabilityTheory.IsMarkovKernel (Environment.feedback env n)
Learning.instIsMarkovKernelProdForallSubtypeNatMemFinsetIicFeedback.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) (n : ℕ) :
  ProbabilityTheory.IsMarkovKernel
    (Environment.feedback env n)

Code

instance (env : Environment 𝓐 𝓨) (n : ℕ) : IsMarkovKernel (env.feedback n)

Type uses (1)

Environment

Used by (5)

Actions: Source · Open Issue

Proof

env.h_feedback n

`instIsMarkovKernelν0`🔗

InstanceLearning.instIsMarkovKernelν0

Details

No docstring.

theorem

Learning.instIsMarkovKernelν0.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) :
  ProbabilityTheory.IsMarkovKernel (Environment.ν0 env)
Learning.instIsMarkovKernelν0.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (env : Environment 𝓐 𝓨) :
  ProbabilityTheory.IsMarkovKernel
    (Environment.ν0 env)

Code

instance (env : Environment 𝓐 𝓨) : IsMarkovKernel env.ν0

Type uses (1)

Environment

Used by (8)

Actions: Source · Open Issue

Proof

env.hp0

`stepKernel`🔗

DefinitionLearning.stepKernel

Details

Kernel describing the distribution of the next action-feedback pair given the history up to n.

def

Learning.stepKernel.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨) (n : ℕ) :
  ProbabilityTheory.Kernel (↥(Finset.Iic n) → 𝓐 × 𝓨) (𝓐 × 𝓨)
Learning.stepKernel.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨)
  (env : Environment 𝓐 𝓨) (n : ℕ) :
  ProbabilityTheory.Kernel
    (↥(Finset.Iic n) → 𝓐 × 𝓨) (𝓐 × 𝓨)

Code

noncomputable
def stepKernel (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨) (n : ℕ) :
    Kernel (Iic n → 𝓐 × 𝓨) (𝓐 × 𝓨) :=
  alg.policy n ⊗ₖ env.feedback n
deriving IsMarkovKernel

Type uses (2)

Used by (17)

Actions: Source · Open Issue

`instIsMarkovKernelForallSubtypeNatMemFinsetIicProdStepKernel`🔗

InstanceLearning.instIsMarkovKernelForallSubtypeNatMemFinsetIicProdStepKernel

Details

No docstring.

theorem

Learning.instIsMarkovKernelForallSubtypeNatMemFinsetIicProdStepKernel.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨)
  (n : ℕ) : ProbabilityTheory.IsMarkovKernel (stepKernel alg env n)
Learning.instIsMarkovKernelForallSubtypeNatMemFinsetIicProdStepKernel.{u_1,
    u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨)
  (env : Environment 𝓐 𝓨) (n : ℕ) :
  ProbabilityTheory.IsMarkovKernel
    (stepKernel alg env n)

Code

deriving IsMarkovKernel

Type uses (3)

Body uses (2)

Used by (10)

Actions: Source · Open Issue

Proof

deriving IsMarkovKernel

`stepKernel_def`🔗

LemmaLearning.stepKernel_def

Details

No docstring.

theorem

Learning.stepKernel_def.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨) (n : ℕ) :
  stepKernel alg env n =
    ProbabilityTheory.Kernel.compProd (Algorithm.policy alg n)
      (Environment.feedback env n)
Learning.stepKernel_def.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨)
  (env : Environment 𝓐 𝓨) (n : ℕ) :
  stepKernel alg env n =
    ProbabilityTheory.Kernel.compProd
      (Algorithm.policy alg n)
      (Environment.feedback env n)

Code

lemma stepKernel_def (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨) (n : ℕ) :
    stepKernel alg env n = alg.policy n ⊗ₖ env.feedback n

Type uses (3)

Actions: Source · Open Issue

Proof

rfl

`fst_stepKernel`🔗

LemmaLearning.fst_stepKernel

Details

No docstring.

theorem

Learning.fst_stepKernel.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨) (n : ℕ) :
  ProbabilityTheory.Kernel.fst (stepKernel alg env n) =
    Algorithm.policy alg n
Learning.fst_stepKernel.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (alg : Algorithm 𝓐 𝓨)
  (env : Environment 𝓐 𝓨) (n : ℕ) :
  ProbabilityTheory.Kernel.fst
      (stepKernel alg env n) =
    Algorithm.policy alg n

Code

lemma fst_stepKernel (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨) (n : ℕ) :
    (stepKernel alg env n).fst = alg.policy n

Type uses (3)

Body uses (2)

Used by (1)

hasCondDistrib_action

Actions: Source · Open Issue

Proof

by
  rw [stepKernel, Kernel.fst_compProd]

`step`🔗

DefinitionLearning.step

Details

Step of the algorithm-environment sequence: the action-feedback pair at time n.

def

Learning.step.{u_1, u_2, u_3} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨) (n : ℕ) (ω : Ω) : 𝓐 × 𝓨
Learning.step.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} (A : ℕ → Ω → 𝓐)
  (Y : ℕ → Ω → 𝓨) (n : ℕ) (ω : Ω) : 𝓐 × 𝓨

Code

def step (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨) (n : ℕ) (ω : Ω) : 𝓐 × 𝓨 :=
  (A n ω, Y n ω)

Used by (12)

Actions: Source · Open Issue

`measurable_step`🔗

LemmaLearning.measurable_step

Details

No docstring.

theorem

Learning.measurable_step.{u_1, u_2, u_3} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} (n : ℕ)
  (hA : Measurable (A n)) (hY : Measurable (Y n)) :
  Measurable (step A Y n)
Learning.measurable_step.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (n : ℕ)
  (hA : Measurable (A n))
  (hY : Measurable (Y n)) :
  Measurable (step A Y n)

Code

lemma measurable_step (n : ℕ) (hA : Measurable (A n)) (hY : Measurable (Y n)) :
    Measurable (step A Y n)

Type uses (1)

step

Used by (2)

Actions: Source · Open Issue

Proof

by
  unfold step
  fun_prop

`trajectory`🔗

DefinitionLearning.trajectory

Details

A random variable that gives the sequence of action-feedback pairs.

def

Learning.trajectory.{u_1, u_2, u_3} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨) (ω : Ω) : ℕ → 𝓐 × 𝓨
Learning.trajectory.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} (A : ℕ → Ω → 𝓐)
  (Y : ℕ → Ω → 𝓨) (ω : Ω) : ℕ → 𝓐 × 𝓨

Code

def trajectory (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨) (ω : Ω) : ℕ → 𝓐 × 𝓨 := fun n ↦ (A n ω, Y n ω)

Used by (18)

Actions: Source · Open Issue

`measurable_trajectory`🔗

LemmaLearning.measurable_trajectory

Details

No docstring.

theorem

Learning.measurable_trajectory.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (hA : ∀ (n : ℕ), Measurable (A n))
  (hR : ∀ (n : ℕ), Measurable (Y n)) : Measurable (trajectory A Y)
Learning.measurable_trajectory.{u_1, u_2,
    u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  (hA : ∀ (n : ℕ), Measurable (A n))
  (hR : ∀ (n : ℕ), Measurable (Y n)) :
  Measurable (trajectory A Y)

Code

lemma measurable_trajectory {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} (hA : ∀ n, Measurable (A n))
    (hR : ∀ n, Measurable (Y n)) : Measurable (trajectory A Y)

Type uses (1)

trajectory

Used by (8)

Actions: Source · Open Issue

Proof

by
  unfold trajectory
  fun_prop

`history`🔗

DefinitionLearning.history

Details

History of the algorithm-environment sequence up to time n.

def

Learning.history.{u_1, u_2, u_3} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨) (n : ℕ) (ω : Ω) :
  ↥(Finset.Iic n) → 𝓐 × 𝓨
Learning.history.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} (A : ℕ → Ω → 𝓐)
  (Y : ℕ → Ω → 𝓨) (n : ℕ) (ω : Ω) :
  ↥(Finset.Iic n) → 𝓐 × 𝓨

Code

def history (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨) (n : ℕ) (ω : Ω) : Iic n → 𝓐 × 𝓨 :=
  fun i ↦ (A i ω, Y i ω)

Used by (72)

Actions: Source · Open Issue

`measurable_history`🔗

LemmaLearning.measurable_history

Details

No docstring.

theorem

Learning.measurable_history.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) (n : ℕ) :
  Measurable (history A Y n)
Learning.measurable_history.{u_1, u_2,
    u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n))
  (n : ℕ) : Measurable (history A Y n)

Code

lemma measurable_history (hA : ∀ n, Measurable (A n))
    (hY : ∀ n, Measurable (Y n)) (n : ℕ) :
    Measurable (history A Y n)

Type uses (1)

history

Used by (10)

Actions: Source · Open Issue

Proof

by
  unfold history
  fun_prop

`eval_comp_history`🔗

LemmaLearning.eval_comp_history

Details

No docstring.

theorem

Learning.eval_comp_history.{u_1, u_2, u_3} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} (n : ℕ) :
  (fun x => x ⟨n, ⋯⟩) ∘ history A Y n = step A Y n
Learning.eval_comp_history.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (n : ℕ) :
  (fun x => x ⟨n, ⋯⟩) ∘ history A Y n =
    step A Y n

Code

lemma eval_comp_history (n : ℕ) :
    (fun x ↦ x ⟨n, by simp⟩) ∘ (history A Y n) = step A Y n

Type uses (2)

Actions: Source · Open Issue

Proof

rfl

`fst_eval_comp_history`🔗

LemmaLearning.fst_eval_comp_history

Details

No docstring.

theorem

Learning.fst_eval_comp_history.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  (n : ℕ) : (fun x => Prod.fst (x ⟨n, ⋯⟩)) ∘ history A Y n = A n
Learning.fst_eval_comp_history.{u_1, u_2,
    u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (n : ℕ) :
  (fun x => Prod.fst (x ⟨n, ⋯⟩)) ∘
      history A Y n =
    A n

Code

lemma fst_eval_comp_history (n : ℕ) :
    (fun x ↦ (x ⟨n, by simp⟩).1) ∘ (history A Y n) = A n

Type uses (1)

history

Actions: Source · Open Issue

Proof

rfl

`snd_eval_comp_history`🔗

LemmaLearning.snd_eval_comp_history

Details

No docstring.

theorem

Learning.snd_eval_comp_history.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  (n : ℕ) : (fun x => Prod.snd (x ⟨n, ⋯⟩)) ∘ history A Y n = Y n
Learning.snd_eval_comp_history.{u_1, u_2,
    u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (n : ℕ) :
  (fun x => Prod.snd (x ⟨n, ⋯⟩)) ∘
      history A Y n =
    Y n

Code

lemma snd_eval_comp_history (n : ℕ) :
    (fun x ↦ (x ⟨n, by simp⟩).2) ∘ (history A Y n) = Y n

Type uses (1)

history

Actions: Source · Open Issue

Proof

rfl

`history_succ`🔗

LemmaLearning.history_succ

Details

No docstring.

theorem

Learning.history_succ.{u_1, u_2, u_3} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} (n : ℕ) :
  history A Y (n + 1) =
    ⇑(MeasurableEquiv.symm
          (MeasurableEquiv.IicSuccProd
            (fun x =>
              match x with
              | Nat => 𝓐 × 𝓨)
            n)) ∘
      fun ω => (history A Y n ω, step A Y (n + 1) ω)
Learning.history_succ.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (n : ℕ) :
  history A Y (n + 1) =
    ⇑(MeasurableEquiv.symm
          (MeasurableEquiv.IicSuccProd
            (fun x =>
              match x with
              | Nat => 𝓐 × 𝓨)
            n)) ∘
      fun ω =>
      (history A Y n ω,
        step A Y (n + 1) ω)

Code

lemma history_succ (n : ℕ) :
    history A Y (n + 1) =
      (MeasurableEquiv.IicSuccProd (fun ℕ ↦ 𝓐 × 𝓨) n).symm ∘
        (fun ω ↦ (history A Y n ω, step A Y (n + 1) ω))

Type uses (3)

Used by (2)

Actions: Source · Open Issue

Proof

by
  funext ω
  symm
  exact (MeasurableEquiv.IicSuccProd (fun _ ↦ 𝓐 × 𝓨) n).symm_apply_apply (history A Y (n + 1) ω)

`IsAlgEnvSeq`🔗

StructureLearning.IsAlgEnvSeq

Details

An algorithm-environment sequence: a sequence of actions and feedbacks generated by an algorithm interacting with an environment.

structure

Learning.IsAlgEnvSeq.{u_1, u_2, u_3} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨)
  (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨)
  (P : MeasureTheory.Measure Ω) [MeasureTheory.IsFiniteMeasure P] : Prop
Learning.IsAlgEnvSeq.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} (A : ℕ → Ω → 𝓐)
  (Y : ℕ → Ω → 𝓨) (alg : Algorithm 𝓐 𝓨)
  (env : Environment 𝓐 𝓨)
  (P : MeasureTheory.Measure Ω)
  [MeasureTheory.IsFiniteMeasure P] : Prop

Code

structure IsAlgEnvSeq
    (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨) (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨)
    (P : Measure Ω) [IsFiniteMeasure P] : Prop where
  /-- The action sequence is measurable. -/
  measurable_action n : Measurable (A n) := by fun_prop
  /-- The feedback sequence is measurable. -/
  measurable_feedback n : Measurable (Y n) := by fun_prop
  /-- The first action has the correct law. -/
  hasLaw_action_zero : HasLaw (fun ω ↦ (A 0 ω)) alg.p0 P
  /-- The first feedback has the correct conditional distribution. -/
  hasCondDistrib_feedback_zero : HasCondDistrib (Y 0) (A 0) env.ν0 P
  /-- The next action has the correct conditional distribution given the history. -/
  hasCondDistrib_action n :
    HasCondDistrib (A (n + 1)) (history A Y n) (alg.policy n) P
  /-- The next feedback has the correct conditional distribution given the history and
  next action. -/
  hasCondDistrib_feedback n :
    HasCondDistrib (Y (n + 1)) (fun ω ↦ (history A Y n ω, A (n + 1) ω))
      (env.feedback n) P

Type uses (3)

Used by (111)

Actions: Source · Open Issue

`IsAlgEnvSeqUntil`🔗

StructureLearning.IsAlgEnvSeqUntil

Details

An algorithm-environment sequence: a sequence of actions and feedbacks generated by an algorithm interacting with an environment.

structure

Learning.IsAlgEnvSeqUntil.{u_1, u_2, u_3} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨)
  (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨)
  (P : MeasureTheory.Measure Ω) [MeasureTheory.IsFiniteMeasure P]
  (N : ℕ) : Prop
Learning.IsAlgEnvSeqUntil.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} (A : ℕ → Ω → 𝓐)
  (Y : ℕ → Ω → 𝓨) (alg : Algorithm 𝓐 𝓨)
  (env : Environment 𝓐 𝓨)
  (P : MeasureTheory.Measure Ω)
  [MeasureTheory.IsFiniteMeasure P]
  (N : ℕ) : Prop

Code

structure IsAlgEnvSeqUntil
    (A : ℕ → Ω → 𝓐) (Y : ℕ → Ω → 𝓨) (alg : Algorithm 𝓐 𝓨) (env : Environment 𝓐 𝓨)
    (P : Measure Ω) [IsFiniteMeasure P] (N : ℕ) : Prop where
  /-- The action sequence is measurable. -/
  measurable_action n : Measurable (A n) := by fun_prop
  /-- The feedback sequence is measurable. -/
  measurable_feedback n : Measurable (Y n) := by fun_prop
  /-- The first action has the correct law. -/
  hasLaw_action_zero : HasLaw (fun ω ↦ (A 0 ω)) alg.p0 P
  /-- The first feedback has the correct conditional distribution. -/
  hasCondDistrib_feedback_zero : HasCondDistrib (Y 0) (A 0) env.ν0 P
  /-- The next action has the correct conditional distribution given the history. -/
  hasCondDistrib_action n (hn : n < N) :
    HasCondDistrib (A (n + 1)) (history A Y n) (alg.policy n) P
  /-- The next feedback has the correct conditional distribution given the history and
  next action. -/
  hasCondDistrib_feedback n (hn : n < N) :
    HasCondDistrib (Y (n + 1)) (fun ω ↦ (history A Y n ω, A (n + 1) ω))
      (env.feedback n) P

Type uses (3)

Used by (22)

Actions: Source · Open Issue

`mono`🔗

LemmaLearning.IsAlgEnvSeqUntil.mono

Details

No docstring.

theorem

Learning.IsAlgEnvSeqUntil.mono.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {N : ℕ} (h : IsAlgEnvSeqUntil A Y alg env P N) {N' : ℕ}
  (hN : N' ≤ N) : IsAlgEnvSeqUntil A Y alg env P N'
Learning.IsAlgEnvSeqUntil.mono.{u_1, u_2,
    u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {N : ℕ}
  (h : IsAlgEnvSeqUntil A Y alg env P N)
  {N' : ℕ} (hN : N' ≤ N) :
  IsAlgEnvSeqUntil A Y alg env P N'

Code

lemma IsAlgEnvSeqUntil.mono (h : IsAlgEnvSeqUntil A Y alg env P N) {N' : ℕ} (hN : N' ≤ N) :
    IsAlgEnvSeqUntil A Y alg env P N' where
  measurable_action

Type uses (3)

Body uses (1)

history

Used by (4)

Actions: Source · Open Issue

Proof

h.measurable_action
  measurable_feedback := h.measurable_feedback
  hasLaw_action_zero := h.hasLaw_action_zero
  hasCondDistrib_feedback_zero := h.hasCondDistrib_feedback_zero
  hasCondDistrib_action n hn := h.hasCondDistrib_action n (hn.trans_le hN)
  hasCondDistrib_feedback n hn := h.hasCondDistrib_feedback n (hn.trans_le hN)

`isAlgEnvSeqUntil`🔗

LemmaLearning.IsAlgEnvSeq.isAlgEnvSeqUntil

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.isAlgEnvSeqUntil.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P) (N : ℕ) :
  IsAlgEnvSeqUntil A Y alg env P N
Learning.IsAlgEnvSeq.isAlgEnvSeqUntil.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P)
  (N : ℕ) :
  IsAlgEnvSeqUntil A Y alg env P N

Code

lemma IsAlgEnvSeq.isAlgEnvSeqUntil (h : IsAlgEnvSeq A Y alg env P) (N : ℕ) :
    IsAlgEnvSeqUntil A Y alg env P N where
  measurable_action

Type uses (4)

Body uses (1)

history

Used by (2)

Actions: Source · Open Issue

Proof

h.measurable_action
  measurable_feedback := h.measurable_feedback
  hasLaw_action_zero := h.hasLaw_action_zero
  hasCondDistrib_feedback_zero := h.hasCondDistrib_feedback_zero
  hasCondDistrib_action n _ := h.hasCondDistrib_action n
  hasCondDistrib_feedback n _ := h.hasCondDistrib_feedback n

`measurable_step`🔗

LemmaLearning.IsAlgEnvSeq.measurable_step

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.measurable_step.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) : Measurable (step A Y n)
Learning.IsAlgEnvSeq.measurable_step.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P)
  (n : ℕ) : Measurable (step A Y n)

Code

lemma IsAlgEnvSeq.measurable_step (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) :
    Measurable (step A Y n)

Type uses (4)

Body uses (1)

measurable_step

Used by (2)

Actions: Source · Open Issue

Proof

by
  have hA := h.measurable_action
  have hY := h.measurable_feedback
  fun_prop

`measurable_history`🔗

LemmaLearning.IsAlgEnvSeq.measurable_history

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.measurable_history.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) : Measurable (history A Y n)
Learning.IsAlgEnvSeq.measurable_history.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P)
  (n : ℕ) : Measurable (history A Y n)

Code

lemma IsAlgEnvSeq.measurable_history (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) :
    Measurable (history A Y n)

Type uses (4)

Body uses (1)

measurable_history

Used by (4)

Actions: Source · Open Issue

Proof

by
  have hA := h.measurable_action
  have hY := h.measurable_feedback
  fun_prop

`hasLaw_step_zero`🔗

LemmaLearning.IsAlgEnvSeq.hasLaw_step_zero

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.hasLaw_step_zero.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P) :
  ProbabilityTheory.HasLaw (step A Y 0)
    (MeasureTheory.Measure.compProd (Algorithm.p0 alg)
      (Environment.ν0 env))
    P
Learning.IsAlgEnvSeq.hasLaw_step_zero.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P) :
  ProbabilityTheory.HasLaw (step A Y 0)
    (MeasureTheory.Measure.compProd
      (Algorithm.p0 alg)
      (Environment.ν0 env))
    P

Code

lemma IsAlgEnvSeq.hasLaw_step_zero (h : IsAlgEnvSeq A Y alg env P) :
    HasLaw (step A Y 0) (alg.p0 ⊗ₘ env.ν0) P

Type uses (4)

Body uses (1)

prod_of_hasCondDistrib

Used by (3)

Actions: Source · Open Issue

Proof

HasLaw.prod_of_hasCondDistrib h.hasLaw_action_zero h.hasCondDistrib_feedback_zero

`hasLaw_step_zero`🔗

LemmaLearning.IsAlgEnvSeqUntil.hasLaw_step_zero

Details

No docstring.

theorem

Learning.IsAlgEnvSeqUntil.hasLaw_step_zero.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {N : ℕ} (h : IsAlgEnvSeqUntil A Y alg env P N) :
  ProbabilityTheory.HasLaw (step A Y 0)
    (MeasureTheory.Measure.compProd (Algorithm.p0 alg)
      (Environment.ν0 env))
    P
Learning.IsAlgEnvSeqUntil.hasLaw_step_zero.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {N : ℕ}
  (h : IsAlgEnvSeqUntil A Y alg env P N) :
  ProbabilityTheory.HasLaw (step A Y 0)
    (MeasureTheory.Measure.compProd
      (Algorithm.p0 alg)
      (Environment.ν0 env))
    P

Code

lemma IsAlgEnvSeqUntil.hasLaw_step_zero (h : IsAlgEnvSeqUntil A Y alg env P N) :
    HasLaw (step A Y 0) (alg.p0 ⊗ₘ env.ν0) P

Type uses (4)

Body uses (1)

prod_of_hasCondDistrib

Used by (1)

eq_trajMeasure_map_frestrictLe_of_isAlgEnvSeqUntil

Actions: Source · Open Issue

Proof

HasLaw.prod_of_hasCondDistrib h.hasLaw_action_zero h.hasCondDistrib_feedback_zero

`hasCondDistrib_step`🔗

LemmaLearning.IsAlgEnvSeq.hasCondDistrib_step

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.hasCondDistrib_step.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) :
  ProbabilityTheory.HasCondDistrib (step A Y (n + 1)) (history A Y n)
    (stepKernel alg env n) P
Learning.IsAlgEnvSeq.hasCondDistrib_step.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P)
  (n : ℕ) :
  ProbabilityTheory.HasCondDistrib
    (step A Y (n + 1)) (history A Y n)
    (stepKernel alg env n) P

Code

lemma IsAlgEnvSeq.hasCondDistrib_step (h : IsAlgEnvSeq A Y alg env P) (n : ℕ) :
    HasCondDistrib (step A Y (n + 1)) (history A Y n) (stepKernel alg env n) P

Type uses (6)

Body uses (1)

prod

Used by (3)

Actions: Source · Open Issue

Proof

HasCondDistrib.prod (h.hasCondDistrib_action n) (h.hasCondDistrib_feedback n)

`hasCondDistrib_step`🔗

LemmaLearning.IsAlgEnvSeqUntil.hasCondDistrib_step

Details

No docstring.

theorem

Learning.IsAlgEnvSeqUntil.hasCondDistrib_step.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  {N : ℕ} (h : IsAlgEnvSeqUntil A Y alg env P N) (n : ℕ) (hn : n < N) :
  ProbabilityTheory.HasCondDistrib (step A Y (n + 1)) (history A Y n)
    (stepKernel alg env n) P
Learning.IsAlgEnvSeqUntil.hasCondDistrib_step.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  {N : ℕ}
  (h : IsAlgEnvSeqUntil A Y alg env P N)
  (n : ℕ) (hn : n < N) :
  ProbabilityTheory.HasCondDistrib
    (step A Y (n + 1)) (history A Y n)
    (stepKernel alg env n) P

Code

lemma IsAlgEnvSeqUntil.hasCondDistrib_step (h : IsAlgEnvSeqUntil A Y alg env P N)
    (n : ℕ) (hn : n < N) :
    HasCondDistrib (step A Y (n + 1)) (history A Y n)
      (stepKernel alg env n) P

Type uses (6)

Body uses (1)

prod

Used by (1)

eq_trajMeasure_map_frestrictLe_of_isAlgEnvSeqUntil

Actions: Source · Open Issue

Proof

HasCondDistrib.prod (h.hasCondDistrib_action n hn) (h.hasCondDistrib_feedback n hn)

`hasLaw_history_zero`🔗

LemmaLearning.IsAlgEnvSeq.hasLaw_history_zero

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.hasLaw_history_zero.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨} {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P) :
  ProbabilityTheory.HasLaw (history A Y 0)
    (MeasureTheory.Measure.map
      (⇑(MeasurableEquiv.symm
          (MeasurableEquiv.piUnique fun x => 𝓐 × 𝓨)))
      (MeasureTheory.Measure.map (step A Y 0) P))
    P
Learning.IsAlgEnvSeq.hasLaw_history_zero.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {alg : Algorithm 𝓐 𝓨}
  {env : Environment 𝓐 𝓨}
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsFiniteMeasure P]
  (h : IsAlgEnvSeq A Y alg env P) :
  ProbabilityTheory.HasLaw (history A Y 0)
    (MeasureTheory.Measure.map
      (⇑(MeasurableEquiv.symm
          (MeasurableEquiv.piUnique
            fun x => 𝓐 × 𝓨)))
      (MeasureTheory.Measure.map
        (step A Y 0) P))
    P

Code

lemma IsAlgEnvSeq.hasLaw_history_zero (h : IsAlgEnvSeq A Y alg env P) : HasLaw (history A Y 0)
    ((P.map (step A Y 0)).map (MeasurableEquiv.piUnique (fun _ : Iic 0 ↦ 𝓐 × 𝓨)).symm) P where
  aemeasurable

Type uses (5)

Body uses (2)

Used by (2)

Actions: Source · Open Issue

Proof

(h.measurable_history 0).aemeasurable
  map_eq := by
    have he : (MeasurableEquiv.piUnique (fun _ : Iic 0 ↦ 𝓐 × 𝓨)).symm ∘ step A Y 0 =
        history A Y 0 := by
      funext _ ⟨0, _⟩
      rfl
    rw [← he]
    have hA := h.measurable_action
    have hY := h.measurable_feedback
    exact (Measure.map_map (by fun_prop) (by fun_prop)).symm

`filtration`🔗

DefinitionLearning.IsAlgEnvSeq.filtration

Details

Filtration generated by the history up to time n.

def

Learning.IsAlgEnvSeq.filtration.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) : MeasureTheory.Filtration ℕ mΩ
Learning.IsAlgEnvSeq.filtration.{u_1, u_2,
    u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Filtration ℕ mΩ

Code

def IsAlgEnvSeq.filtration (hA : ∀ n, Measurable (A n)) (hY : ∀ n, Measurable (Y n)) :
    Filtration ℕ mΩ where
  seq i := MeasurableSpace.comap (history A Y i) inferInstance
  mono' i j hij := by
    simp only
    rw [← measurable_iff_comap_le]
    have : history A Y i = (fun h k ↦ h ⟨k.1, by grind⟩) ∘ history A Y j := rfl
    rw [this]
    exact measurable_comp_comap _ (by fun_prop)
  le' i := by
    rw [← measurable_iff_comap_le]
    exact Learning.measurable_history hA hY i

Body uses (3)

Used by (18)

Actions: Source · Open Issue

`adapted_history`🔗

LemmaLearning.IsAlgEnvSeq.adapted_history

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.adapted_history.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Adapted (filtration hA hY) (history A Y)
Learning.IsAlgEnvSeq.adapted_history.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Adapted (filtration hA hY)
    (history A Y)

Code

lemma IsAlgEnvSeq.adapted_history
    (hA : ∀ n, Measurable (A n)) (hY : ∀ n, Measurable (Y n)) :
    Adapted (filtration hA hY) (history A Y)

Type uses (2)

Actions: Source · Open Issue

Proof

fun _ ↦ measurable_iff_comap_le.mpr le_rfl

`adapted_step`🔗

LemmaLearning.IsAlgEnvSeq.adapted_step

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.adapted_step.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Adapted (filtration hA hY) (step A Y)
Learning.IsAlgEnvSeq.adapted_step.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Adapted (filtration hA hY)
    (step A Y)

Code

lemma IsAlgEnvSeq.adapted_step
    (hA : ∀ n, Measurable (A n)) (hY : ∀ n, Measurable (Y n)) :
    Adapted (filtration hA hY) (step A Y)

Type uses (2)

Body uses (2)

Actions: Source · Open Issue

Proof

by
  intro n
  have : step A Y n = (fun h ↦ (h ⟨n, by simp⟩)) ∘ (history A Y n) := by
    ext ω : 1
    simp [history, step]
  rw [this]
  exact measurable_comp_comap _ (by fun_prop)

`adapted_action`🔗

LemmaLearning.IsAlgEnvSeq.adapted_action

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.adapted_action.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Adapted (filtration hA hY) A
Learning.IsAlgEnvSeq.adapted_action.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Adapted (filtration hA hY)
    A

Code

lemma IsAlgEnvSeq.adapted_action
    (hA : ∀ n, Measurable (A n)) (hY : ∀ n, Measurable (Y n)) :
    Adapted (filtration hA hY) A

Type uses (1)

filtration

Body uses (2)

Used by (3)

Actions: Source · Open Issue

Proof

by
  intro n
  have : A n = (fun h ↦ (h ⟨n, by simp⟩).1) ∘ (history A Y n) := by
    ext ω : 1
    simp [history]
  rw [this]
  exact measurable_comp_comap _ (by fun_prop)

`adapted_feedback`🔗

LemmaLearning.IsAlgEnvSeq.adapted_feedback

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.adapted_feedback.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Adapted (filtration hA hY) Y
Learning.IsAlgEnvSeq.adapted_feedback.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Adapted (filtration hA hY)
    Y

Code

lemma IsAlgEnvSeq.adapted_feedback
    (hA : ∀ n, Measurable (A n)) (hY : ∀ n, Measurable (Y n)) :
    Adapted (filtration hA hY) Y

Type uses (1)

filtration

Body uses (2)

Used by (1)

isPredictable_sumRewards

Actions: Source · Open Issue

Proof

by
  intro n
  have : Y n = (fun h ↦ (h ⟨n, by simp⟩).2) ∘ (history A Y n) := by
    ext ω : 1
    simp [history]
  rw [this]
  exact measurable_comp_comap _ (by fun_prop)

`filtrationAction`🔗

DefinitionLearning.IsAlgEnvSeq.filtrationAction

Details

Filtration generated by the history at time n-1 together with the action at time n.

def

Learning.IsAlgEnvSeq.filtrationAction.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) : MeasureTheory.Filtration ℕ mΩ
Learning.IsAlgEnvSeq.filtrationAction.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  (hA : ∀ (n : ℕ), Measurable (A n))
  (hY : ∀ (n : ℕ), Measurable (Y n)) :
  MeasureTheory.Filtration ℕ mΩ

Code

def IsAlgEnvSeq.filtrationAction
    (hA : ∀ n, Measurable (A n)) (hY : ∀ n, Measurable (Y n)) :
    Filtration ℕ mΩ where
  seq n := if n = 0 then MeasurableSpace.comap (A 0) inferInstance
    else IsAlgEnvSeq.filtration hA hY (n - 1) ⊔ MeasurableSpace.comap (A n) inferInstance
  mono' n m hnm := by
    simp only
    by_cases hn : n = 0
    · by_cases hm : m = 0
      · simp [hn, hm]
      · simp only [hn, ↓reduceIte, hm]
        refine le_sup_of_le_left ?_
        rw [← measurable_iff_comap_le]
        suffices Measurable[IsAlgEnvSeq.filtration hA hY 0] (A 0) from
          this.mono ((IsAlgEnvSeq.filtration hA hY).mono zero_le) le_rfl
        exact adapted_action hA hY 0
    have hm : m ≠ 0 := by grind
    simp only [hn, hm, ↓reduceIte]
    have hnm' : n - 1 ≤ m - 1 := by grind
    simp only [sup_le_iff]
    constructor
    · refine le_sup_of_le_left ?_
      exact (IsAlgEnvSeq.filtration hA hY).mono hnm'
    · rcases eq_or_lt_of_le hnm with rfl | hlt
      · exact le_sup_of_le_right le_rfl
      refine le_sup_of_le_left ?_
      rw [← measurable_iff_comap_le]
      have h_le : n ≤ m - 1 := by grind
      suffices Measurable[IsAlgEnvSeq.filtration hA hY n] (A n) from
        this.mono ((IsAlgEnvSeq.filtration hA hY).mono h_le) le_rfl
      exact adapted_action hA hY n
  le' n := by
    by_cases hn : n = 0
    · simp only [hn, ↓reduceIte]
      rw [← measurable_iff_comap_le]
      fun_prop
    simp only [hn, ↓reduceIte, sup_le_iff]
    constructor
    · exact (IsAlgEnvSeq.filtration hA hY).le _
    · rw [← measurable_iff_comap_le]
      fun_prop

Body uses (2)

Used by (3)

Actions: Source · Open Issue

`filtrationAction_zero_eq_comap`🔗

LemmaLearning.IsAlgEnvSeq.filtrationAction_zero_eq_comap

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.filtrationAction_zero_eq_comap.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {hA : ∀ (n : ℕ), Measurable (A n)}
  {hY : ∀ (n : ℕ), Measurable (Y n)} :
  ↑(filtrationAction hA hY) 0 =
    MeasurableSpace.comap (A 0) inferInstance
Learning.IsAlgEnvSeq.filtrationAction_zero_eq_comap.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  {hA : ∀ (n : ℕ), Measurable (A n)}
  {hY : ∀ (n : ℕ), Measurable (Y n)} :
  ↑(filtrationAction hA hY) 0 =
    MeasurableSpace.comap (A 0)
      inferInstance

Code

lemma IsAlgEnvSeq.filtrationAction_zero_eq_comap
    {hA : ∀ n, Measurable (A n)} {hY : ∀ n, Measurable (Y n)} :
    filtrationAction hA hY 0 = MeasurableSpace.comap (A 0) inferInstance

Type uses (1)

filtrationAction

Body uses (1)

filtration

Actions: Source · Open Issue

Proof

by
  simp [filtrationAction]

`filtrationAction_eq_comap`🔗

LemmaLearning.IsAlgEnvSeq.filtrationAction_eq_comap

Details

No docstring.

theorem

Learning.IsAlgEnvSeq.filtrationAction_eq_comap.{u_1, u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨} {hA : ∀ (n : ℕ), Measurable (A n)}
  {hY : ∀ (n : ℕ), Measurable (Y n)} (n : ℕ) (hn : n ≠ 0) :
  ↑(filtrationAction hA hY) n =
    MeasurableSpace.comap (fun ω => (history A Y (n - 1) ω, A n ω))
      inferInstance
Learning.IsAlgEnvSeq.filtrationAction_eq_comap.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω} {A : ℕ → Ω → 𝓐}
  {Y : ℕ → Ω → 𝓨}
  {hA : ∀ (n : ℕ), Measurable (A n)}
  {hY : ∀ (n : ℕ), Measurable (Y n)}
  (n : ℕ) (hn : n ≠ 0) :
  ↑(filtrationAction hA hY) n =
    MeasurableSpace.comap
      (fun ω =>
        (history A Y (n - 1) ω, A n ω))
      inferInstance

Code

lemma IsAlgEnvSeq.filtrationAction_eq_comap
    {hA : ∀ n, Measurable (A n)} {hY : ∀ n, Measurable (Y n)} (n : ℕ) (hn : n ≠ 0) :
    filtrationAction hA hY n =
      MeasurableSpace.comap (fun ω ↦ (history A Y (n - 1) ω, A n ω)) inferInstance

Type uses (2)

Body uses (2)

Used by (1)

isStoppingTime_stepsUntil_filtrationAction

Actions: Source · Open Issue

Proof

by
  simp only [filtrationAction, filtration, ← MeasurableSpace.comap_prodMk, hn, ↓reduceIte]
  rfl

3.2. SequentialLearning.Algorithm🔗

Algorithm🔗

instIsMarkovKernelForallSubtypeNatMemFinsetIicProdPolicy🔗

instIsProbabilityMeasureP0🔗

prodLeft🔗

prodLeft_p0🔗

prodLeft_policy🔗

Environment🔗

instIsMarkovKernelProdForallSubtypeNatMemFinsetIicFeedback🔗

instIsMarkovKernelν0🔗

stepKernel🔗

instIsMarkovKernelForallSubtypeNatMemFinsetIicProdStepKernel🔗

stepKernel_def🔗

fst_stepKernel🔗

step🔗

measurable_step🔗

trajectory🔗

measurable_trajectory🔗

history🔗

measurable_history🔗

eval_comp_history🔗

fst_eval_comp_history🔗

snd_eval_comp_history🔗

history_succ🔗

IsAlgEnvSeq🔗

IsAlgEnvSeqUntil🔗

mono🔗

isAlgEnvSeqUntil🔗

measurable_step🔗

measurable_history🔗

hasLaw_step_zero🔗

hasLaw_step_zero🔗

hasCondDistrib_step🔗

hasCondDistrib_step🔗

hasLaw_history_zero🔗

filtration🔗

adapted_history🔗

adapted_step🔗

adapted_action🔗

adapted_feedback🔗

filtrationAction🔗

filtrationAction_zero_eq_comap🔗

filtrationAction_eq_comap🔗

`Algorithm`🔗

`instIsMarkovKernelForallSubtypeNatMemFinsetIicProdPolicy`🔗

`instIsProbabilityMeasureP0`🔗

`prodLeft`🔗

`prodLeft_p0`🔗

`prodLeft_policy`🔗

`Environment`🔗

`instIsMarkovKernelProdForallSubtypeNatMemFinsetIicFeedback`🔗

`instIsMarkovKernelν0`🔗

`stepKernel`🔗

`instIsMarkovKernelForallSubtypeNatMemFinsetIicProdStepKernel`🔗

`stepKernel_def`🔗

`fst_stepKernel`🔗

`step`🔗

`measurable_step`🔗

`trajectory`🔗

`measurable_trajectory`🔗

`history`🔗

`measurable_history`🔗

`eval_comp_history`🔗

`fst_eval_comp_history`🔗

`snd_eval_comp_history`🔗

`history_succ`🔗

`IsAlgEnvSeq`🔗

`IsAlgEnvSeqUntil`🔗

`mono`🔗

`isAlgEnvSeqUntil`🔗

`measurable_step`🔗

`measurable_history`🔗

`hasLaw_step_zero`🔗

`hasLaw_step_zero`🔗

`hasCondDistrib_step`🔗

`hasCondDistrib_step`🔗

`hasLaw_history_zero`🔗

`filtration`🔗

`adapted_history`🔗

`adapted_step`🔗

`adapted_action`🔗

`adapted_feedback`🔗

`filtrationAction`🔗

`filtrationAction_zero_eq_comap`🔗

`filtrationAction_eq_comap`🔗