3.11. SequentialLearning.Algorithms.RandomSampling🔗

Random Sampling

Implementation of the Random Sampling algorithm, which samples from a fixed probability measure at each iteration.

Main definitions

randomSampling: The random sampling algorithm that samples from a fixed distribution at each iteration.

Main statements

hasLaw_action: Each action follows the distribution μ.
iIndep_action: Actions are mutually independent across time steps.

Module LeanMachineLearning.SequentialLearning.Algorithms.RandomSampling contains 5 exposed declarations.

`randomSampling`🔗

DefinitionLearning.randomSampling

Details

The Random Sampling algorithm, which samples from a fixed probability measure at each iteration.

def

Learning.randomSampling.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (μ : MeasureTheory.Measure 𝓐) [MeasureTheory.IsProbabilityMeasure μ] :
  Algorithm 𝓐 𝓨
Learning.randomSampling.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (μ : MeasureTheory.Measure 𝓐)
  [MeasureTheory.IsProbabilityMeasure μ] :
  Algorithm 𝓐 𝓨

Code

noncomputable def randomSampling (μ : Measure 𝓐) [IsProbabilityMeasure μ] : Algorithm 𝓐 𝓨 where
  policy _ := Kernel.const _ μ
  p0 := μ

Type uses (1)

Algorithm

Used by (5)

Actions: Source · Open Issue

`randomSampling_p0`🔗

LemmaLearning.randomSampling_p0

Details

No docstring.

theorem

Learning.randomSampling_p0.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (μ : MeasureTheory.Measure 𝓐) [MeasureTheory.IsProbabilityMeasure μ] :
  Algorithm.p0 (randomSampling μ) = μ
Learning.randomSampling_p0.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (μ : MeasureTheory.Measure 𝓐)
  [MeasureTheory.IsProbabilityMeasure μ] :
  Algorithm.p0 (randomSampling μ) = μ

Code

theorem randomSampling_p0 : ∀ {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨} (μ : MeasureTheory.Measure 𝓐)
  [inst : MeasureTheory.IsProbabilityMeasure μ], (Learning.randomSampling μ).p0 = μ

Type uses (2)

Used by (1)

absolutelyContinuous_uniformAlgorithm

Actions: Source · Open Issue

Proof

@[simps]

`randomSampling_policy`🔗

LemmaLearning.randomSampling_policy

Details

No docstring.

theorem

Learning.randomSampling_policy.{u_1, u_2} {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨}
  (μ : MeasureTheory.Measure 𝓐) [MeasureTheory.IsProbabilityMeasure μ]
  (x✝ : ℕ) :
  Algorithm.policy (randomSampling μ) x✝ =
    ProbabilityTheory.Kernel.const (↥(Finset.Iic x✝) → 𝓐 × 𝓨) μ
Learning.randomSampling_policy.{u_1, u_2}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  (μ : MeasureTheory.Measure 𝓐)
  [MeasureTheory.IsProbabilityMeasure μ]
  (x✝ : ℕ) :
  Algorithm.policy (randomSampling μ) x✝ =
    ProbabilityTheory.Kernel.const
      (↥(Finset.Iic x✝) → 𝓐 × 𝓨) μ

Code

theorem randomSampling_policy : ∀ {𝓐 : Type u_1} {𝓨 : Type u_2} {m𝓐 : MeasurableSpace 𝓐} {m𝓨 : MeasurableSpace 𝓨} (μ : MeasureTheory.Measure 𝓐)
  [inst : MeasureTheory.IsProbabilityMeasure μ] (x : ℕ),
  (Learning.randomSampling μ).policy x = ProbabilityTheory.Kernel.const (↥(Finset.Iic x) → 𝓐 × 𝓨) μ

Type uses (2)

Used by (2)

Actions: Source · Open Issue

Proof

@[simps]

`hasLaw_action`🔗

LemmaLearning.randomSampling.hasLaw_action

Details

Each action follows the distribution μ.

theorem

Learning.randomSampling.hasLaw_action.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω}
  {μ : MeasureTheory.Measure 𝓐} [MeasureTheory.IsProbabilityMeasure μ]
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {env : Environment 𝓐 𝓨}
  (h : IsAlgEnvSeq A Y (randomSampling μ) env P) (n : ℕ) :
  ProbabilityTheory.HasLaw (A n) μ P
Learning.randomSampling.hasLaw_action.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω}
  {μ : MeasureTheory.Measure 𝓐}
  [MeasureTheory.IsProbabilityMeasure μ]
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  {env : Environment 𝓐 𝓨}
  (h :
    IsAlgEnvSeq A Y (randomSampling μ) env
      P)
  (n : ℕ) :
  ProbabilityTheory.HasLaw (A n) μ P

Code

lemma hasLaw_action (h : IsAlgEnvSeq A Y (randomSampling μ) env P) (n : ℕ) :
    HasLaw (A n) μ P

Type uses (3)

Body uses (2)

Used by (1)

iIndep_action

Actions: Source · Open Issue

Proof

by
  by_cases hn : n = 0
  · rw [hn]
    exact h.hasLaw_action_zero
  · push Not at hn
    obtain ⟨k, rfl⟩ := Nat.exists_eq_succ_of_ne_zero hn
    exact (h.hasCondDistrib_action k).hasLaw_of_const

`iIndep_action`🔗

LemmaLearning.randomSampling.iIndep_action

Details

Actions are mutually independent.

theorem

Learning.randomSampling.iIndep_action.{u_1, u_2, u_3} {𝓐 : Type u_1}
  {𝓨 : Type u_2} {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨} {mΩ : MeasurableSpace Ω}
  {μ : MeasureTheory.Measure 𝓐} [MeasureTheory.IsProbabilityMeasure μ]
  {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {env : Environment 𝓐 𝓨}
  (h : IsAlgEnvSeq A Y (randomSampling μ) env P) :
  ProbabilityTheory.iIndepFun A P
Learning.randomSampling.iIndep_action.{u_1,
    u_2, u_3}
  {𝓐 : Type u_1} {𝓨 : Type u_2}
  {Ω : Type u_3} {m𝓐 : MeasurableSpace 𝓐}
  {m𝓨 : MeasurableSpace 𝓨}
  {mΩ : MeasurableSpace Ω}
  {μ : MeasureTheory.Measure 𝓐}
  [MeasureTheory.IsProbabilityMeasure μ]
  {P : MeasureTheory.Measure Ω}
  [MeasureTheory.IsProbabilityMeasure P]
  {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨}
  {env : Environment 𝓐 𝓨}
  (h :
    IsAlgEnvSeq A Y (randomSampling μ) env
      P) :
  ProbabilityTheory.iIndepFun A P

Code

lemma iIndep_action (h : IsAlgEnvSeq A Y (randomSampling μ) env P) :
    iIndepFun A P

Type uses (3)

Body uses (6)

Actions: Source · Open Issue

Proof

by
  have hA := h.measurable_action
  rw [iIndepFun_nat_iff_forall_indepFun (by fun_prop)]
  intro n
  have map_eq := (h.hasCondDistrib_action n).map_eq
  simp only [randomSampling_policy, Measure.compProd_const] at map_eq
  have law_eq : P.map (A (n + 1)) = μ := (hasLaw_action h (n + 1)).map_eq
  rw [← law_eq, ← indepFun_iff_map_prod_eq_prod_map_map] at map_eq
  · change A (n + 1) ⟂ᵢ[P] (fun (f : Iic n → 𝓐 × 𝓨) ↦ (fun i ↦ (f i).1))∘ (history A Y n)
    refine map_eq.symm.comp measurable_id (by fun_prop)
  · exact (h.measurable_history n).aemeasurable
  · exact (h.measurable_action (n + 1)).aemeasurable

3.11. SequentialLearning.Algorithms.RandomSampling🔗

randomSampling🔗

randomSampling_p0🔗

randomSampling_policy🔗

hasLaw_action🔗

iIndep_action🔗

`randomSampling`🔗

`randomSampling_p0`🔗

`randomSampling_policy`🔗

`hasLaw_action`🔗

`iIndep_action`🔗