Documentation

LeanMachineLearning.SequentialLearning.Algorithms.RandomSampling

Random Sampling #

Implementation of the Random Sampling algorithm, which samples from a fixed probability measure at each iteration.

Main definitions #

randomSampling: The random sampling algorithm that samples from a fixed distribution at each iteration.

Main statements #

hasLaw_action: Each action follows the distribution μ.
iIndep_action: Actions are mutually independent across time steps.

noncomputable def Learning.randomSampling {𝓐 : Type u_1} {𝓨 : Type u_2} [MeasurableSpace 𝓐] [MeasurableSpace 𝓨] (μ : MeasureTheory.Measure 𝓐) [MeasureTheory.IsProbabilityMeasure μ] :

Algorithm 𝓐 𝓨

The Random Sampling algorithm, which samples from a fixed probability measure at each iteration.

Equations

Learning.randomSampling μ = { policy := fun (x : ℕ) => ProbabilityTheory.Kernel.const (↥(Finset.Iic x) → 𝓐 × 𝓨) μ, h_policy := ⋯, p0 := μ, hp0 := inst✝ }

Instances For

@[simp]

theorem Learning.randomSampling_p0 {𝓐 : Type u_1} {𝓨 : Type u_2} [MeasurableSpace 𝓐] [MeasurableSpace 𝓨] (μ : MeasureTheory.Measure 𝓐) [MeasureTheory.IsProbabilityMeasure μ] :

(randomSampling μ).p0 = μ

@[simp]

theorem Learning.randomSampling_policy {𝓐 : Type u_1} {𝓨 : Type u_2} [MeasurableSpace 𝓐] [MeasurableSpace 𝓨] (μ : MeasureTheory.Measure 𝓐) [MeasureTheory.IsProbabilityMeasure μ] (x✝ : ℕ) :

(randomSampling μ).policy x✝ = ProbabilityTheory.Kernel.const (↥(Finset.Iic x✝) → 𝓐 × 𝓨) μ

theorem Learning.randomSampling.hasLaw_action {𝓐 : Type u_1} {𝓨 : Type u_2} {Ω : Type u_3} [MeasurableSpace 𝓐] [MeasurableSpace 𝓨] [StandardBorelSpace 𝓐] [Nonempty 𝓐] [StandardBorelSpace 𝓨] [Nonempty 𝓨] {μ : MeasureTheory.Measure 𝓐} [MeasureTheory.IsProbabilityMeasure μ] [MeasurableSpace Ω] {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P] {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {env : Environment 𝓐 𝓨} (h : IsAlgEnvSeq A Y (randomSampling μ) env P) (n : ℕ) :

ProbabilityTheory.HasLaw (A n) μ P

Each action follows the distribution μ.

theorem Learning.randomSampling.iIndep_action {𝓐 : Type u_1} {𝓨 : Type u_2} {Ω : Type u_3} [MeasurableSpace 𝓐] [MeasurableSpace 𝓨] [StandardBorelSpace 𝓐] [Nonempty 𝓐] [StandardBorelSpace 𝓨] [Nonempty 𝓨] {μ : MeasureTheory.Measure 𝓐} [MeasureTheory.IsProbabilityMeasure μ] [MeasurableSpace Ω] {P : MeasureTheory.Measure Ω} [MeasureTheory.IsProbabilityMeasure P] {A : ℕ → Ω → 𝓐} {Y : ℕ → Ω → 𝓨} {env : Environment 𝓐 𝓨} (h : IsAlgEnvSeq A Y (randomSampling μ) env P) :

ProbabilityTheory.iIndepFun A P

Actions are mutually independent.