Learning.history_succ
This page has the declaration's own card below, then its dependency graph, then a card for each dependency (type dependencies first, then the rest of the transitive closure). For a theorem, the graph and the dependency cards only follow its statement's dependencies (its proof is replaced by sorry, so what it proves doesn't depend on how); for everything else, both the type and the body/value are followed, since their content is part of what later declarations build on.
history_succ๐
Learning.history_succNo docstring.
Learning.history_succ.{u_1, u_2, u_3} {๐ : Type u_1} {๐จ : Type u_2} {ฮฉ : Type u_3} {m๐ : MeasurableSpace ๐} {m๐จ : MeasurableSpace ๐จ} {A : โ โ ฮฉ โ ๐} {Y : โ โ ฮฉ โ ๐จ} (n : โ) : history A Y (n + 1) = โ(MeasurableEquiv.symm (MeasurableEquiv.IicSuccProd (fun x => match x with | Nat => ๐ ร ๐จ) n)) โ fun ฯ => (history A Y n ฯ, step A Y (n + 1) ฯ)Learning.history_succ.{u_1, u_2, u_3} {๐ : Type u_1} {๐จ : Type u_2} {ฮฉ : Type u_3} {m๐ : MeasurableSpace ๐} {m๐จ : MeasurableSpace ๐จ} {A : โ โ ฮฉ โ ๐} {Y : โ โ ฮฉ โ ๐จ} (n : โ) : history A Y (n + 1) = โ(MeasurableEquiv.symm (MeasurableEquiv.IicSuccProd (fun x => match x with | Nat => ๐ ร ๐จ) n)) โ fun ฯ => (history A Y n ฯ, step A Y (n + 1) ฯ)
Code
lemma history_succ (n : โ) :
history A Y (n + 1) =
(MeasurableEquiv.IicSuccProd (fun โ โฆ ๐ ร ๐จ) n).symm โ
(fun ฯ โฆ (history A Y n ฯ, step A Y (n + 1) ฯ))Type uses (3)
Actions: Source ยท Open Issue
Proof
by funext ฯ symm exact (MeasurableEquiv.IicSuccProd (fun _ โฆ ๐ ร ๐จ) n).symm_apply_apply (history A Y (n + 1) ฯ)
Dependency graph
Type dependencies (3)
history๐
Learning.history
History of the algorithm-environment sequence up to time n.
Learning.history.{u_1, u_2, u_3} {๐ : Type u_1} {๐จ : Type u_2} {ฮฉ : Type u_3} (A : โ โ ฮฉ โ ๐) (Y : โ โ ฮฉ โ ๐จ) (n : โ) (ฯ : ฮฉ) : โฅ(Finset.Iic n) โ ๐ ร ๐จLearning.history.{u_1, u_2, u_3} {๐ : Type u_1} {๐จ : Type u_2} {ฮฉ : Type u_3} (A : โ โ ฮฉ โ ๐) (Y : โ โ ฮฉ โ ๐จ) (n : โ) (ฯ : ฮฉ) : โฅ(Finset.Iic n) โ ๐ ร ๐จ
Code
def history (A : โ โ ฮฉ โ ๐) (Y : โ โ ฮฉ โ ๐จ) (n : โ) (ฯ : ฮฉ) : Iic n โ ๐ ร ๐จ := fun i โฆ (A i ฯ, Y i ฯ)
Actions: Source ยท Open Issue
IicSuccProd๐
MeasurableEquiv.IicSuccProd
Measurable equivalence between a product up to n + 1 and the pair of the product up to n and
the space at n + 1.
MeasurableEquiv.IicSuccProd.{u_3} (X : โ โ Type u_3) [(n : โ) โ MeasurableSpace (X n)] (n : โ) : ((i : โฅ(Finset.Iic (n + 1))) โ X โi) โแต ((i : โฅ(Finset.Iic n)) โ X โi) ร X (n + 1)MeasurableEquiv.IicSuccProd.{u_3} (X : โ โ Type u_3) [(n : โ) โ MeasurableSpace (X n)] (n : โ) : ((i : โฅ(Finset.Iic (n + 1))) โ X โi) โแต ((i : โฅ(Finset.Iic n)) โ X โi) ร X (n + 1)
Code
def _root_.MeasurableEquiv.IicSuccProd (X : โ โ Type*) [โ n, MeasurableSpace (X n)] (n : โ) :
MeasurableEquiv (ฮ i : Iic (n + 1), X i) ((ฮ i : Iic n, X i) ร X (n + 1)) :=
(MeasurableEquiv.IicProdIoc (Nat.le_succ n)).symm.trans
(MeasurableEquiv.prodCongr (MeasurableEquiv.refl _) (MeasurableEquiv.piSingleton n).symm)Used by (11)
Actions: Source ยท Open Issue
step๐
Learning.step
Step of the algorithm-environment sequence: the action-feedback pair at time n.
Learning.step.{u_1, u_2, u_3} {๐ : Type u_1} {๐จ : Type u_2} {ฮฉ : Type u_3} (A : โ โ ฮฉ โ ๐) (Y : โ โ ฮฉ โ ๐จ) (n : โ) (ฯ : ฮฉ) : ๐ ร ๐จLearning.step.{u_1, u_2, u_3} {๐ : Type u_1} {๐จ : Type u_2} {ฮฉ : Type u_3} (A : โ โ ฮฉ โ ๐) (Y : โ โ ฮฉ โ ๐จ) (n : โ) (ฯ : ฮฉ) : ๐ ร ๐จ
Code
def step (A : โ โ ฮฉ โ ๐) (Y : โ โ ฮฉ โ ๐จ) (n : โ) (ฯ : ฮฉ) : ๐ ร ๐จ := (A n ฯ, Y n ฯ)
Used by (12)
Actions: Source ยท Open Issue