jaclearn.rl.algo.math#

Classes

`LinearValueRegressor`
`ObservationNormalizer`

Functions

`compute_gae`(rewards, values, next_val, ...)
`discount_cumsum`(x, gamma)	Compute the discounted cumulative summation of an 1-d array.
`discount_return`(x, discount)	Compute the discounted return summation of an 1-d array.
`normalize_advantage`(adv)

Class LinearValueRegressor

class LinearValueRegressor[source]#

Bases: object

Class ObservationNormalizer

class ObservationNormalizer[source]#

Bases: object

Functions

discount_cumsum(x, gamma)[source]#: Compute the discounted cumulative summation of an 1-d array. From rll/rllab

discount_return(x, discount)[source]#: Compute the discounted return summation of an 1-d array. From rll/rllab