释放双眼，带上耳机，听听看~！

本文讨论了正态分布的标准化方法，以及在VAE中的参数重整化过程。同时解释了高斯分布的概率密度函数与随机变量转化的过程。

正态分布标准化

对于一个服从高斯分布的随机变量 $N(mu,sigma^2)$ ，计算其均值 $μ$ 和标准差 $σ$ 。

其概率密度函数：

$sigma^2}} e^{-frac{(x-mu)^2}{2 sigma^2}}$

所谓“标准正态分布”，就是取 $μ = 0$ 一般 $σ2=1sigma^2=1$ 正态分布给出的。

其概率密度函数：

$e^{frac{-x^2} 2}$

对于任意一个正态分布的概率密度函数积分：

$sigma^2}} e^{-frac{(x-mu)^2}{2 sigma^2}} mathrm dx$

&= int frac {1}{sigma sqrt {2pi}}e^{-frac 1 2 left( frac{x-mu}{sigma} right)^2} mathrm d x

&= int frac{1}{sqrt{2 pi}} e^{-frac{1}{2}left(frac{x-mu}{sigma}right)^2} mathrm dleft(frac{x-mu}{sigma}right)
end{aligned} $\int f (x) d x = \int \frac{1}{2 π σ ^{2}} e^{- \frac{( x - μ ) ^{2}}{2 σ ^{2}}} d x = \int \frac{1}{σ 2 π} e^{- \frac{1}{2} (\frac{x - μ}{σ})^{2}} d x = \int \frac{1}{2 π} e^{- \frac{1}{2} (\frac{x - μ}{σ})^{2}} d (\frac{x - μ}{σ})$

令 $z=x−μσz = frac{x-mu}{sigma}$ ，上边公式就变成了：

$e^{-frac{z^2}{2}} mathrm dz$

所以我们可以得到新的随机变量 $z=x−μσz = frac{x-mu}{sigma}$ ，符合标准正态分布。

所以对于一个服从高斯分布的随机变量 $N(mu,sigma^2)$ ，取 $z=x−μσz = frac{x – mu}{sigma}$ 即可将其转化为标准高斯分布 $z \sim N (0, 1)$ 。

VAE中的参数重整化

VAE原文：Thesis.pdf (uva.nl)

正态分布标准化与VAE中的参数重整化

原来我们要从潜变量空间上随机采样一个值，就相当于从 $qϕ(z∣x)=N(μ,σ2)mathrm{q}_phi(mathbf{z} | mathbf{x}) = mathcal{N}left(mu, sigma^2right)$ 中直接取 $z$ 。

这样在反向传播过程中，“随机”这个过程是不可微的，因此无法使用梯度下降更新网络参数。因此我们需要将 $z$ 的产生变成一个确定过程。

借助正态分布标准化，取 $ϵ=z−μσepsilon = frac{mathbf z-mu}{sigma}$ ，我们可以知道 $ϵ \sim N (0, I)$ ，现在 $z = μ + ϵ \times σ$ 。

标准化之后，还是用的 $qϕ(z∣x)mathrm{q}_phi(mathbf{z} | mathbf{x})$ 的 $μ$ 和 $σ$ ，但是 $z$ 从 $qϕ(z∣x)=N(μ,σ2)mathrm{q}_phi(mathbf{z} | mathbf{x}) = mathcal{N}left(mu, sigma^2right)$ 中直接采样，变成了通过确定性方程 $g (ϕ, x, ϵ) = μ + ϵ \times σ$ 得到的。

采样 $z$ 变成从标准正态分布中采样一个 $ϵ$ ，将随机性转嫁到了 $ϵ$ 上，不影响整体的梯度传导。

也就是 Reparameterization Trick

DDPM中的参数重整化

Given a data point sampled from a real data distribution $x0∼q(x)mathbf{x}_0 sim q(mathbf{x})$ , let us define a forward diffusion process in which we add small amount of Gaussian noise to the sample in $T$ steps, producing a sequence of noisy samples $x1,…,xTmathbf{x}_1, ldots, mathbf{x}_T$ . The step sizes are controlled by a variance schedule ${βt∈(0,1)}t=1Tleft{beta_t in(0,1)right}_{t=1}^T$

潜变量的后验分布为：

$q(x1:T∣x0)=∏t=1Tq(xt∣xt−1)qleft(mathbf{x}_{1: T} mid mathbf{x}_0right)=prod_{t=1}^T qleft(mathbf{x}_t mid mathbf{x}_{t-1}right)$

拆开看 $x_t$ 的后验分布如下：

$q(xt∣xt−1)=N(xt;1−βtxt−1,βtI)qleft(mathbf{x}_t mid mathbf{x}_{t-1}right)=mathcal{N}left(mathbf{x}_t ; sqrt{1-beta_t} mathbf{x}_{t-1}, beta_t mathbf{I}right)$

然后我们就可以认为每个时间步 $t$ 的图像是从均值为 $μt=1−βtxt−1{mu}_t = sqrt{1 – beta_t} mathbf {x}_{t-1}$ 、方差为 $σt2=βtsigma^2_t = beta_t$ 的高斯分布中画出来的。

借助参数重整化可以写成:

${x}_t = sqrt{1 – beta_t}mathbf {x}_{t-1} + sqrt{beta_t} mathbf{epsilon}$

其中 $ϵ \sim N (0, I)$ ，是从标准高斯分布中采样的噪声。

本文正在参加「金石计划」

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

正态分布标准化与VAE中的参数重整化

正态分布标准化

VAE中的参数重整化

DDPM中的参数重整化

对抗生成网络GAN系列——EGBAD原理及缺陷检测实战

转转搜索少无结果模块简介及技术实现

GeoSpy.ai

Globe Explorer

即梦Dreamina

Luma Dream Machine

Motionshop

StoryDiffusion

归档

{{userData.name}}已认证

正态分布标准化

VAE中的参数重整化

DDPM中的参数重整化

对抗生成网络GAN系列——EGBAD原理及缺陷检测实战

转转搜索少无结果模块简介及技术实现

什么是变分推理？变分推理的数学推导公式

深入浅出OCR技术导论

GPT-4内幕大揭露！1.8万亿巨量参数，13万亿token训练，斥资6300万美元

Amazon CodeWhisperer: 亚马逊出品的代码生成器