关于贝叶斯 GP-LVM 实现细节的问题

如何解决关于贝叶斯 GP-LVM 实现细节的问题

我想了解贝叶斯 GPLVM 实现在 GPflow 中是如何工作的,但我正在为几行代码而苦苦挣扎。对于以下问题的任何帮助,我将不胜感激:

  1. 我了解 gplvm.py 的第 178 行中的矩阵 B:

B = AAT + tf.eye(num_inducing,dtype=default_float())

对应于方程中的 $\beta\Psi_2 + K_{MM}$。 Titsias and Lawrence 2010 的 14 个。但是,我不明白代码是如何实现这个表达式的。

  1. 关于上一个问题,我无法理解 gplvm.py 的第 175-181 行中的 A、tmp、AAT 和 c 是什么意思?
A = tf.linalg.triangular_solve(L,tf.transpose(psi1),lower=True) / sigma
tmp = tf.linalg.triangular_solve(L,psi2,lower=True)
AAT = tf.linalg.triangular_solve(L,tf.transpose(tmp),lower=True) / sigma2
B = AAT + tf.eye(num_inducing,dtype=default_float())
LB = tf.linalg.cholesky(B)
log_det_B = 2.0 * tf.reduce_sum(tf.math.log(tf.linalg.diag_part(LB)))
c = tf.linalg.triangular_solve(LB,tf.linalg.matmul(A,Y_data),lower=True) / sigma

我猜代码正在使用矩阵求逆引理,但我不知道如何使用。

  1. 在等式中。 14 来自 Titsias and Lawrence 2010,有三个术语我无法理解它们是如何在 gplvm.py 中计算的:

    • 0.5 \beta^2 y_d^T \Psi_1 (\beta\Psi_2+K_{MM})^{-1} \Psi_1^T y_d(这个公式出现在方程14下面的W的表达式中)立>
    • 0.5 D \beta Tr(K_{MM}^{-1} \Psi_2)
    • 0.5 D \log |K_{MM}|

如果有任何提示,我将不胜感激。

亲切的,华金

解决方法

计算elbo gplvm.py 的代码非常优雅和高效。如果有人想了解它,我会在下面回答我之前的问题并进一步发布notes

  1. 我了解 gplvm.py:182 中的矩阵 B:

B = AAT + tf.eye(num_inducing,dtype=default_float())

对应于方程中的 $\beta\Psi_2 + K_{MM}$。 14 的 Titsias 和 Lawrence 2010. 但是,我不明白 gplvm 代码如何 实现论文中的表达式。

在方程中调用矩阵 $\beta\Psi_2 + K_{MM}$ Titsias 和 Lawrence 2010 的 14(即 TL10)作为 D。在 gplvm.py 中,该矩阵计算为 D=LBL,其中 B 是上面给出的矩阵(即 B=AAT+I),L 是 K_ 的 Choleskly 因子{MM}。

  1. 关于上一个问题,我无法理解代码中的 A、tmp、AAT 和 c 是什么意思?

A = tf.linalg.triangular_solve(L,tf.transpose(psi1),lower=True) / sigma tmp = tf.linalg.triangular_solve(L,psi2,较低=真) AAT = tf.linalg.triangular_solve(L,tf.transpose(tmp),lower=True)/sigma2 B = AAT + tf.eye(num_inducing,dtype=default_float()) LB = tf.linalg.cholesky(B) log_det_B = 2.0 * tf.reduce_sum(tf.math.log(tf.linalg.diag_part(LB))) c = tf.linalg.triangular_solve(LB,tf.linalg.matmul(A,Y_data),lower=True)/sigma

我猜代码正在使用矩阵求逆引理,但我不知道如何使用。

代码没有使用矩阵求逆引理。

方程中的数据项。 TL10 的 14,(即指数中的项)是通过对向量 c 的 norm2 的平方计算得出的。

AAT 是出现在 TL10 中 Eq.~14 中最后一项的迹内的矩阵(即 $K_{MM}^{-1)\Psi_2)$)。

  1. 在方程式中。 14 来自 Titsias 和 Lawrence,2010 年,我无法理解三个术语是如何计算的:>
    • 0.5 \beta^2 y_d^T \Psi_1 (\beta\Psi_2+K_{MM})^{-1} \Psi_1^T y_d

    • 0.5 D \beta Tr(K_{MM}^{-1} \Psi_2)

    • 0.5 D \log |K_{MM}|

如上所述,第一项是取向量c的norm2的平方来计算的,第二项是取AAT的迹来计算的。等式中两个对数行列式的减法。 TL10 的 14(和第三项)是通过取 log |B| 来计算的。

漂亮的一段代码。谢谢。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?