典型关联分析（Canonical Correlation Analysis）

news/2024/7/10 5:33:51 标签: application, 数据挖掘, 优化, c

cle class="baidu_pl">

cle_content" class="article_content clearfix">

content_views" class="htmledit_views">

1. 问题

在线性回归中࿰c;我们使用直线来拟合样本点࿰c;寻找n维特征向量X和输出结果（或者叫做label）Y之间的线性关系。其中 <a class= clip_image002" border="0" alt="clip_image002" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202015572875.png" width="41" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c; <a class= clip_image004" border="0" alt="clip_image004" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202015589353.png" width="33" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />。然而当Y也是多维时࿰c;或者说Y也有多个特征时࿰c;我们希望分析出X和Y的关系。

当然我们仍然可以使用回归的方法来分析࿰c;做法如下：

假设 <a class= clip_image002[1]" border="0" alt="clip_image002[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202015581055.png" width="41" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c; <a class= clip_image006" border="0" alt="clip_image006" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202015599.png" width="44" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;那么可以建立等式Y=AX如下

其中 <a class= clip_image010" border="0" alt="clip_image010" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202015593106.png" width="55" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;形式和线性回归一样࿰c;需要训练m次得到m个 <a class= clip_image012" border="0" alt="clip_image012" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016001220.png" width="15" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />。

这样做的一个缺点是࿰c;Y中的每个特征都与X的所有特征关联࿰c;Y中的特征之间没有什么联系。

我们想换一种思路来看这个问题࿰c;如果将X和Y都看成整体࿰c;考察这两个整体之间的关系。我们将整体表示成X和Y各自特征间的线性组合࿰c;也就是考察 <a class= clip_image014" border="0" alt="clip_image014" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016006586.png" width="23" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image016" border="0" alt="clip_image016" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016018811.png" width="23" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />之间的关系。

这样的应用其实很多࿰c;举个简单的例子。我们想考察一个人解题能力X（解题速度 <a class= clip_image018" border="0" alt="clip_image018" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016015289.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;解题正确率 <a class= clip_image020" border="0" alt="clip_image020" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016021767.png" width="14" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />）与他/她的阅读能力Y（阅读速度 <a class= clip_image022" border="0" alt="clip_image022" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016031833.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;理解程度 <a class= clip_image024" border="0" alt="clip_image024" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016031899.png" width="14" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />）之间的关系࿰c;那么形式化为：

然后使用Pearson相关系数

来度量u和v的关系࿰c;我们期望寻求一组最优的解a和b࿰c;使得Corr(u, v)最大࿰c;这样得到的a和b就是使得u和v就有最大关联的权重。

到这里࿰c;基本上介绍了典型相关分析的目的。

2. CCA表示与求解

给定两组向量 <a class= clip_image032" border="0" alt="clip_image032" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016054540.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image034" border="0" alt="clip_image034" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016056765.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />（替换之前的x为 <a class= clip_image032[1]" border="0" alt="clip_image032[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016069655.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;y为 <a class= clip_image034[1]" border="0" alt="clip_image034[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016063833.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />）࿰c; <a class= clip_image032[2]" border="0" alt="clip_image032[2]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016073899.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />维度为 <a class= clip_image036" border="0" alt="clip_image036" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016072329.png" width="14" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c; <a class= clip_image034[2]" border="0" alt="clip_image034[2]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016085393.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />维度为 <a class= clip_image038" border="0" alt="clip_image038" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016083507.png" width="14" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;默认 <a class= clip_image040" border="0" alt="clip_image040" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016091622.png" width="46" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />。形式化表示如下：

<a class= clip_image044" border="0" alt="clip_image044" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016091688.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />是x的协方差矩阵；左上角是 <a class= clip_image032[3]" border="0" alt="clip_image032[3]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201610641.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />自己的协方差矩阵；右上角是 <a class= clip_image046" border="0" alt="clip_image046" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201610118.png" width="65" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />；左下角是 <a class= clip_image048" border="0" alt="clip_image048" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016106770.png" width="65" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;也是 <a class= clip_image050" border="0" alt="clip_image050" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016117393.png" width="20" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />的转置；右下角是 <a class= clip_image034[3]" border="0" alt="clip_image034[3]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016127459.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />的协方差矩阵。

与之前一样࿰c;我们从 <a class= clip_image032[4]" border="0" alt="clip_image032[4]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016125889.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image034[4]" border="0" alt="clip_image034[4]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016135955.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />的整体入手࿰c;定义

我们可以算出u和v的方差和协方差：

上面的结果其实很好算࿰c;推导一下第一个吧：

最后࿰c;我们需要算Corr(u,v)了

我们期望Corr(u,v)越大越好࿰c;关于Pearson相关系数࿰c;《class="tags" href="/tags/ShuJuWaJue.html" title=数据挖掘>数据挖掘导论》给出了一个很好的图来说明：

横轴是u࿰c;纵轴是v࿰c;这里我们期望通过调整a和b使得u和v的关系越像最后一个图越好。其实第一个图和最后一个图有联系的࿰c;我们可以调整a和b的符号࿰c;使得从第一个图变为最后一个。

接下来我们求解a和b。

回想在LDA中࿰c;也得到了类似Corr(u,v)的公式࿰c;我们在求解时固定了分母࿰c;来求分子（避免a和b同时扩大n倍仍然符号解条件的情况出现）。这里我们同样这么做。

这个class="tags" href="/tags/YouHua.html" title=优化>优化问题的条件是：

cellspacing="0" cellpadding="0">

Maximize <a class= clip_image068" border="0" alt="clip_image068" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016163253.png" width="48" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />

Subject to: <a class= clip_image070" border="0" alt="clip_image070" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016162730.png" width="166" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />

求解方法是构造Lagrangian等式࿰c;这里我简单推导如下：

求导࿰c;得

令导数为0后࿰c;得到方程组：

第一个等式左乘 <a class= clip_image082" border="0" alt="clip_image082" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201618420.png" width="15" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;第二个左乘 <a class= clip_image084" border="0" alt="clip_image084" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016192678.png" width="15" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;再根据 <a class= clip_image086" border="0" alt="clip_image086" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201619519.png" width="143" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;得到

也就是说求出的 <a class= clip_image090" border="0" alt="clip_image090" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016201174.png" width="7" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />即是Corr(u,v)࿰c;只需找最大 <a class= clip_image090[1]" border="0" alt="clip_image090[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016214305.png" width="7" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />即可。

让我们把上面的方程组进一步简化࿰c;并写成矩阵形式࿰c;得到

写成矩阵形式

令

那么上式可以写作：

显然࿰c;又回到了求特征值的老路上了࿰c;只要求得 <a class= clip_image102" border="0" alt="clip_image102" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016232551.png" width="32" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />的最大特征值 <a class= clip_image104" border="0" alt="clip_image104" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016243522.png" width="28" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;那么Corr(u,v)和a和b都可以求出。

在上面的推导过程中࿰c;我们假设了 <a class= clip_image106" border="0" alt="clip_image106" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016242160.png" width="20" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image108" border="0" alt="clip_image108" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016255291.png" width="20" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />均可逆。一般情况下都是可逆的࿰c;只有存在特征间线性相关时会出现不可逆的情况࿰c;在本文最后会提到不可逆的处理办法。

再次审视一下࿰c;如果直接去计算 <a class= clip_image102[1]" border="0" alt="clip_image102[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201626373.png" width="32" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />的特征值࿰c;复杂度有点高。我们将第二个式子代入第一个࿰c;得

这样先对 <a class= clip_image112" border="0" alt="clip_image112" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016261278.png" width="83" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />求特征值 <a class= clip_image114" border="0" alt="clip_image114" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016271901.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和特征向量 <a class= clip_image116" border="0" alt="clip_image116" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016283603.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;然后根据第二个式子求得b。

待会举个例子说明求解过程。

假设按照上述过程࿰c;得到了 <a class= clip_image090[2]" border="0" alt="clip_image090[2]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016286493.png" width="7" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />最大时的 <a class= clip_image118" border="0" alt="clip_image118" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016298195.png" width="14" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image120" border="0" alt="clip_image120" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016296625.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />。那么 <a class= clip_image118[1]" border="0" alt="clip_image118[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016306691.png" width="14" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image120[1]" border="0" alt="clip_image120[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201631901.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />称为典型变量（canonical variates）࿰c; <a class= clip_image090[3]" border="0" alt="clip_image090[3]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016317903.png" width="7" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />即是u和v的相关系数。

最后࿰c;我们得到u和v的等式为：

我们也可以接着去寻找第二组典型变量对࿰c;其最class="tags" href="/tags/YouHua.html" title=优化>优化条件是

cellspacing="0" cellpadding="0">

Maximize <a class= clip_image126" border="0" alt="clip_image126" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016329397.png" width="54" height="21" style="border-bottom:0px; border-left:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />

Subject to: <a class= clip_image128" border="0" alt="clip_image128" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201632510.png" width="179" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />

其实第二组约束条件就是 <a class= clip_image132" border="0" alt="clip_image132" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016333608.png" width="191" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />。

计算步骤同第一组计算方法࿰c;只不过是 <a class= clip_image090[4]" border="0" alt="clip_image090[4]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016335069.png" width="7" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />取 <a class= clip_image112[1]" border="0" alt="clip_image112[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016338134.png" width="83" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />的第二大特征值。

得到的 <a class= clip_image134" border="0" alt="clip_image134" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016342660.png" width="14" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image136" border="0" alt="clip_image136" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016357186.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />其实也满足

总结一下࿰c;i和j分别表示 <a class= clip_image142" border="0" alt="clip_image142" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016364777.png" width="12" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image144" border="0" alt="clip_image144" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016364843.png" width="12" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />得到结果

3. CCA计算例子

我们回到之前的评价一个人解题和其阅读能力的关系的例子。假设我们通过对样本计算协方差矩阵得到如下结果：

然后求 <a class= clip_image112[2]" border="0" alt="clip_image112[2]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016377135.png" width="83" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;得

这里的A和前面的 <a class= clip_image156" border="0" alt="clip_image156" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016384136.png" width="79" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />中的A不是一回事（这里符号有点乱࿰c;不好意思）。

然后对A求特征值和特征向量࿰c;得到

然后求b࿰c;之前我们说的方法是根据 <a class= clip_image160" border="0" alt="clip_image160" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016384725.png" width="86" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />求b࿰c;这里࿰c;我们也可以采用类似求a的方法来求b。

回想之前的等式

我们将上面的式子代入下面的࿰c;得

然后直接对 <a class= clip_image164" border="0" alt="clip_image164" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016398172.png" width="83" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />求特征向量即可࿰c;注意 <a class= clip_image164[1]" border="0" alt="clip_image164[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016391237.png" width="83" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image112[3]" border="0" alt="clip_image112[3]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201639713.png" width="83" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />的特征值相同࿰c;这个可以自己证明下。

不管使用哪种方法࿰c;

这里我们得到a和b的两组向量࿰c;到这还没完࿰c;我们需要让它们满足之前的约束条件

这里的 <a class= clip_image172" border="0" alt="clip_image172" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016411402.png" width="12" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />应该是我们之前得到的VecA中的列向量的m倍࿰c;我们只需要求得m࿰c;然后将VecA中的列向量乘以m即可。

这里的 <a class= clip_image176" border="0" alt="clip_image176" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016414532.png" width="16" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />是VecA的列向量。

因此最后的a和b为：

第一组典型变量为

4. Kernel Canonical Correlation Analysis（KCCA）

通常当我们发现特征的线性组合效果不够好或者两组集合关系是非线性的时候࿰c;我们会尝试核函数方法࿰c;这里我们继续介绍Kernel CCA。

在《支持向量机-核函数》那一篇中࿰c;大致介绍了一下核函数࿰c;这里再简单提一下：

当我们对两个向量作内积的时候

我们可以使用 <a class= clip_image200" border="0" alt="clip_image200" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016464504.png" width="30" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c; <a class= clip_image202" border="0" alt="clip_image202" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016472618.png" width="31" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />来替代 <a class= clip_image204" border="0" alt="clip_image204" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016482684.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image206" border="0" alt="clip_image206" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016487211.png" width="7" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;比如原来的 <a class= clip_image204[1]" border="0" alt="clip_image204[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016499785.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />特征向量为 <a class= clip_image208" border="0" alt="clip_image208" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016499261.png" width="70" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;那么

我们可以定义

如果 <a class= clip_image202[1]" border="0" alt="clip_image202[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016507409.png" width="31" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />与 <a class= clip_image200[1]" border="0" alt="clip_image200[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016517475.png" width="30" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />的构造一样࿰c;那么

这样࿰c;仅通过计算x和y的内积的平方就可以达到在高维空间（这里为 <a class= clip_image216" border="0" alt="clip_image216" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016512001.png" width="15" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />）中计算 <a class= clip_image218" border="0" alt="clip_image218" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016528479.png" width="30" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image220" border="0" alt="clip_image220" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201653181.png" width="31" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />内积的效果。

由核函数࿰c;我们可以得到核矩阵K࿰c;其中

即第 <a class= clip_image224" border="0" alt="clip_image224" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016546136.png" width="5" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />行第 <a class= clip_image226" border="0" alt="clip_image226" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016547838.png" width="5" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />列的元素是第 <a class= clip_image224[1]" border="0" alt="clip_image224[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016556791.png" width="5" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />个和第 <a class= clip_image226[1]" border="0" alt="clip_image226[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016556857.png" width="5" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />个样例在核函数下的内积。

一个很好的核函数定义：

其中样例x有n个特征࿰c;经过 <a class= clip_image218[1]" border="0" alt="clip_image218[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016569465.png" width="30" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />变换后࿰c;从n维特征上升到了N维特征࿰c;其中每一个特征是 <a class= clip_image230" border="0" alt="clip_image230" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016562529.png" width="142" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />。

回到CCA࿰c;我们在使用核函数之前

这里假设x和y都是n维的࿰c;引入核函数后࿰c; <a class= clip_image236" border="0" alt="clip_image236" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016582138.png" width="35" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image238" border="0" alt="clip_image238" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016585203.png" width="36" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />变为了N维。

使用核函数后࿰c;u和v的公式为：

这里的c和d都是N维向量。

现在我们有样本 <a class= clip_image244" border="0" alt="clip_image244" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016592760.png" width="69" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;这里的 <a class= clip_image246" border="0" alt="clip_image246" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202016593383.png" width="12" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />表示样本x的第i个样例࿰c;是n维向量。

根据前面说过的相关系数࿰c;构造拉格朗日公式如下：

其中

然后让L对a求导࿰c;令导数等于0࿰c;得到（这一步我没有验证࿰c;待会从宏观上解释一下）

同样对b求导࿰c;令导数等于0࿰c;得到

求出c和d干嘛呢？c和d只是 <a class= clip_image258" border="0" alt="clip_image258" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017015500.png" width="10" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />的系数而已࿰c;按照原始的CCA做法去做就行了呗࿰c;为了再引入 <a class= clip_image260" border="0" alt="clip_image260" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017016089.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image262" border="0" alt="clip_image262" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017026679.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />？

回答这个问题要从核函数的意义上来说明。核函数初衷是希望在式子中有 <a class= clip_image264" border="0" alt="clip_image264" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017029536.png" width="66" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;然后用K替换之࿰c;根本没有打算去计算出实际的 <a class= clip_image258[1]" border="0" alt="clip_image258[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017034269.png" width="10" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />。因此即是按照原始CCA的方式计算出了c和d࿰c;也是没用的࿰c;因为根本有没有实际的 <a class= clip_image258[2]" border="0" alt="clip_image258[2]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201703747.png" width="10" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />让我们去做 <a class= clip_image266" border="0" alt="clip_image266" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017033812.png" width="44" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />。另一个原因是核函数比如高斯径向基核函数可以上升到无限维࿰c;N是无穷的࿰c;因此c和d也是无穷维的࿰c;根本没办法直接计算出来。我们的思路是在原始的空间中构造出权重 <a class= clip_image260[1]" border="0" alt="clip_image260[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201704290.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image262[1]" border="0" alt="clip_image262[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017051992.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c;然后利用 <a class= clip_image258[3]" border="0" alt="clip_image258[3]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017052058.png" width="10" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />将 <a class= clip_image260[2]" border="0" alt="clip_image260[2]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017064076.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image262[2]" border="0" alt="clip_image262[2]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017072506.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />上升到高维࿰c;他们在高维对应的权重就是c和d。

虽然 <a class= clip_image260[3]" border="0" alt="clip_image260[3]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017074208.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image262[3]" border="0" alt="clip_image262[3]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017082322.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />是在原始空间中（维度为样例个数M）࿰c;但其作用点不是在原始特征上࿰c;而是原始样例上。看上面得出的c和d的公式就知道。 <a class= clip_image260[4]" border="0" alt="clip_image260[4]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017088800.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />通过控制每个高维样例的权重࿰c;来控制c。

好了࿰c;接下来我们看看使用 <a class= clip_image260[5]" border="0" alt="clip_image260[5]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017096915.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image262[4]" border="0" alt="clip_image262[4]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017105344.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />后࿰c;u和v的变化

<a class= clip_image272" border="0" alt="clip_image272" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017105411.png" width="39" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />表示可以将第i个样例上升到的N维向量࿰c; <a class= clip_image274" border="0" alt="clip_image274" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017117952.png" width="35" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />意义可以类比原始CCA的x。

鉴于这样表示接下来会越来越复杂࿰c;改用矩阵形式表示。

简写为

其中X（M×N）为

我们发现

我们可以算出u和v的方差和协方差（这里实际上事先对样本 <a class= clip_image204[2]" border="0" alt="clip_image204[2]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017121149.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image284" border="0" alt="clip_image284" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017127801.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />做了均值归0处理）：

这里 <a class= clip_image274[1]" border="0" alt="clip_image274[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017134869.png" width="35" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image292" border="0" alt="clip_image292" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017146297.png" width="36" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />维度可以不一样。

最后࿰c;我们得到Corr(u,v)

可以看到࿰c;在将 <a class= clip_image018[1]" border="0" alt="clip_image018[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017144935.png" width="13" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />和 <a class= clip_image020[1]" border="0" alt="clip_image020[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017141936.png" width="14" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />处理成 <a class= clip_image296" border="0" alt="clip_image296" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017153365.png" width="57" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />࿰c; <a class= clip_image298" border="0" alt="clip_image298" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/2011062020171517.png" width="58" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />后࿰c;得到的结果和之前形式基本一样࿰c;只是将 <a class= clip_image044[1]" border="0" alt="clip_image044[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017156495.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />替换成了两个K乘积。

因此࿰c;得到的结果也是一样的࿰c;之前是

其中

引入核函数后࿰c;得到

其中

注意这里的两个w有点区别࿰c;前面的 <a class= clip_image116[1]" border="0" alt="clip_image116[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017173072.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />维度和x的特征数相同࿰c; <a class= clip_image302" border="0" alt="clip_image302" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017189235.png" width="8" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />维度和y的特征数相同。后面的 <a class= clip_image304" border="0" alt="clip_image304" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017181809.png" width="9" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />维度和x的样例数相同࿰c; <a class= clip_image306" border="0" alt="clip_image306" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/20110620201719762.png" width="9" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />维度和y的样例数相同࿰c;严格来说“ <a class= clip_image304[1]" border="0" alt="clip_image304[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017193303.png" width="9" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />维度= <a class= clip_image306[1]" border="0" alt="clip_image306[1]" src="http://images.cnblogs.com/cnblogs_com/jerrylead/201106/201106202017205006.png" width="9" height="21" style="border-bottom:0px; border-left:0px; margin:0px; padding-left:0px; padding-right:0px; display:inline; border-top:0px; border-right:0px; padding-top:0px" />维度”。

5. 其他话题

1、当协方差矩阵不可逆时࿰c;怎么办？

要进行regularization。

一种方法是将前面的KCCA中的拉格朗日等式加上二次正则化项࿰c;即：

这样求导后得到的等式中࿰c;等式右边的矩阵一定是正定矩阵。

第二种方法是在Pearson系数的分母上加入正则化项࿰c;同样结果也一定可逆。

2、求Kernel矩阵效率不高怎么办？

使用Cholesky decomposition压缩法或者部分Gram-Schmidt正交化法࿰c;。

3、怎么使用CCA用来做预测？

c="http://pic002.cnblogs.com/images/2011/279228/2011082622053268.png" />

c="http://pic002.cnblogs.com/images/2011/279228/2011082622010459.png" />

4、如果有多个集合怎么办？X、Y、Z…？怎么衡量多个样本集的关系？

这个称为Generalization of the Canonical Correlation。方法是使得两两集合的距离差之和最小。可以参考文献2。

6. 参考文献

1、 http://www.stat.tamu.edu/~rrhocking/stat636/LEC-9.636.pdf

2、 Canonical correlation analysis: An overview with class="tags" href="/tags/APPLICATION.html" title=application>application to learning methods. David R. Hardoon , Sandor Szedmak and John Shawe-Taylor

3、 A kernel method for canonical correlation analysis. Shotaro Akaho

4、 Canonical Correlation a Tutorial. Magnus Borga

5、 Kernel Canonical Correlation Analysis. Max Welling

cle>

http://www.niftyadmin.cn/n/1759814.html