首页 » 机器学习 » 线性代数--矩阵乘法

线性代数--矩阵乘法

 

大多数人在高中,或者大学低年级,都上过一门课《线性代数》。这门课其实是教矩阵。

刚学的时候,还蛮简单的,矩阵加法就是相同位置的数字加一下。

矩阵减法也类似。

矩阵乘以一个常数,就是所有位置都乘以这个数。

但是,等到矩阵乘以矩阵的时候,一切就不一样了。

这个结果是怎么算出来的?

教科书告诉你,计算规则是,第一个矩阵第一行的每个数字(2和1),各自乘以第二个矩阵第一列对应位置的数字(1和1),然后将乘积相加( 2 x 1 + 1 x 1),得到结果矩阵左上角的那个值3。

也就是说,结果矩阵第m行与第n列交叉位置的那个值,等于第一个矩阵第m行与第二个矩阵第n列,对应位置的每个值的乘积之和。

怎么会有这么奇怪的规则?

我一直没理解这个规则的含义,导致《线性代数》这门课就没学懂。研究生时发现,线性代数是向量计算的基础,很多重要的数学模型都要用到向量计算,所以我做不了复杂模型。这一直让我有点伤心。

前些日子,受到一篇文章的启发,我终于想通了,矩阵乘法到底是什么东西。关键就是一句话,矩阵的本质就是线性方程式,两者是一一对应关系。如果从线性方程式的角度,理解矩阵乘法就毫无难度。

下面是一组线性方程式。

矩阵的最初目的,只是为线性方程组提供一个简写形式。

老实说,从上面这种写法,已经能看出矩阵乘法的规则了:系数矩阵第一行的2和1,各自与 x 和 y 的乘积之和,等于3。不过,这不算严格的证明,只是线性方程式转为矩阵的书写规则。

下面才是严格的证明。有三组未知数 x、y 和 t,其中 x 和 y 的关系如下。

x 和 t 的关系如下。

有了这两组方程式,就可以求 y 和 t 的关系。从矩阵来看,很显然,只要把第二个矩阵代入第一个矩阵即可。

从方程式来看,也可以把第二个方程组代入第一个方程组。

上面的方程组可以整理成下面的形式。

最后那个矩阵等式,与前面的矩阵等式一对照,就会得到下面的关系。

矩阵乘法的计算规则,从而得到证明。

 

 

 分块矩阵

(1) 分块矩阵简介:

一个分块矩阵(分段矩阵)就是将矩阵分割出较小的矩形矩阵,这些较小的矩阵就称为区块。换个方式来说,就是以较小的矩阵组合成一个矩阵。通过将大的矩阵通过分块的方式划分,并将每个分块(称为子块)看做另一个矩阵的元素,这样之后再参与运算,通常可以简化运算。例如,有的大矩阵可以通过分块变为对角矩阵或者是三角矩阵等特殊形式的矩阵。分块矩阵的分割原则是以水平线和垂直线进行划分:

(2)分块矩阵的运算法则:

(i)对于加法,数乘,矩阵乘法就是对每个子块执行对应的操作

(ii)对于加法要注意分块的时候要确保对应子块的行列数要相同也就是要用相同的方法分块.

设矩阵A和B的行列数相同,并采用相同的分块法分成:

若A和B的对应字块有相同行列号则:

(iii)对于矩阵乘法要注意对应子块要确保相乘是有意义的(第一个子块的列数等于第二个的行数)

设A为m × l矩阵 , B为l × n矩阵 ,分块成:

若A的子块的列数等于B对应子块的行数则:

与分块矩阵相关的其他问题会在以后介绍。

原文链接:线性代数--矩阵乘法,转载请注明来源!

0