이전 글 보러 가기
선형대수학 하면 가장 먼저 떠오르는 개념이 무엇인가요? 바로 행렬일 것입니다. 이번 시간부터는 '행렬표현'이라는 것을 다룹니다. 벡터공간은 너무 추상적이잖아요? 그런데 추상적인 벡터를 구체적인 형태의 행렬로써 표현하겠다는 것입니다. 이번 글을 통해서 왜 행렬이 선형대수학을 기술하는 좋은 수학적 도구인지 살펴볼 것입니다. 그리고 행렬의 곱 아시는 분들은 행렬의 곱이 왜 복잡하게 정의되어 있는지 궁금해 하셨을텐데요, 그 비밀도 풀 것입니다.
먼저 순서 기저의 개념을 알 필요가 있습니다. 순서기저는 순서가 주어진 기저로, $\mathbb{C}^3$에서 $\left\{e_1, e_2, e_3\right\}$와 $\left\{e_1, e_3, e_1\right\}$은 서로 다른 순서기저입니다. $\left\{e_1, e_2, \cdots, e_n\right\}$은 $\mathbb{C}^n$의 표준 순서기저라고 부릅니다.
이제 좌표벡터라는 개념을 도입하겠습니다.
벡터공간 $\mathsf{V}$의 순서기저가 $\beta=\left\{v_1, \cdots, v_n \right\}$일 때 $x \in \mathsf{V}$가 $x = \displaystyle \sum_{i=1}^{n}a_iv_i$의 일차결합으로 나타내어지면 $\beta$에 대한 $x$의 좌표벡터는 일차결합 계수를 열벡터로 표시한 것으로, 다음과 같다. $$[x]_\beta=\begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}$$
좌표벡터에는 다음과 같은 성질이 있습니다.
$x \rightarrow [x]_\beta$를 함수라고 보면, 이 함수는 선형변환이며, 전단사(일대일대응)이다.
- 선형변환인 이유: $x = \displaystyle \sum_{i=1}^{n}a_iv_i$, $y = \displaystyle \sum_{i=1}^{n}b_iv_i$라 하면 $$cx+y = \displaystyle \sum_{i=1}^{n}(ca_i+b_i)v_i$$이고 $$[cx+y]_\beta = \begin{pmatrix} ca_1+b_1 \\ ca_2+b_2 \\ \vdots \\ ca_n+b_n \end{pmatrix}$$이므로 $cx+y \rightarrow c[x]_\beta+[y]_\beta$입니다.
- 전사함수인 이유: 각각의 좌표벡터 $[x]_\beta=(a_i)$마다 $x=\displaystyle \sum_{i=1}^{n}a_iv_i$가 대응되므로 전사함수입니다.
- 단사함수인 이유: $\mathrm{dim}(\mathsf{V})=n$이고, $\mathrm{dim}(\left\{[x]_\beta\,|\,x \in \mathsf{V}\right\})=\mathrm{dim}(\mathbb{C}^n)=n$이므로 차원정리 (1-15)와 $x \rightarrow [x]_\beta$가 전사함수라는 사실에 의해 단사함수입니다.
$x \rightarrow [x]_\beta$가 일대응대응이기 때문에 벡터공간을 $\mathbb{C}^n$으로 옮겨서 생각할 수 있습니다.
이제 선형변환의 행렬표현을 알아봅시다.
두 벡터공간 $\mathsf{V}$, $\mathsf{W}$의 순서기저를 $\beta=\left\{v_1, v_2 \cdots, v_n \right\}$, $\gamma=\left\{u_1, u_2 \cdots, u_m \right\}$라 합시다. 선형변환 $\mathsf{T:V \rightarrow W}$에 대하여 $\mathsf{T}(v_j)=\displaystyle \sum_{i=1}^{m}a_{ij}u_i$로 나타낼 수 있으며, $a_{ij}$는 (1-14)에 의해 유일합니다.
$A_{ij}=a_{ij}$인 $m \times n$인 행렬 $A$를 순서기저 $\beta$, $\gamma$에 대한 선형변환 $\mathsf{T}$의 행렬표현이라고 부르고, $[\mathsf{T}]_{\beta}^{\gamma}$라 표기한다. $\mathsf{V}=\mathsf{W}$이고, 순서기저도 같게 주어져서 $[\mathsf{T}]_{\beta}^{\beta}$일 때는 간단히 $[\mathsf{T}]_{\beta}$로 표기한다.
$x \in \mathsf{V}$에 대하여 $$[\mathsf{T}(x)]_{\gamma} = [\mathsf{T}]_{\beta}^{\gamma} [x]_{\beta}$$이고, 이때 행렬 $[\mathsf{T}]_{\beta}^{\gamma}$와 행벡터 $[x]_{\beta}$의 곱은 $$([\mathsf{T}(x)]_{\gamma})_i = \displaystyle \sum_{j=1}^{n} ([\mathsf{T}]_{\beta}^{\gamma})_{ij} ([x]_{\beta})_j = \displaystyle \sum_{j=1}^{n} a_{ij} ([x]_{\beta})_j$$로 정의됨을 알 수 있습니다.
선형변환 $\mathsf{T}(a, b) = (3a, 2a+b, -4b)$에 대해서 $\beta$, $\gamma$를 각각 표준 순서기저로 잡을 때 $$\mathsf{T}(1, 0) = (3, 2, 0)=3(1, 0, 0)+2(0, 1, 0)+0(0, 0, 1)$$ $$\mathsf{T}(0, 1) = (0, 1, -4)=0(1, 0, 0)+1(0, 1, 0)+(-4)(0, 0, 1)$$
이므로 $$[\mathsf{T}]_{\beta}^{\gamma} = \begin{pmatrix} 3 & 0 \\ 2 & 1 \\ 3 & 0 \end{pmatrix}$$입니다.
영변환을 나타내는 행렬은 영행렬로, 모든 성분의 값이 $0$인 행렬입니다. $O$라고도 씁니다.
항등변환을 나타내는 행렬은 항등행렬로, $[\mathsf{I_V} ]_{\beta} = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & 1 \end{pmatrix}$입니다. $I_n$이라고도 씁니다. 크로네커 델타 $\delta_{ij}=\left\{\begin{matrix} 1(i=j) \\ 0(i \neq j) \end{matrix}\right.$에 대해서 $(I_n)_{ij}=\delta_{ij}$입니다.
함수의 합과 스칼라 곱이 정의되어 있듯이 선형변환도 합과 스칼라 곱이 정의되어 있습니다.
- 합: $(\mathsf{T+U})(x) = \mathsf{T}(x)+\mathsf{U}(x)$
- 스칼라 곱: $(a \mathsf{T+U})(x) = a\mathsf{T}(x)$
선형변환의 합과 스칼라 곱과 관련하여 중요한 성질이 있습니다. 이 성질들은 증명하기 쉬워서 증명하지는 않겠습니다.
- $a\mathsf{T+U}$는 선형변환이다.
- $[a\mathsf{T+U}]_{\beta}^{\gamma} = a[\mathsf{T}]_{\beta}^{\gamma} + [\mathsf{U}]_{\beta}^{\gamma}$
지금부터는 선형변환의 합성에 대해서 다루겠습니다.
두 선형변환 $\mathsf{T:V \rightarrow W}$, $\mathsf{U:W \rightarrow Z}$에 대하여 선형변환의 합성은 $\mathsf{U \circ T = UT}$라 표기한다.
두 선형변환의 합성 $\mathsf{UT}$는 선형변환입니다.
$$\begin{aligned} \mathsf{UT}(cx+y) & =\mathsf{U}(\mathsf{T}(cx+y))=\mathsf{U}(c\mathsf{T}(x)+\mathsf{T}(y)) \\ & =c \mathsf{U}(\mathsf{T}(x))+\mathsf{U}(\mathsf{T}(y))=c\mathsf{UT}(x)+\mathsf{UT}(y) \end{aligned}$$
또한 $\mathsf{S \rightarrow V}$의 선형변환 $\mathsf{T}$, $\mathsf{T}_1$,$\mathsf{T}_2$와 $\mathsf{V \rightarrow W}$의 선형변환 $\mathsf{U}$, $\mathsf{U}_1$,$\mathsf{U}_2$, 그리고 $\mathsf{W \rightarrow Z}$의 선형변환 $\mathsf{X}$에 대하여 다음 성질이 성립합니다.
- $\mathsf{U}(\mathsf{T}_1+\mathsf{T}_2) = \mathsf{U}\mathsf{T}_1+\mathsf{U}\mathsf{T}_2$
- $(\mathsf{U}_1+\mathsf{U}_2)\mathsf{T} = \mathsf{U}_1\mathsf{T}+\mathsf{U}_2\mathsf{T}$
- $\mathsf{(XU)T = X(UT)}$
- $\mathsf{TI= IT=T}$
- $a(\mathsf{UT}) = (a \mathsf{U})\mathsf{T} = \mathsf{U} (a\mathsf{T})$
성질 1, 2, 3만 증명하겠습니다. 4, 5는 어렵지 않으니 직접 해보시기 바랍니다.
- $\mathsf{U}(\mathsf{T}_1+\mathsf{T}_2)(x) = \mathsf{U}(\mathsf{T}_1(x)+\mathsf{T}_2(x)) = \mathsf{U}\mathsf{T}_1(x)+\mathsf{U}\mathsf{T}_2(x)$
- $(\mathsf{U}_1 + \mathsf{U}_2)\mathsf{T}(x) = \mathsf{U}_1(\mathsf{T}(x)) + \mathsf{U}_2(\mathsf{T}(x)) = \mathsf{U}_1\mathsf{T}(x) + \mathsf{U}_2\mathsf{T}(x)$
- $\mathsf{(XU)T}(x) = \mathsf{X \circ U(T(}x)) = \mathsf{X(U(T(}x)))$
그리고, $\mathsf{X(UT)}(x) = \mathsf{X(U\circ T(}x)) = \mathsf{X(U(T(}x)))$
성질 3에 의하면 선형변환의 합성 순서가 같다면 같은 합성함수이므로 $\mathsf{XUT}$라 적어도 혼동의 여지가 없습니다. 그리고 $\mathsf{T:V \rightarrow V}$에 대해서 $\mathsf{T}^1 = \mathsf{T}$, $\mathsf{T}^n = \mathsf{T}^{n-1} \mathsf{T}$, $\mathsf{T}^0 = \mathsf{I_V}$라 정의합니다.
이제 행렬곱에 대해 살펴봅시다.
두 선형변환 $\mathsf{T:V \rightarrow Z}$, $\mathsf{U:Z \rightarrow W}$이 있고, $\mathsf{V}$, $\mathsf{W}$, $\mathsf{Z}$의 기저를 각각 $\beta = \left\{ v_1, v_2, \cdots, v_n \right\}$, $\alpha = \left\{ z_1, z_2, \cdots, z_l \right\}$, $\alpha = \left\{ w_1, w_2, \cdots, w_m \right\}$라 하자. 두 행렬 $A=[\mathsf{U}]_{\alpha}^{\gamma}$, $B=[\mathsf{T}]_{\beta}^{\alpha}$의 곱은
$$AB=[\mathsf{UT}]_{\beta}^{\gamma} = [\mathsf{U}]_{\alpha}^{\gamma} [\mathsf{T}]_{\beta}^{\alpha}$$
라 정의한다. 즉, 선형변환의 합성의 행렬표현이다. 이 정의를 바탕으로 하면 $m \times l$ 행렬 $A$와 $l \times n$ 행렬 $B$에 대하여 행렬 $AB$는 $m \times n$ 행렬이고, $\displaystyle (AB)_{ij}= \sum_{k=1}^{l}A_{ik}B_{kj}$이다.
행렬의 곱은 선형변환의 합성의 행렬표현으로 정의하면 $\displaystyle (AB)_{ij}= \sum_{k=1}^{l}A_{ik}B_{kj}$가 되는지 살펴봅시다.
$$\begin{aligned} \displaystyle \mathsf{UT}(v_j) & = \mathsf{U}(\mathsf{T}(v_j)) = \mathsf{U}\left( \sum_{k=1}^{l}B_{kj}z_k \right) \\ & = \sum_{k=1}^{l}B_{kj} \mathsf{U}(z_k) = \sum_{k=1}^{l}B_{kj} \left( \sum_{i=1}^{m} A_{ik}w_i \right) \\ & = \displaystyle \sum_{k=1}^{l} \left( \sum_{i=1}^{m} A_{ik}B_{kj}w_i \right) = \sum_{i=1}^{m} \left( \sum_{k=1}^{l} A_{ik}B_{kj} \right) w_i \\ & = \sum_{i=1}^{m} (AB)_{ij} w_i \end{aligned}$$
행렬의 곱에는 다음과 같은 성질이 있습니다.
$m \times n$ 행렬 $A$, $B$, $n \times p$ 행렬 $C$, $D$, $p \times q$ 행렬 $E$에 대하여
- $A(C+D)=AC+AD$
- $(A+B)C=AC+BC$
- $(AC)E=A(CE)=ACE$
- $AI_n=I_mA=A$
- $a(AC)=(aA)C=A(aC)$
뭔가 구조가 익숙하지 않나요? 선형변환의 합성의 성질 다섯 가지와 비교해보세요. 위 다섯 가지 성질을 대수적으로 계산해서 증명할 수도 있겠지만, 선형변환의 행렬표현을 안다면, 그리고 선형변환의 합성과 행렬의 곱 사이의 관계를 안다면 이 성질들은 당연히 성립한다는 것이 와닿아야 합니다.
마지막으로 좌측 곱 변환을 소개하겠습니다.
$m \times n$ 행렬 $A$에 대하여 좌측 곱 변환 $\mathsf{L}_A: F^n \rightarrow F^n$은 $\mathsf{L}_A(x) = Ax$인 변환이다.
$x \in F^n$이다. $\beta$와 $\gamma$를 각각 $F^n$과 $F^m$의 기저라고 하자. 좌측 곱 변환은 다음 성질을 가지고 있다.
- 선형이다.
- $[\mathsf{L}_A]_{\beta}^{\gamma}=A$
- $\mathsf{L}_A =\mathsf{L}_B$일 필요충분조건은 $A=B$
- $\mathsf{L}_{A+B} =\mathsf{L}_{A} + \mathsf{L}_{B}$, $\mathsf{L}_{aA} =a\mathsf{L}_{A}$
- 선형변환 $\mathsf{T} : \mathbb{C}^n \rightarrow \mathbb{C}^n$에 대해서 $\mathsf{T}=\mathsf{L}_C$인 $C$가 $[\mathsf{T}]_{\beta}^{\gamma}$로 유일하게 존재한다.
- $n \times l$ 행렬 $D$에 대하여 $\mathsf{L}_{AD} = \mathsf{L}_{A}\mathsf{L}_{D}$
- $m=n$이면 $\mathsf{L}_{I_n} = \mathsf{I}_{F^n}$
이로써 행렬표현에 대한 소개를 마쳤습니다. 추상적인 벡터공간과 선형변환의 집합이 각각 구조가 명확히 보이는 열벡터의 집합과 행렬표현의 집합과 일대일대응이기 때문에 열벡터와 행렬을 이용하여 선형대수학을 기술할 수 있게 되었습니다.
'교양(학문의 기초) > 공학수학' 카테고리의 다른 글
1. 선형대수학의 기초_(8) 좌표변환 행렬 (0) | 2022.07.27 |
---|---|
1. 선형대수학의 기초_(7) 선형변환의 역변환 (0) | 2022.07.25 |
2. ODE의 기초_(0) OT(생각보다 중요) (0) | 2022.07.24 |
1. 선형대수학의 기초_(5) 선형변환의 성질 (0) | 2022.07.23 |
1. 선형대수학의 기초_(4) 기저와 차원 (0) | 2022.07.23 |