이번 시간에는 선형변환의 역변환에 대해서 다루겠습니다.
벡터공간 $\mathsf{V}$와 $\mathsf{W}$에 대하여 선형변환 $\mathsf{T}: \mathsf{V} \rightarrow \mathsf{W}$를 생각하자. $\mathsf{TU} = \mathsf{I_W}$이고, $\mathsf{UT} = \mathsf{I_V}$인 함수 $\mathsf{U}$가 존재하면 선형변환 $\mathsf{T}$는 가역이고, $\mathsf{U}$를 $\mathsf{T}$의 역함수라고 한다. $\mathsf{T}^{-1}$이라고 표기한다.
선형변환의 역함수에는 다음과 같은 성질이 있습니다.
가역인 선형변환 $\mathsf{T}$, $\mathsf{U}$에 대하여 ($\mathsf{T}$는 $\mathsf{V}$에서 $\mathsf{W}$로의 함수)
- $\mathsf{TT}^{-1}=\mathsf{I}$를 만족시키는 $\mathsf{T}^{-1}$은 유일하다.
- $\mathsf{T}^{-1}$은 선형변환이다.
- $(\mathsf{TU})^{-1}=\mathsf{U}^{-1}\mathsf{T}^{-1}$
- $(\mathsf{T}^{-1})^{-1}=\mathsf{T}$
- $\mathrm{dim}(\mathsf{V})=\mathrm{dim}(\mathsf{W})$이다. (단, $\mathsf{V}$와 $\mathsf{W}$는 유한차원)
- $\mathsf{T}$가 가역이기 위한 필요충분조건은 $\mathrm{rank}(\mathsf{T})=\mathrm{dim}(\mathsf{V})$이다. (단, $\mathsf{V}$와 $\mathsf{W}$는 유한차원)
- $\mathsf{TT}^{-1}=\mathsf{I_W}$인 $\mathsf{T}^{-1}$이 두 개 존재하여 $\mathsf{U}_1$, $\mathsf{U}_2$라 합시다. 그러면 $$\mathsf{U}_2 = \mathsf{U}_2\mathsf{I_W} = \mathsf{U}_2(\mathsf{TU}_1) = (\mathsf{U}_2\mathsf{T}) \mathsf{U}_1 = \mathsf{I_V}\mathsf{U}_1 = \mathsf{U}_1$$이므로 $\mathsf{T}^{-1}$는 유일합니다.
- $\mathsf{T}(x_1)=y_1$, $\mathsf{T}(x_2)=y_2$라 합시다. $\mathsf{T}^{-1}(y_1+cy_2)=\mathsf{T}^{-1}(\mathsf{T}(x_1)+c\mathsf{T}(x_2))$$=\mathsf{T}^{-1}(\mathsf{T}(x_1+cx_2))$$=x_1+cx_2$$=\mathsf{T}^{-1}(y_1)+c\mathsf{T}^{-1}(y_2)$이므로 $\mathsf{T}^{-1}$은 선형변환입니다.
- $(\mathsf{TU}^{-1})\mathsf{TU}=\mathsf{I_W}$이고, $\mathsf{U}^{-1}(\mathsf{T}^{-1}\mathsf{T})\mathsf{U}=\mathsf{U}^{-1}\mathsf{I_V}\mathsf{U}=\mathsf{U}^{-1}\mathsf{U}=\mathsf{I_W}$이므로 $\mathsf{U}^{-1}\mathsf{T}^{-1}$는 $\mathsf{TU}$의 역변환입니다. $\mathsf{U}^{-1}\mathsf{T}^{-1}$가 유일한 역변환임은 1에서 확인할 수 있습니다.
- 역함수의 정의에 의해 $\mathsf{T}^{-1}(\mathsf{T}^{-1})^{-1}=\mathsf{I_V}$이고, $\mathsf{T}^{-1}\mathsf{T}=\mathsf{I_V}$이므로 $(\mathsf{T}^{-1})^{-1}=\mathsf{T}$입니다.
- $\mathrm{dim}(\mathsf{V})=n$, $\mathrm{dim}(\mathsf{W})=m$이라 합시다. 그리고 $\mathsf{V}$의 기저를 $\beta$, $\mathsf{W}$의 기저를 $\gamma$라 합시다. $\mathsf{T}$가 일대일대응인 선형변환이고 $\beta$가 일차독립이므로 $\mathsf{T}(\beta)$도 일차독립이고, $\mathsf{W}$의 부분공간을 생성합니다. 따라서 (1-10)에 의해 $n \leq m$입니다. 반대로 $\mathsf{T}^{-1}$이 일대일대응인 선형변환이고 $\gamma$가 일차독립이므로 $\mathsf{T}^{-1}(\gamma)$도 일차독립이고, $\mathsf{V}$의 부분공간을 생성합니다. 따라서 $m \leq n$입니다. 따라서 $n=m$입니다.
- 5에서 $\mathrm{dim}(\mathsf{V})=\mathrm{dim}(\mathsf{W})$임을 밝혔고, $\mathsf{T}$가 전단사이므로 (1-17)에 의해 $\mathrm{rank}(\mathsf{T})=\mathrm{dim}(\mathsf{V})$입니다.
선형변환의 가역성을 생각했으니 행렬의 가역성을 생각하는 것은 자연스러운 일입니다. $\mathrm{dim}(\mathsf{V})=\mathrm{dim}(\mathsf{W})$이므로 정사각행렬만이 역행렬을 가질 수 있습니다. (정사각행렬이라고 해서 무조건 역행렬을 가지는 것은 당연히 아닙니다.) 행렬의 가역과 역행렬의 정의는 선형변환의 가역과 역함수의 정의와 매우 유사합니다.
$n \times b$ 행렬 $A$에 대하여 $AB=BA=I$인 $n \times b$ 행렬 $B$가 존재할 때 $A$가 가역이고 $B$가 역행렬이다.
역행렬은 유일하게 존재합니다. 만약 $B$가 아닌 또 다른 역행렬 $C$가 존재한다면 $$C=CI=C(AB)=(CA)B=IB=B$$이기 때문입니다.
선형변환의 역함수와 행렬의 역행렬 사이에는 다음과 같은 관계가 있습니다.
- 유한차원 벡터공간에 대하여 $\mathsf{V}$의 기저를 $\beta = \left\{ v_1, v_2, \cdots, v_n \right\}$, $\mathsf{W}$의 기저를 $\gamma = \left\{ w_1, w_2, \cdots, w_n \right\}$라 하자. 선형변환 $\mathsf{T}:\mathsf{V} \rightarrow \mathsf{W}$에 대하여 $\mathsf{T}$가 가역이기 위한 필요충분조건은 $[\mathsf{T}]_{\beta}^{\gamma}$가 가역인 것이다.
- $[\mathsf{T}^{-1}]_{\gamma}^{\beta}=\left([\mathsf{T}]_{\beta}^{\gamma}\right)^{-1}$
- $n \times n$ 행렬 $A$가 가역일 필요충분조건은 $\mathsf{L}_A$가 가역인 것이다.
- $(\mathsf{L}_{A})^{-1}= \mathsf{L}_{A^{-1}}$
- $A$, $B$가 $n \times n$ 가역행렬이면 $AB$도 가역행렬이다.
- $A$가 $n \times n$ 가역행렬이면 $A^{t}$도 가역행렬이다.
1, 2번이 증명된다면 $\mathsf{V} = \mathbb{C}^{n}$, $\mathsf{F} = \mathbb{C}^{n}$라 놓으면 3, 4번도 자동으로 증명됩니다. 이제 1, 2번을 증명하겠습니다.
- $\mathsf{T}$가 가역이라 합시다. 그러면 $\mathrm{dim}(\mathsf{V})=\mathrm{dim}(\mathsf{W})=n$이므로 $[\mathsf{T}]_{\beta}^{\gamma}$는 $n \times n$ 행렬입니다. 역함수 $\mathsf{T}^{-1}:\mathsf{W} \rightarrow \mathsf{V}$에 대해서 $\mathsf{I_W}=\mathsf{TT}^{-1}$이므로 이를 행렬표현으로 나타내면 $\left[\mathsf{I_W}\right]_{\gamma}=I_n=[\mathsf{TT}^{-1}]_{\gamma}=[\mathsf{T}]_{\beta}^{\gamma}[\mathsf{T}^{-1}]_{\gamma}^{\beta}$이고, 비슷하게 $I_n=[\mathsf{T}^{-1}]_{\gamma}^{\beta}[\mathsf{T}]_{\beta}^{\gamma}$이므로 $\mathsf{T}$는 가역이고, $[\mathsf{T}^{-1}]_{\gamma}^{\beta}=\left([\mathsf{T}]_{\beta}^{\gamma}\right)^{-1}$입니다.
- 이제 $A=[\mathsf{T}]_{\beta}^{\gamma}$가 가역이라고 합시다. 그러므로 $AB=BA=I_n$인 행렬 $B$가 존재합니다. 이때 (1-14)에 의해 선형변환 $\mathsf{U}: \mathsf{W} \rightarrow \mathsf{V}$가 $\mathsf{U}(v_j) = \displaystyle \sum_{i=1}^{n}B_{ij}v_i$를 만족하도록 유일하게 정할 수 있고, $\mathsf{U}$의 $\gamma$와 $\beta$에 대한 행렬표현이 $B$입니다. 그리고 $[\mathsf{I_V}]_{\beta}=I_n=BA=[\mathsf{U}]_{\gamma}^{\beta}[\mathsf{T}]_{\beta}^{\gamma}$이므로 $\mathsf{I_V}=\mathsf{U}\mathsf{T}$에서 $\mathsf{T}$가 가역임을 알 수 있습니다.
5번은 다음과 같이 증명합니다.
- $AB$가 가역행렬이라는 것은 $\mathsf{L}_A \mathsf{L}_B$가 가역변환이라는 것과 동치입니다. (1-20)에 의해 $\mathsf{L}_A \mathsf{L}_B$의 역변환은 $\mathsf{L}_{B^{-1}} \mathsf{L}_{A^{-1}}$로 존재하므로 $AB$는 가역행렬입니다. 덤으로, $AB$의 역행렬은 $B^{-1}A^{-1}$임을 알 수 있습니다.
6번은 다음과 같이 증명합니다.
- $A^{t}(A^{-1})^t = (AA^{-1})^t = (I_n)^t = I_n$이고, 마찬가지로 $(A^{-1})^tA^{t} = (A^{-1}A)^t = (I_n)^t = I_n$이므로 $A^{t}$의 역행렬은 $(A^{-1})^t$로 존재합니다.
지금부터는 동형사상에 대해 다루겠습니다.
동형, 구조가 같다는 뜻입니다. 두 벡터가 생긴 건 다르더라도 구조가 같으면 동형이라 부르는데, 무슨 말일까요? 예를 들어서 세 가지 벡터 $$ax^3+bx^2+cx+d, (a, b, c, d), \begin{pmatrix} a & b \\ c & d \end{pmatrix}$$를 살펴봅시다. $k$만큼 상수배를 해볼까요? $$(ka)x^3+(kb)x^2+(kc)x+(kd), (ka, kb, kc, kd), \begin{pmatrix} ka & kb \\ kc & kd \end{pmatrix}$$ 두 벡터를 더해볼까요? $$(a_1+a_2)x^3+(b_1+b_2)x^2+(c_1+c_2)x+(d_1+d_2),$$$$(a_1+a_2, b_1+b_2, c_1+c_2, d_1+d_2), \begin{pmatrix} a_1+a_2 & b_1+b_2 \\ c_1+c_2 & d_1+d_2 \end{pmatrix}$$벡터의 합과 스칼라 곱이 똑같이 작용하는 것을 확인할 수 있습니다. 이런 관계를 동형이라고 부릅니다.
두 벡터공간 $\mathsf{V}$와 $\mathsf{W}$ 사이에 가역인 선형변환 $\mathsf{T}: \mathsf{V} \rightarrow \mathsf{W}$가 존재하면 $\mathsf{V}$와 $\mathsf{W}$는 동형이고, $\mathsf{T}$는 동형사상이다.
세 가지 벡터 $$ax^3+bx^2+cx+d, (a, b, c, d), \begin{pmatrix} a & b \\ c & d \end{pmatrix}$$가 동형이었던 이유는 3차 이하의 다항식의 집합 $\mathsf{P}_3$, 순서쌍 집합 $\mathbb{C}^4$, $2 \times 2$ 행렬들의 집합 $\mathsf{M}_{2 \times 2}$ 사이에는 가역인 선형변환이 정의될 수 있기 때문입니다. 그리고 $\mathsf{T}$가 가역이므로 두 벡터공간 $\mathsf{V}$와 $\mathsf{W}$이 동형일 필요충분조건은 두 벡터공간의 차원이 같은 것임을 알 수 있습니다.
이제 두 가지 함수를 소개할 것입니다.
차원이 $n$, $m$인 두 벡터공간 $\mathsf{V}$, $\mathsf{W}$에 대하여 $\mathsf{V}$, $\mathsf{W}$의 순서 기저를 $\beta = \left\{ v_1, v_2, \cdots, v_n \right\}$, $\gamma = \left\{ w_1, w_2, \cdots, w_m\right\}$라 하자.
- $L(\mathsf{V}, \mathsf{W})$를 $\mathsf{V}$에서 $\mathsf{W}$로 가는 모든 선형변환의 집합이라고 하면, 함수 $\Phi_{\beta}^{\gamma}: L(\mathsf{V}, \mathsf{W}) \rightarrow \mathsf{M}_{m \times n}$은 $\mathsf{T} \in L(\mathsf{V}, \mathsf{W})$에 대하여 $\Phi_{\beta}^{\gamma}(\mathsf{T})=[\mathsf{T}]_{\beta}^{\gamma}$이다.
- 함수 $\phi_{\beta}: \mathsf{V} \rightarrow \mathbb{C}^{n}$은 $x \in \mathsf{V}$에 대하여 $\phi_{\beta}(x)=[x]_{\beta}$이다. 이 함수를 특별히 $\beta$에 대한 $\mathsf{V}$의 표준표현이라고 한다.
두 함수 $\Phi_{\beta}^{\gamma}$와 $\phi_{\beta}$에는 매우 중요한 성질이 있습니다.
두 벡터공간 $\mathsf{V}$, $\mathsf{W}$의 순서 기저를 $\beta = \left\{ v_1, v_2, \cdots, v_n \right\}$, $\gamma = \left\{ w_1, w_2, \cdots, w_m\right\}$라 할 때, $\Phi_{\beta}^{\gamma}$와 $\phi_{\beta}$는 동형사상, 즉 일대일대응이다.
$\Phi_{\beta}^{\gamma}$부터 살펴보겠습니다. $[a\mathsf{T}+\mathsf{U}]_{\beta}^{\gamma} = a[\mathsf{T}]_{\beta}^{\gamma}+[\mathsf{U}]_{\beta}^{\gamma}$이므로 $\Phi_{\beta}^{\gamma}$는 선형사상입니다. 이제 $\Phi_{\beta}^{\gamma}$가 전사임을 보입시다. (1-14)에 의해 $\mathsf{M}_{m \times n}$의 원소 $A$에 대하여 다음을 만족하는 선형변환 $\mathsf{T}: \mathsf{V} \rightarrow \mathsf{W}$은 유일합니다. 따라서 $\Phi_{\beta}^{\gamma}$는 전사입니다.$$\mathsf{T}(v_j) = \displaystyle \sum_{i=1}^{m}A_{ij}w_i$$
이제 $\Phi_{\beta}^{\gamma}$가 단사임을 보입시다. $\Phi_{\beta}^{\gamma}$가 선형변환이므로 영공간이 $\left\{ \mathit{0 \,} \right\}$임을 보여야 합니다. 즉, $[\mathsf{T}]_{\beta}^{\gamma}$가 영행렬이면 $\mathsf{T}$가 영변환임을 보여야 하는데, $\mathsf{T}(v_j)=\displaystyle \sum_{i=1}^{m}\left([\mathsf{T}]_{\beta}^{\gamma}\right)_{ij}w_i = \sum_{i=1}^{m}0w_i$이므로 참입니다.
$\phi_{\beta}$가 동형사상인 것도 $\phi_{\beta}$가 선형사상인지, 전사인지, 단사인지 이 세 가지를 확인하여 확인할 수 있습니다. 이 증명은 독자 여러분이 직접 해 보시기 바랍니다.
'교양(학문의 기초) > 공학수학' 카테고리의 다른 글
1. 선형대수학의 기초_(9) 행렬의 랭크 (0) | 2022.07.29 |
---|---|
1. 선형대수학의 기초_(8) 좌표변환 행렬 (0) | 2022.07.27 |
1. 선형대수학의 기초_(6) 행렬표현 (0) | 2022.07.24 |
2. ODE의 기초_(0) OT(생각보다 중요) (0) | 2022.07.24 |
1. 선형대수학의 기초_(5) 선형변환의 성질 (0) | 2022.07.23 |