지난 시간까지 총 4시간동안 벡터공간과 그 기저를 다루었습니다. 수많은 정리가 나왔고, 증명도 길었지만 지난 4시간의 내용을 요약하자면 다음과 같습니다.
- 벡터공간의 합과 스칼라배가 정의된 집합이다.
- 벡터공간의 부분집합을 잘 잡으면 벡터공간의 모든 원소는 이 부분집합의 원소들의 일차결합으로 표현할 수 있다.
- 벡터공간이 유한집합 기저를 가진다면, 기저의 원소의 개수는 항상 일정하며, 이를 차원이라고 부른다.
- 벡터공간의 임의의 원소를 기저의 속한 벡터의 일차결합으로 나타내는 방법은 유일하다.
이번에는 선형변환에 대해서 다루겠습니다.
벡터공간은 집합이므로 정의역과 공역이 벡터공간인 함수를 생각할 수 있습니다. 벡터공간을 정의할 때 합과 스칼라곱이 중요한 요소였듯이 함수 중에서 합과 스칼라곱을 보존하는 함수가 수학적인 의미가 큽니다.
$\mathsf{V}$와 $\mathsf{W}$를 모두 벡터공간이라고 하자. 모든 $x, y \in \mathsf{V}$에 대하여 다음 조건을 만족시키는 함수 $\mathsf{T} : \mathsf{V} \rightarrow \mathsf{W}$를 $\mathsf{V}$에서 $\mathsf{W}$로 가는 선형변환이라고 한다.
- 합을 보존한다: $\mathsf{T}(x+y) = \mathsf{T}(x) + \mathsf{T}(y) $
- 스칼라곱을 보존한다: $\mathsf{T}(cx) = c\mathsf{T}(x) $
선형변환은 다음과 같은 성질들을 가지고 있는데, 증명은 쉬우므로 건너 뛰겠습니다.
- $\mathsf{T}(\mathit{0}\,) = \mathit{0} $
- $\mathsf{T}(x-y) = \mathsf{T}(x) - \mathsf{T}(y) $
- $\mathsf{T}$가 선형변환이기 위한 필요충분조건은 모든 $x, y \in \mathsf{V}$에 대하여 $\mathsf{T}(cx+y) = c\mathsf{T}(x) + \mathsf{T}(y) $인 것이다.
- $\mathsf{T}$가 선형변환이기 위한 필요충분조건은 모든 $x_i \in \mathsf{V} (i=1, 2, \cdots, n)$에 대하여 $\displaystyle \mathsf{T}\left( \sum _{i=1}^{n} a_i x_i \right) = \sum_{i=1}^{n} a_i \mathsf{T} \left(x_i \right) $인 것이다.
어떤 함수가 선형변환임을 보일 때는 주로 $\mathsf{T}(cx+y) = c\mathsf{T}(x) + \mathsf{T}(y) $를 사용합니다.
$\mathsf{T} : \mathbb{R}^2 \rightarrow \mathbb{R}^3$가 $\mathsf{T}(a, b)=(3a, 2a+b, -4b)$라 정의되어 있다면 $x=(x_1, x_2)$, $y=(y_1, y_2)$에 대하여
$\begin{aligned} \qquad \mathsf{T}(cx+y) & = (3cx_1+3y_1, 2cx_1+2y_1+cx_2+y_2, -4cx_2-4y_2) \end{aligned}$
이고
$\begin{aligned} \qquad c\mathsf{T}(x)+\mathsf{T}(y) & = c(3x_1, 2x_1+x_2, -4x_2) + (3y_1, 2y_1+y_2, -4y_2) \\ & = (3cx_1+3y_1, 2cx_1+2y_1+cx_2+y_2, -4cx_2-4y_2) \end{aligned}$
이므로 $\mathsf{T}$는 선형변환입니다.
$\mathbb{R} \rightarrow \mathbb{R}$인 무한 번 미분가능한 함수들의 집합 $\mathsf{V}$는 벡터공간입니다. $\mathsf{V}$에서 $\mathsf{V}$로의 함수 $\mathsf{T}$를 미분으로 정의하면 $\mathsf{T}$는 선형변환입니다. 이는 미분의 성질에서 쉽게 유도됩니다. (미분이 선형변환이라는 사실은 나중에 선형미분장정식을 배울 때 중요하게 사용됩니다.)
비슷하게 $\mathbb{R} \rightarrow \mathbb{R}$인 연속 함수들의 집합 $\mathsf{V}$에대하여 $\mathsf{V}$에서 $\mathbb{R}$로의 함수 $\mathsf{T}$를 구간 $[a,b]$에서의 정적분으로 정의하면 $\mathsf{T}$는 선현변환입니다. 이는 정적분의 성질에서 쉽게 유도됩니다.
선형변환에도 항등함수와 영함수가 있습니다. 항등변환 $\mathsf{I_V}$는 $\mathsf{V}$에서 $\mathsf{V}$로의 변환으로 모든 $x \in \mathsf{V}$에 대하여 $\mathsf{I_V}(x)=x$인 변환입니다. 영변환 $\mathsf{T_0}$는 $\mathsf{V}$에서 $\mathsf{W}$로의 변환으로 모든 $x \in \mathsf{V}$에 대하여 $\mathsf{T_0}(x)=\mathit{0\,}$인 변환입니다.
기하학적인 의미를 갖는 선형변환에는 회전변환, 대칭변환, 사영변환이 있습니다. 이들이 왜 선형변환인지는 스스로 증명해보기 바랍니다.
선형변환과 관련해서 영공간과 상공간이라는 중요한 개념이 있습니다.
$\mathsf{T} : \mathsf{V} \rightarrow \mathsf{W}$에 대하여
- 영공간(null space, kernel, 핵): $\mathsf{N(T)} = \left\{ x \, | \, x \in \mathsf{V}, \mathsf{T}(x) = \mathit{0\,} \right\}$
- 상공간(range, image): $\mathsf{R(T)} = \left\{ \mathsf{T}(x) \, | \, x \in \mathsf{V}\right\}$
영공간과 상공간과 관련하여 중요한 성질을 몇 개 살펴보갰습니다.
- $\mathsf{N(T)}$는 $\mathsf{V}$의 부분공간이다.
- $\mathsf{R(T)}$는 $\mathsf{W}$의 부분공간이다.
- $\mathsf{V}$의 기저 $\beta = \left\{ v_1, v_2, \cdots, v_n \right\}$에 대하여 $\mathsf{R(T)} = \mathrm{span}(\mathsf{T} (\beta)) = \mathrm{span}( \left\{ \mathsf{T} (v_1), \mathsf{T} (v_2), \cdots, \mathsf{T} (v_n) \right\})$
- 부분공간의 요건에는 합에 대해 닫혀있는지, 스칼라배에 닫혀있는지, 영벡터가 원소인지의 3개가 있습니다. $\mathsf{T}(\mathit{0}_\mathsf{\,V}) = \mathit{0}_\mathsf{\,W}$이므로 영벡터는 영공간의 원소입니다. $x, y \in \mathsf{N(T)}$에 대하여 $\mathsf{T}(x+y)=\mathsf{T}(x)+\mathsf{T}(y)= \mathit{0}_\mathsf{\,W} + \mathit{0}_\mathsf{\,W} = \mathit{0}_\mathsf{\,W}$이므로 합에 대해 닫혀있습니다. 그리고 $\mathsf{T}(cx)=c \mathsf{T}(x)= c \mathit{0}_\mathsf{\,W} = \mathit{0}_\mathsf{\,W}$이므로 스칼라배에 대해 닫혀있습니다. 따라서 $\mathsf{N(T)}$는 $\mathsf{V}$의 부분공간입니다.
- $\mathsf{T}(\mathit{0}_\mathsf{\,V}) = \mathit{0}_\mathsf{\,W}$이므로 영벡터는 영공간의 원소입니다. $x, y \in \mathsf{R(T)}$에 대하여 $\mathsf{T}(v)=x$, $\mathsf{T}(w)=y$인 $v, w \in \mathsf{V}$가 존재합니다. $x+y=\mathsf{T}(v)+\mathsf{T}(w)=\mathsf{T}(v+w) $이므로 합에 대해 닫혀있습니다. 그리고 $cx=\mathsf{T}(cv) $이므로 곱에 대해 닫혀있습니다. 따라서 $\mathsf{R(T)}$는 $\mathsf{W}$의 부분공간입니다.
- 임의의 $w \in \mathsf{R(T)}$에 대하여 $\mathsf{T}(v)=w$인 $v \in \mathsf{V}$가 존재합니다. $ \beta$가 $\mathsf{V}$의 기저이므로 $\displaystyle v=\sum_{i=1}^{n}a_i v_i$로 나타낼 수 있고, $w=\mathsf{T}(v)=\displaystyle \sum_{i=1}^{n}a_i \mathsf{T}(v_i) \in \mathrm{span}(\mathsf{T} (\beta))$입니다. 따라서 $\mathsf{R(T)} \subset \mathrm{span}(\mathsf{T} (\beta))$입니다. 한편 $\mathsf{T}(v_i) \in \mathsf{R(T)}$이므로 (1-5)에 의해 $\mathrm{span}(\mathsf{T} (\beta)) \subset \mathsf{R(T)}$입니다. 따라서 $\mathsf{R(T)} = \mathrm{span}(\mathsf{T} (\beta))$입니다.
영공간과 상공간은 벡터공간이므로 차원을 갖습니다. $\mathsf{N(T)}$의 차원은 nullity라 부르고 $\mathrm{dim}(\mathsf{N(T)}) = \mathrm{nullity}(\mathsf{T})$와 같이 표기합니다. $\mathsf{R(T)}$의 차원은 rank라 부르고 $\mathrm{dim}(\mathsf{R(T)}) = \mathrm{rank}(\mathsf{T})$와 같이 표기합니다. nullity와 rank에는 매우 중요한 '차원정리'라는 성질이 있습니다.
선형변환 $\mathsf{T} : \mathsf{V} \rightarrow \mathsf{W}$에 대하여 $\mathsf{V}$가 유한차원이면 $\mathrm{nullity}(\mathsf{T}) + \mathrm{rank}(\mathsf{T}) = \mathrm{dim}(\mathsf{V})$이다.
$\mathrm{dim}(\mathsf{V}) = n$, $\mathrm{nullity}=k$라 합시다. $\mathsf{N(T)}$의 기저를 $T=\left\{ v_1, v_2, \cdots, v_k \right\}$라 하고, $\mathsf{V}$의 기저를 $\beta$라 하면 (1-8)에 의해 $|H|=n-k$이고 $\mathrm{span}(T \cup H)=\mathsf{V}$, $H \subset S$인 집합 $H$가 존재합니다. $H=\left\{ v_{k+1}, v_{k+2}, \cdots, v_n \right\}$라 합시다.
이제 $\mathsf{T}(H) = \left\{ \mathsf{T}(v_{k+1}), \mathsf{T}(v_{k+2}),\cdots, \mathsf{T}(v_{n}) \right\}$가 $\mathsf{R(T)}$의 기저임을 보입시다.
먼저 $\mathsf{T}(H)$가 $\mathsf{R(T)}$를 생성함을 보입시다. (1-10)에 의해 $\mathrm{span}(T \cup H) = \mathsf{R(T)}$이고, $\mathsf{T}(T)=\left\{ \mathit{0\,} \right\}$이므로 $\mathrm{span}(H) = \mathsf{R(T)}$입니다.
이제 $\mathsf{T}(H)$가 일차독립임을, 즉 $\displaystyle \sum_{i=k+1}^{n}a_i \mathsf{T}(v_i)=\mathit{0\,}$이면 $b_i=0$임을 보입시다. 선형변환의 성질에 의해 $\displaystyle \sum_{i=k+1}^{n}a_i \mathsf{T}(v_i)=\mathsf{T} \left( \sum_{i=k+1}^{n}a_i v_i \right)=\mathit{0\,}$이므로 $\displaystyle \sum_{i=k+1}^{n}a_i v_i \in \mathsf{N(T)}$입니다. 그런데 $\mathsf{N(T)}$의 기저가 $T=\left\{ v_1, \cdots, v_k \right\}$이므로 $\displaystyle \sum_{i=k+1}^{n}a_i v_i = \sum_{i=1}^{k}(-a_i) v_i $를 만족시키는 $a_i(1 \le i \le k)$가 존재합니다. $\displaystyle \sum_{i=1}^{n}a_i v_i = \mathit{0\,} $이고, $T \cup H = \left\{ v_{1}, \cdots, v_n \right\}$가 $\mathsf{V}$의 기저이므로 $a_i=0$일 수밖에 없습니다. 따라서 $\mathsf{T}(H)$가 일차독립입니다.
따라서 $\mathsf{R(T)}$의 기저의 원소의 개수가 $n-k$이므로 $\mathrm{rank}(\mathsf{T}) = n-k$입니다.
함수에는 전사함수*, 단사함수**가 있었지요? 선형변환에도 마찬가지입니다. 지금부터는 선형변환의 전사와 단사에 대해서 살펴보겠습니다.
*전사함수: 공역의 임의의 원소 $y$에 대하여 $y=f(x)$인 $x$가 정의역에 존재하면 $f$는 전사함수입니다.
**단사함수: $f(x_1)=f(x_2)$이면 $x_1=x_2$일 때 $f$는 단사함수입니다.
선형변환 $\mathsf{T} : \mathsf{V} \rightarrow \mathsf{W}$에 대하여 $\mathsf{T}$가 단사함수일 필요충분조건은 $\mathsf{N(T)}=\left\{ \mathit{0\,} \right\}$인 것이다.
(→) $\mathsf{V}$의 영벡터가 아닌 벡터를 임의의 벡터 $x$를 생각합시다. $\mathsf{T}(\mathit{0\,})=\mathit{0\,}$이고, $\mathsf{T}$가 단사이므로 $\mathsf{T}(x) \neq \mathit{0\,}$입니다. 따라서 영벡터가 아닌 벡터는 영공간의 원소가 될 수 없습니다. 즉, $\mathsf{N(T)}=\left\{ \mathit{0\,} \right\}$입니다.
(←) $\mathsf{N(T)}=\left\{ \mathit{0\,} \right\}$, $\mathsf{T}(x)=\mathsf{T}(y)$라 가정합시다. $\mathsf{T}(x)=\mathsf{T}(y)$이므로 $\mathsf{T}(x-y)=\mathit{0\,}$입니다. $\mathsf{N(T)}=\left\{ \mathit{0\,} \right\}$이므로 $x-y=\mathit{0\,}$, $x=y$입니다. 따라서 $\mathsf{T}$가 단사함수입니다.
이 성질로부터 선형변환 $\mathsf{T}$가 단사함수일 필요충분일 조건이 $\mathsf{T}(x)=\mathit{0\,}$이면 $x=\mathit{0\,}$임을 알 수 있습니다.
선형변환 $\mathsf{T} : \mathsf{V} \rightarrow \mathsf{W}$에서 $\mathsf{V}$와 $\mathsf{W}$의 차원이 같으면 몇 가지 성질이 더 추가됩니다.
$\mathsf{T} : \mathsf{V} \rightarrow \mathsf{W}$에서 $\mathsf{V}$와 $\mathsf{W}$의 차원이 같으면 다음 명제는 동치이다.
- $\mathsf{T}$가 단사함수이다.
- $\mathsf{T}$가 전사함수이다.
- $\mathrm{rank}(\mathsf{T})=\mathrm{dim}(\mathsf{V})$
$\mathsf{T}$가 단사함수이므로 $\mathsf{N(T)}=\left\{ \mathit{0\,} \right\}$입니다.
$\mathsf{N(T)}=\left\{ \mathit{0\,} \right\}$이므로 $\mathrm{nullity}(\mathsf{T})=0$입니다.
$\mathrm{nullity}(\mathsf{T})=0$이므로 차원정리 (1-11)에 의해 $\mathrm{rank}(\mathsf{T}) = \mathrm{dim}(\mathsf{V})$입니다. 그리고 가정에 의해 $\mathrm{rank}(\mathsf{T}) = \mathrm{dim}(\mathsf{W})$입니다.
$\mathrm{rank}(\mathsf{T}) = \mathrm{dim}(\mathsf{R(T)})$이므로 $\mathsf{R(T)}$와 $\mathsf{W}$의 차원이 같은데, $\mathsf{R(T)}$은 $\mathsf{W}$의 부분공간이므로 $\mathsf{R(T)}=\mathsf{W}$입니다. 이는 전사함수의 정의와 같으므로 $\mathsf{T}$가 전사함수입니다.
일반적으로 어떤 함수 $f$에 대해서 $f$의 함숫값을 몇 개 알고 있다고 해서 $f$가 결정되지는 않습니다. 하지만 정의역이 유한차원인 선형변환에서는 적당한 함숫값(?) 몇 개를 알면 선형변환이 유일하게 결정된다는 좋은 특징을 가지고 있습니다.
벡터공간 $\mathsf{V}$의 기저 $\left\{v_1, \cdots, v_n \right\}$를 생각하자. 벡터공간 $\mathsf{W}$의 원소 $w_1$, $\cdots$, $w_n$에 대하여 $\mathsf{T}(v_j)=w_j(j=1, 2, \cdots, n)$를 만족시키는 선형변환 $\mathsf{T} : \mathsf{V} \rightarrow \mathsf{W}$은 유일하게 존재한다.
$x \in \mathsf{V}$에 대하여 $x=\displaystyle \sum_{j=1}^{n}a_j(x)v_j$에서 $a_j(x)$는 유일하게 결정됩니다. $a_j(x)$라 쓴 것은 선형결합 표현은 $x$에 띠라 달라지기 때문입니다. $a_j(x)$는 $a_j(cx+y)=ca_j(x)+a_j(y)$를 만족시키는데, $x, y \in \mathsf{V}$에 대하여
$$\begin{aligned} \displaystyle \sum_{j=1}^{n}a_j(cx+y)v_j & =cx+y=c\sum_{j=1}^{n}a_j(x)v_j+\sum_{j=1}^{n}a_j(y)v_j \\ & =\sum_{j=1}^{n}(ca_j(x)+a_j(y))v_j \end{aligned}$$
이기 때문입니다.
이제 $\mathsf{T}$를 $\mathsf{T}(x)=\displaystyle \sum_{j=1}^{n}a_j(x)w_j$라 정의합시다. 먼저, $\mathsf{T}$는 선형입니다. 왜냐하면
$$\begin{aligned} \mathsf{T}(cx+y) &= \displaystyle \sum_{j=1}^{n}a_j(cx+y)w_j = \sum_{j=1}^{n}(ca_j(x)+a_j(y))w_j \\ & = c\mathsf{T}(x)+\mathsf{T}(y) \end{aligned}$$
이기 때문입니다.
두 번재로, $\mathsf{T}(v_j)=w_j$입니다. 왜냐하면 $a_j(v_j) = 1$, $a_j(v_i) = 1 (i \neq j)$이기 때문입니다.
마지막으로 $\mathsf{T}$는 유일합니다. $\mathsf{U}(v_j)=w_i(j=1, 2, \cdots, n)$를 만족시키는 선형변환 $\mathsf{U}$가 존재한다면 $\mathsf{U}(x) = \displaystyle \sum_{j=1}^{n}a_j(x)\mathsf{U}(v_j) = \sum_{j=1}^{n}a_j(x)w_j = \mathsf{T}(x)$이기 때문입니다.
지금까지 선형변환의 여러가지 성질을 살펴봤습니다. 선형변환의 성질이 많아서 힘들 수도 있지만, 다시 한 번 더 찬찬히 읽어보면 꽤 직관적인 성질들이 많습니다. 이 성질들은 정말 중요하므로 적어도 결과만큼은 꼭 숙지했으면 좋겠습니다.
'교양(학문의 기초) > 공학수학' 카테고리의 다른 글
1. 선형대수학의 기초_(6) 행렬표현 (0) | 2022.07.24 |
---|---|
2. ODE의 기초_(0) OT(생각보다 중요) (0) | 2022.07.24 |
1. 선형대수학의 기초_(4) 기저와 차원 (0) | 2022.07.23 |
1. 선형대수학의 기초_(3) 일차결합 (0) | 2022.07.22 |
1. 선형대수학의 기초_(2) 부분공간 (0) | 2022.07.21 |