이 코스의 목적은 AI와 LLM을 만들고 이해하기 위한 수학이다. 3장에서 "행렬 하나 = 변환 하나"를 배웠다. 4장의 질문은 이것 — 변환을 연달아 하면 어떻게 될까? 그리고 그 두 변환을 미리 하나로 합쳐둘 수 있을까? 이 합치기가 바로 신경망이 층층이 쌓이는 원리다.
$$C = S R = \begin{bmatrix} 0 & -2 \\ 2 & 0 \end{bmatrix}$$
이제 화살표가 1만 개여도 \(C\) 하나만 곱하면 회전+확대가 한 번에 끝난다.
오늘의 핵심
"90도 돌리는 변환"과 "2배 하는 변환"을 따로 두 번 할 필요 없이, 두 행렬을 미리 곱해 하나로 합쳐두면 그 하나로 한 번에 끝낼 수 있다. 이것이 행렬 곱셈이고, 신경망이 여러 층을 쌓는 원리의 바닥이다.
3 계산 규칙 — 행 × 열
매번 축을 넣어 구하는 대신, 곧장 계산하는 규칙이 있다. 결과 행렬의 각 칸 = (왼쪽 행렬의 한 행) 과 (오른쪽 행렬의 한 열) 의 내적. 2장에서 배운 그 내적(자리끼리 곱해 더하기)이 그대로 재활용된다.
$$\begin{bmatrix} a & b \\ c & d \end{bmatrix}\begin{bmatrix} e & f \\ g & h \end{bmatrix} = \begin{bmatrix} ae+bg & af+bh \\ ce+dg & cf+dh \end{bmatrix}$$
왼쪽 위 칸 = 첫째 행 \((a,b)\) · 첫째 열 \((e,g)\) 의 내적 = \(ae+bg\). 위치 "몇째 행 × 몇째 열"이 어느 행·열을 내적할지 정한다.
축을 일일이 넣어 구한 결과와 똑같다. 직관("축이 어디로 가나")과 기계적 규칙("행×열")이 같은 곳에서 만난다.
자리 헷갈림 주의
행렬을 읽을 때 윗줄 = 새 x를 만드는 법, 아랫줄 = 새 y를 만드는 법. 회전행렬 윗줄 \((0,-1)\)은 "새 \(x = 0\cdot x + (-1)\cdot y\)"라는 뜻 — 원래 \(y\)에 붙은 \(-1\)이 새 \(x\)로 간다(새 \(y\)가 아니라!). 그래서 \((0,1)\)을 회전하면 \((-1, 0)\)이다.
4 순서가 결과를 바꾼다 — 비교환성
정수 곱셈은 \(3\times5 = 5\times3\), 순서를 바꿔도 같다(교환법칙). 하지만 행렬 곱셈은 다르다.
$$AB \neq BA \quad(\text{일반적으로})$$
왜? "x만 3배" 같은 비균일 변환 \(S' = \begin{bmatrix}3&0\\0&1\end{bmatrix}\) 과 회전 \(R\) 로 \((1,1)\)을 보내 보면 갈린다.