Ustage Day 5

특이값 분해에 대한 내용을 설명하도록 한다.

부스트 캠프 5일차 학습 요약

행사 : 오피스 아워
학습 : 강의 정리 및 선택과제 진행, 개인학습 - 특이값분해(피어세션)
피어 세션

1. 특이값 분해 (Singular Value Decomposition)

1-1. 용어 및 기본 내용

특이값 분해는 행렬을 대각화하는 한 방법을 의미한다.
행렬이 정방행렬이든 아니든 적용 가능하기 때문에 유용하다.(고유값 분해(Eigen Decomposition의 경우 정방행렬일 경우에만 적용 가능하다.)

NOTE : 고유값 분해에 대한 내용은 여기에서 확인하도록 하자.(Eigen Decomposition)

우리는 A를 U $\sum$ $V^T$로 나타낼 수 있고 이렇게 쪼개는 것을 특이값 분해(Signular Value Decomposition)이라고 한다.

U는 $A$$A^T$를 고유값 분해(Eigen Decomposition)을 통해 얻은 직교행렬이며, left singular vector라고 한다.
V는 $A^T$$A$를 고유값 분해(Eigen Decomposition)을 통해 얻은 직교행렬이며, right signular vector라고 한다.
$\sum$은 U와 V에서 각각 얻은 Eigen Value의 제곱근을 원소로 가지는 직사각 대각행렬이며, 이 때 대각에 존재하는 원소를 singular value이라고 한다. Singular Value 값들은 전부 0 또는 양수의 값만을 가진다.
- 직사각 대각행렬은 다음 그림과 같은 행렬을 의미한다.
직교행렬의 특징으로는 $U$$U^T$ = $V$$V^T$ = I, $U^T$ = $U^{-1}$, $V^T$ = $V^{-1}$ 이다.

1-2. SVD의 기하학적 의미

x' = Ax라는 식이 있을 때, 행렬 A는 좌표공간에서 선형변환으로 이해할 수 있다. (행렬을 이해하는 방법 중 하나)

이 때, 선형변환에 있어 각 행렬은 다음과 같은 의미를 지닌다.

직교행렬의 기하학적 의미는 회전변환 혹은 반전된 회전변환을 의미한다.
대각행렬의 기하학적 의미는 각 좌표 성분으로의 스케일 변환을 의미한다.
더불어, 직교행렬의 행렬식은 항상 1 or -1을 가지게 되는데, 1일 경우에는 일반적인 회전변환을, -1일 경우에는 반전된 회전변환을 의미한다.

NOTE : 행렬식에 대한 내용은 여기에서 확인하도록 하자. (Determinant)

따라서, A = $U$$\sum$$V^T$로 나타냈을 때, U, V는 직교행렬, $\sum$은 직사각 대각행렬이므로 Ax는 $U$$\sum$$V^T$x로 나타낼 수 있고 순서와 그림은 다음과 같다.

$V^T$x : x의 회전변환
$\sum$ x’ : x’의 스케일변환
Ux’’ : x’‘의 회전변환
더불어, Singular Vector(U, V)는 회전변환을 시키고, Singular Value($\sum$)은 스케일 변환을 시킨다는 것을 알 수 있다. 즉, 도형의 형태적 변화는 오직 A의 Singular Value에 의해서만 결정됨을 알 수 있다.

1-3. Reduced SVD와 행렬 근사를 통한 데이터 압축

A가 $m$ x $n$ 행렬일 떄, SVD를 활용하는 분해 그림은 다음과 같다.

위는 Full SVD를 의미하는데, 보통 FUll을 사용하는 경우는 드물고 보통 Reduced SVD를 사용한다. 왜 Reduced를 사용하는지 다음으로부터 알아보자.

thin SVD : U를 s만큼만 활용하는 것을 볼 수 있는데, $\sum$에서 Singular Value를 포함하는 대각행렬의 크기를 제외하고는 전부 0행렬이므로 대각행렬만 사용하여도 결국 결과값은 A로 같다는 것을 알 수 있다.
Compact SVD : r은 Singular Value에서 0인 값들을 전부 제거하고 0이 아닌 대각 원소만 남겨놓은 형태이다. 이 경우에 역시 0이 아닌 특이값만 남겨놈으로서 계산을 해주게 되면 결과가 A로 동일하게 된다.
Truncated SVD : Truncated SVD의 경우 Singular Value가 0이 아닌 값들 역시 제거함으로서 A가 그대로 보존되지 않고 A에 근사하는 A’가 된다.

여기서 흥미로운 점은, 이렇게 근사하는 A’가 Matrix Norm || A - A’ ||를 최소화 하는 Rank t 행렬로서 데이터 압축, 노이즈 제거에 활용될 수 있다는 점이다. ** Note : Rnak에 대한 내용은 여기을 참고하자**

즉, 다음의 링크에서 볼 수 있듯이 t를 줄이면 줄일수록 이미지가 압축되는 것을 볼 수 있다. https://darkpgmr.tistory.com/106

좋은 압축 방법은 아니지만 Truncated SVD를 통한 데이터 근사가 원래의 데이터 핵심을 잘 잡아내고 있음을 알 수 있다.

1-4. SVD와 Pseudo Inverse

1. pseudo inverse란?

‘Ax = b’에서 A가 정방행렬이 아닐 경우 A의 역행렬 대신 사용하는 $A^+$
위 식에서 해는 x = $A^+$ b가 되고 이 때, x는 Ax - b (Loss)를 최소화하는 해가 된다.

2. Pseudo Inverse와 SVD는 어떤 관게?

SVD는 A를 $U$$\sum$$V^T$로 쪼갤 수 있다는 것을 알 수 있다. 이 때, pseudo inverse인 $A^+$ 는 $V$$\sum^+$$U^T$로 계산된다.
앞서 설명한 것으로부터, U, V는 직교행렬로서 $U^T$ = $U^{-1}$, $V^T$ = $V^{-1}$ 임을 알 수 있고 $\sum$만이 $\sum^+$ 로 변환된 것을 알 수 있다. $\sum^+$ 의 경우 다음 그림을 보고 이해할 수 있다.

3.pseudo inverse $A^+$ 의 의미

$A^+$ 의 의미 역시 Singular Value에 의해 결정된다.
Singular Value는 $\sum$의 대각원소 부분을 의미한다는 것을 우리는 알고 있다. 이 때, 모든 Singular Value가 양수일 경우 우리는 다음 식으로부터 $A^+$ $A$, $A$ $A^+$ 가 단위행렬이 됨을 알 수 있다.
더불어, Singular Value의 값이 모두 양수가 아닌 0을 포함하고 있다면 앞서 설명한 Truncated SVD와 비슷한 방식으로 해석할 수 있는데, 0인 부분을 제거하여 데이터를 압축한다. 이로 부터 $A^+$ 는 A로 근사함을 어느 정도 이해할 수 있다.
또한, Singular Value의 양수값이 0에 가까울 경우에 노이즈로 판단하여 0으로 치환한 후 pseudo inverse를 구하는 것이 일반적이라고 한다. 이 역시, Truncated SVD를 통해 어느정도 이해할 수 있다.(근사 방법)
마지막으로, 앞선 수업시간(BoostCamp)에서 선형연립방정식의 경우 m > n 인 행렬일 경우에만 대상으로 pseudo inverse를 활용하여 근사해를 구할 수 있다고 하였고, 이는, 식의 개수가 변수의 개수보다 많다는 것을 뜻한다고 하였다. 이 떄, pseudo inverse의 입장에서 이해하자면, m > n 일 경우에 $A^+$ $A$ 가 단위행렬로 근사하고, n > m 일 경우에는 $A$ $A^+$ 가 단위행렬로 근사한다는 것을 알고 있으므로, Ax = b에서 $A^+$ $A$의 형태로 곱해줘야지 x = $A^+$ b의 결과가 나와 근사해를 구할 수 있음을 알 수 있다.

2. 피어 세션

2-1. [오늘 질문]

Stochastic 선택과제 1번 → 그래프를 플랏팅할 경우 진동이 생긴다. 그 이유는?
- Plotting한 값이 Error값이였다.
- Broadcasting에 의한 shape차이로 인해서 잘못된 결과값이 올라왔다.,
RNN BackPropagation 선택과제 2번 → Wx, Wrec을 한 번 뒤로 갈 때마다 더해주는 이유는?
- 학습 가능한 파라미터에 대한 손실 함수의 Gradient는 각 Layer의 파라미터의 Gradient를 더해서 구할 수 있다고 한다.

2-2. [매주 금 - 새로 습득한 정보에 대한 공유]

정규표현식에 대한 알아보기 (전화번호 찾기)
- Level 1
  - [] → [] 사이에 포함된 문자들 매칭
  - - → 범위를 나타낸다(ex, 가-힣). 더불어 이러한 범위는 아스키코드상의 순서를 나타낸다.
- Level 2
  - {} → 앞의 글자 또는 패턴의 반복 횟수를 지정
  - ? → 앞의 글자 또는 패턴이 한 번 나오거나 안나오거나
  - → ‘또는’의 의미
  - ^ → 시작 문자 혹은 not을 의미한다.
  - $ → 종료 문자를 의미 -() → 그룹을 만들어준다.
- Level 3
  - \d & \D → \d는 숫자를 찾는 단축문자이고 D는 그 반대이다.
  - \w & \W → \w는 영문자. 숫자, _를 찾는 단축문자, W는 w의 반대이다.
  - \s & \S → \s는 공백을 나타내며, S는 s의 반대이다.
  - . → 개행 문자를 제외한 모든 문자와 매치
  - - → 앞에 있는 글자 또는 패턴을 0회 이상 반복
  - - → 앞에 있는 글자 또는 패턴을 1회 이상 반복
- 추가
  - []로 잡아주면 아스키코드의 값을 토대로 찾아주며 만약 반대로 순서를 넣어주면 에러가 발생한다.
  - 유니코드 역시 가능하다.
특이값 분해
- https://jjonhwa.github.io/booststudy/2021/08/06/booststudy-plus-Singular_Value_Decomposition(특이값_분해)/

3. 5일차 후기

벌써 한 주가 흘렀다. 한 주밖에 되지 않았지만 많은 변화가 있었던 한 주 였던 것 같다. 알았던 내용 몰랐던 내용 할 것 없이 모두 새로운 내용 같았고 이들을 직접 코드를 구현하고 팀원들과 매일 회의를 진행하는 방식으로 공부를 진행하다보니 무엇 하나 쉽지 않았던 것 같다. 하지만, 이런게 정말 공부구나라는 것을 많이 느낄 수 있었던 한 주 였다.

이번 주도 빡쎈데 다음주는 어떡하지 라는 생각이 들지 않는다면 거짓말이겠지만 점점 익숙해진다면 충분히 해낼 수 있을 것 같고, 이렇게 공부하는 것 역시 나름 흥미로워서 충분히 해낼 수 있을 것이라고 생각한다!

이번주 수고한 캠퍼분들 및 내 자신에게 고생했다고 말해주고 싶고 다음주도 힘내서 더 잘 해낼 것이다!

Ustage Day 5

목차

1. 특이값 분해 (Singular Value Decomposition)

1-1. 용어 및 기본 내용

1-2. SVD의 기하학적 의미

1-3. Reduced SVD와 행렬 근사를 통한 데이터 압축

1-4. SVD와 Pseudo Inverse

1. pseudo inverse란?

2. Pseudo Inverse와 SVD는 어떤 관게?

3.pseudo inverse \(A^+\) 의 의미

2. 피어 세션

2-1. [오늘 질문]

2-2. [매주 금 - 새로 습득한 정보에 대한 공유]

3. 5일차 후기

Keep Going

목차

1. 특이값 분해 (Singular Value Decomposition)

1-1. 용어 및 기본 내용

1-2. SVD의 기하학적 의미

1-3. Reduced SVD와 행렬 근사를 통한 데이터 압축

1-4. SVD와 Pseudo Inverse

1. pseudo inverse란?

2. Pseudo Inverse와 SVD는 어떤 관게?

3.pseudo inverse \(A^+\) 의 의미

2. 피어 세션

2-1. [오늘 질문]

2-2. [매주 금 - 새로 습득한 정보에 대한 공유]

3. 5일차 후기

Share this post