어려운 것을 쉽게 익히는 방법
어려운 개념을 처음 마주치면, 대부분 정의부터 읽는다.
내가 MoE (Mixture of Experts)에 대해 이해한 것을 예시로 살펴보자.
"MoE는 Mixture of Experts의 약자로, 여러 전문가 네트워크(Expert Network)를 구성하고, 라우터(Router)가 입력 토큰에 따라 적합한 전문가를 선택하는 구조입니다."
이걸 읽으면 다음 질문이 자동으로 생긴다. "전문가 네트워크가 뭐지?" → 링크를 열고. "라우터는?" → 또 링크를 열고. "토큰 임베딩은?" → 또...
돌아와서 처음 문장을 다시 읽으면, 아무것도 기억나지 않는다. 정의를 쫓아가다 보면 처음에 왜 이걸 배우려 했는지를 잃어버린다.