Skip to main content
Dreamforce가 9월 17일부터 19일까지 샌프란시스코에서 열립니다. 지금 바로 등록하셔서 DF24TRAIL20 코드를 사용해 20%의 할인 혜택을 받으세요

신경망의 필요성 이해하기

학습 목표

이 유닛을 완료하면 다음을 수행할 수 있습니다.

  • 가중치 입력만 고려하는 AI 모델의 한계를 설명할 수 있습니다.
  • 머신 러닝에서 신경망의 역할을 설명할 수 있습니다.
  • 신경망의 주요 구성 요소를 정의할 수 있습니다.
  • 신경망에 복잡성이 어떤 식으로 부가되는지 설명하고 딥러닝을 정의할 수 있습니다.
  • 학습을 통해 결정된 가중치와 편향을 해석하는 것이 어떻게 불가능한지 설명할 수 있습니다.

Trailcast

이 모듈의 오디오 레코딩을 들어보려면 아래 플레이어를 사용하세요. 이 레코딩을 모두 들은 후 각 유닛으로 돌아와서 리소스를 확인하고 관련 평가를 완료하는 것을 잊지 마세요.

신경망의 중요성

AI에 대한 대화에 있어 신경망에 대한 언급은 필수적인 요소입니다. 신경망은 AI 모델을 학습시키는 데 중요한 도구이므로 신경망에 대해 어느 정도 이해해야 합니다. 하지만 상세히 알아보기 전에 신경망의 중요성에 대해 알아보겠습니다.

이전 유닛에서는 각 입력의 중요성에 따른 가중치를 추측하고 확인하여 AI 모델을 학습시킬 수 있다는 것을 알아봤습니다. 하지만 우유 장보기 예제는 지나치게 단순화되었습니다. 이 모델을 통해서는 대략적인 추정치를 확인할 수 있습니다. 그 이유를 이해하기 위해 두 가지 시나리오를 고려해 보겠습니다.

  1. 화요일 저녁에 비가 내립니다. 비를 맞고 싶지 않으므로 (그리고 여러분과 같은 많은 사람들은) 쇼핑을 내일로 미루기로 했습니다. 이 시나리오에서 비는 중요한 요소입니다.
  2. 토요일 오후에 비가 내립니다. 이 시간은 많은 사람들이 일주일 중 쇼핑을 할 수 있는 유일한 시간대입니다. 따라서 매장은 비가 오나 눈이 오나 바쁘게 돌아갑니다. 이 시나리오에서는 비가 온다고 해서 큰 차이가 없습니다.

문제는 기존 모델에서 비라는 요소에 하나의 가중치만 할당할 수 있지만, 우리는 이보다 더 복잡하다는 사실을 알고 있습니다. 하지만 해결책이 있으며, 먼저 두 가지 시나리오를 두 개의 개별 그래프로 표현해 보겠습니다. 선의 굵기는 중요도를 나타낸다고 했습니다. 첫 번째 그래프에서는 '주말'과 '시간'은 약한 요소이며, '비'는 강한 요소입니다. 두 번째 그래프에서는 '주말'이 강한 요소이며, '시간'과 '비'는 약한 요소입니다.

각각 '주말', '시간', '비'를 연결하여 예상치를 분리한 두 개의 다이어그램입니다. (회색, 파란색, 노란색)

우리 모두 똑똑하고 우유를 사 본 경험이 있기 때문에 이 두 가지 시나리오가 중요하다는 사실은 알고 있습니다. 하지만 우유 장보기에 대한 학습을 이제 막 시작한 컴퓨터에는 아직 학습된 정보가 없습니다! 주말 저녁-비, 평일 아침-햇살 등 다양한 시나리오를 고려해야 합니다. 두 개의 그래프 대신 여덟 개의 그래프를 통해 다양한 시나리오를 더 적절하게 나타낼 수 있습니다.

상당히 유사한 그래프 8개는 각각 3개의 노드가 하나에 연결되어 있습니다.

상당히 유사한 그래프가 많이 있습니다. 세 개의 입력은 항상 '주말', '시간', '비'를 나타내므로 겹칠 수 있습니다. 출력이 서로 겹치지 않도록 옮기면 다음과 같이 결합된 그래프를 얻을 수 있습니다.

한쪽에는 3개의 노드가 있고 다른 한쪽에는 8개의 노드가 있는 그래프입니다. 모든 노드는 선으로 연결되어 있습니다.

각 시나리오의 중요도는 특정 입력에 따라 다릅니다. 하지만 중요도를 아는 것은 절반의 성공에 불과합니다. 각 시나리오는 고유한 방식으로 최종 추정치에 영향을 미쳐야 합니다.

예를 들어, 주말 오후 우유를 사러 가는 경우 훨씬 더 오랜 시간이 소요될 수 있습니다. 따라서 +5를 조정해 보겠습니다. 예상치를 계산하기 위해 계산을 하면 더 큰 값을 확인할 수 있습니다. 이렇게 계산하면서 평일 오전에 비가 내리는 시나리오에 -4를 조정해 보겠습니다. 이 시간대에 우유를 사러 가는 데 소요되는 시간이 가장 짧다는 것을 알기 때문입니다.

각 시나리오에는 고유한 조정이 적용되며, 이를 편향이라고 합니다. 이 경우 편향은 더 정확한 추정치를 얻는 데 도움이 되므로 추정치를 산출할 때 긍정적으로 작용하는 항목입니다. 각 시나리오의 편향을 포함하도록 그래프를 다시 그려 보겠습니다.

한쪽의 경우 3개의 노드가 있고 다른 한쪽의 경우 8개의 노드가 있으며 각각 양수 또는 음수의 숫자가 있는 그래프입니다. 모든 노드는 선으로 연결되어 있습니다.

그렇다면 이 여덟 가지 시나리오와 해당 편향을 어떻게 처리할까요? 좀 더 어려운 계산을 통해 이를 결합하여 최종 추정치를 도출할 수 있습니다. 일부 시나리오는 다른 시나리오보다 더 많이 기여해야 하므로 더 많은 가중치가 필요합니다! 그래프를 업데이트함으로써 시나리오가 서로 다른 강도로 최종 추정치에 어떻게 연결되는지 확인할 수 있습니다.

왼쪽에 3개의 노드, 가운데에 8개, 오른쪽에 1개의 노드가 있는 그래프입니다. 선은 왼쪽에서 가운데로, 가운데에서 오른쪽으로 연결됩니다.

즉, 새로운 모델입니다. 연결이 많을수록 더 나은 추정치를 얻을 수 있습니다. 가중치와 편향으로 유도되는 이 연결망은 신경망의 한 예시입니다. 경험(데이터)으로 형성된 연결이 뇌의 뉴런이 연결되는 방식과 유사하므로 신경망이라고 부르는 것입니다.

시나리오는 고유한 요소의 조합을 설명하는 데 좋은 초급 단어이지만, 이 개념에는 노드라는 단어를 사용해야 합니다. AI 전문가들이 사용하는 용어이므로 앞으로는 우리도 이 용어를 사용해 보겠습니다.

신경망에 복잡성 부가하기

새로운 우유 장보기 모델은 신경망의 아주 기본적인 예시입니다. 실제 상황에서는 상당히 복잡해질 수 있습니다. 연구자들이 특정 작업에 대해 더 나은 결과를 도출하기 위해 신경망을 설정하는 몇 가지 방법을 살펴보겠습니다.

먼저, 입력과 출력 사이에 8개의 노드를 선택한 이유가 궁금하실 수 있습니다. 사실 이 숫자에는 약간의 유연함이 있습니다. 노드가 전혀 없는 경우 대략적인 추정치를 얻을 수 있다는 것을 알고 있습니다. 마찬가지로, 노드가 너무 적을 경우 모델링할 시스템의 모든 뉘앙스를 포착하지 못할 수도 있습니다. 하지만 노드가 너무 많은 것도 문제입니다. 컴퓨터가 필요 이상으로 많은 계산을 수행하는 것은 원하지 않습니다. 따라서 최소한의 노력을 통해 좋은 결과를 얻을 수 있는 최적의 노드 수가 있습니다. 적절한 수를 선택하는 것은 양질의 신경망을 설계하는 데 있어 중요한 요소입니다.

다른 방법을 통해 인공 신경망을 우리의 유기적인 신경망과 더 유사하게 만들 수도 있습니다. 머릿속에서 종종 한 아이디어에서 더 좋은 아이디어로 발전하여 명백하게 관련성이 없는 두 가지 사이의 연관성을 찾는 방식과 관련이 있습니다. 가장 뛰어난 통찰력 중 일부는 여러 번의 거듭되어 발전한 결과입니다. 그렇다면 더 많은 발전을 이룰 수 있는 신경망을 만들 수 있다면 어떨까요? 가능합니다! 더 많은 노드를 레이어로 추가하고 각 노드를 이웃 노드에 연결하면 됩니다.

입력과 출력 사이에 두 개의 노드 레이어가 있는 신경망 다이어그램.

데이터 이면의 의미를 찾기 위해 레이어를 추가하여 AI를 학습시키는 과정을 딥러닝이라고 합니다. 풍부한 컴퓨팅 성능을 통해 많은 신경망은 여러 개의 레이어를 갖도록 설계됩니다. 다시 말씀드리자면 가장 적절한 레이어 수는 필요한 계산 횟수와 결과의 품질 사이의 균형을 맞추는 것입니다.

암산 수준을 뛰어넘는 신경망 수학

이제 계산에 대해 말씀드리겠습니다. 지금까지 신경망 학습의 수학적인 부분에 대해 간략히 설명했습니다. 여기에는 몇 가지 이유가 있습니다. 첫째, 수학은 매우 복잡하고 매우 빠르게 진행될 수 있습니다. 예를 들어, 다음 내용은 신경망에 관한 연구 논문의 일부입니다.

신경망에 관한 고도의 기술 연구 논문 스크린샷

네, 인상 깊은 내용입니다!

둘째, 정확한 수학은 신경망에 어떤 종류의 작업을 학습시키는지에 따라 달라집니다. 셋째, 새로운 연구 논문이 나올 때마다 다양한 모델을 학습시키는 데 어떤 것이 더 효과적인지 학습하면서 수식이 업데이트됩니다.

따라서 신경망을 설계하려면 노드 수, 레이어 수, 학습할 작업에 가장 적합한 수학을 선택해야 합니다. 모델 아키텍처가 준비되면 컴퓨터가 화려한 수학 스킬을 사용하여 추측 및 확인 루틴을 수행하도록 해야 합니다. 결국 컴퓨터는 양질의 추정치를 제공하기 위한 최적의 가중치와 편향을 알아낼 수 있습니다.

이쯤에서 인공 신경망에 대해 약간의 불안한 점이 있습니다. 유능한 인재 스카우터가 차세대 야구 선수를 찾고 있다고 상상해 보겠습니다. 스카우터는 '그 사람을 만나보면 알겠지'라고 말할 수 있습니다. 어떻게 알 수 있는지 설명할 수는 없고 그냥 알게 되는 것이죠. 마찬가지로, 우리의 신경망은 특정 요소가 중요한 이유를 설명할 수 없습니다. 물론 각 가중치와 편향에 부여된 값을 살펴볼 수는 있지만, 연속된 연결의 결과인 숫자의 관련성은 알 수 없습니다.

인재 스카우터의 머릿속을 알 수 없는 것처럼 우리의 신경망도 마찬가지입니다. 입력과 출력 사이의 레이어를 관찰하지 않으므로 이를 숨겨진 레이어라고 합니다.

마무리

요약하자면 신경망에는 노드, 레이어, 가중치, 편향 및 여러 가지 수학이 혼합되어 있습니다. 이러한 요소가 모여 우리 몸의 유기적 신경망을 모방합니다. 각 신경망은 특정 작업에 적합하도록 세심히 조정됩니다. 비를 능숙하게 예측할 수도 있고, 식물을 분류하거나 고속 도로에서 자동차가 차선의 중앙을 유지하도록 하는 데 능숙할 수도 있습니다. 작업의 종류를 막론하고 신경망은 AI를 마법처럼 보이게 하는 데 크게 영향을 미칩니다. 이제 이 마술이 어떤 방식으로 진행되는지 어느 정도 이해했다고 생각할게요.

리소스