AWS AIF-C01 시험 정리(1) 본문
시험 개요
출제 범위
영역 | 출제 범위 | 상세 설명 (문서 목차) | 출제율 |
도메인 1 | AI 및 ML의 기초 | 1.1. AI 기본 개념과 용어 1.2. AI 실제 사용 사례 1.3. ML 개발 수명주기 |
20% |
도메인 2 | 생성형 AI의 기초 | 2.1. 생성형 AI의 기본 개념 2.2. 비즈니스 문제 해결에서의 생성형 AI의 기능과 한계 2.3. 생성형 AI 애플리케이션의 AWS 인프라 및 기술 |
24% |
도메인 3 | 파운데이션 모델 적용 | 3.1. 파운데이션 모델을 사용하는 애플리케이션의 설계 고려사항 3.2. 효과적인 프롬프트 엔지니어링 기법 선택 3.3. 파운데이션 모델의 훈련과 파인튜닝 프로세스 3.4. 파운데이션 모델 성능을 평가하는 방법 |
28% |
도메인 4 | 책임감있는 AI 가이드라인 | 4.1. 책임감있는 AI 시스템 개발 4.2. 투명하고 설명가능한 모델의 중요성 |
14% |
도메인 5 | AI 솔루션의 보안, 컴플라이언스 및 거버넌스 | 5.1. AI 시스템의 보안 방법 5.2. AI 시스템의 거버넌스 및 규정 준수 |
14% |
문제 유형
- 선다형: 하나의 정답과 세 개의 오답(혼동을 유도하는 보기)을 포함함
- 복수응답형: 5개 이상의 응답 항목 중 2개 이상의 정답으로 구성(부분점수 없음)
- 순서지정: 특정 작업을 완료하기 위해 3~5개 답을 올바른 순서대로 배열
- 짝짓기형(매칭): 3~7개의 항목(프롬프트)과 목록을 각각 올바르게 쌍 매칭
- 사례 연구: 하나의 시나리오에 대해 문항이 두 개 이상 제시되며, 각 문항이 개별적으로 평가됨
- 총 65개의 문항 중 15개의 문항은 채점에 반영되지 않음
도메인 1. AI 및 ML의 기초
1.1. AI/ML 기본 개념과 용어
AI 및 ML의 개념
AI Artificial Intelligence
- 정의: 인지, 학습, 문제 해결 등 인간의 지능 기능을 모방하는 알고리즘과 프로세스
- 핵심 개념: 사람이 추론할 수 있는 규칙과 상관관계를 프로그래밍 언어로 입력하여 실행
ML Machine Learning
- 정의: 데이터에서 패턴을 식별하고 규칙을 찾아내며 예측 또는 생성을 수행
- 핵심 개념
- ML 주요 용어
- 모델(Model): 학습 프로세스의 수학적 표현으로서, 데이터에 대한 패턴 및 규칙
- 훈련(Training): 데이터에 대한 의미있는 패턴을 모델에 학습시키고, 데이터를 통해 파라미터를 조정하는 과정
- 추론(Inference): 학습된 모델이 새로운 데이터에 대해 예측 또는 결정을 내리는 과정
- 파라미터(Parameter)
- 모델이 예측을 조정하기 위해 사용하는 변수
- w값, b값을 찾아가는 과정
- 하이퍼파라미터(Hyperparameter)
- 최적의 훈련 모델을 구현하기 위해 모델에 설정하는 변수
- 학습률(Learning Rate): w값, b값 초기값에서 두번째 학습, 다음 학습에 각 값을 어떻게 변경할건지 설정
- 학습단위
- Epoch: 반복 학습 횟수
- Iteration: 배치가 반복된 횟수 = 총 데이터 수 / batch size
- Batch size: 대량의 데이터를 쪼개서 병렬로 작업
- 특성(Feature): 결과에 영향을 주는 변수이며 독립변수(X)라고도 표현함
- 레이블(Label): 데이터에 대한 정답 또는 목표값이며 종속변수(y)라고도 표현함
- 데이터셋(Dataset)
- 모델 훈련에 사용하는 데이터 샘플 집합
- 일반적으로 훈련/검증/테스트 데이터 셋을 7:2:1 또는 8:1:1로 분할하여 사용함
- E.g.) 선형회귀 모델
y = mx + b # y: 레이블(종속변수) # x: 특성(독립변수) # w: 가중치, b: 절편 → 파라미터
- ML 학습유형
- 지도학습
- 특성과 레이블이 있는 데이터 학습
- 주요 기술
- 분류(Classification)
- 범주형인 데이터로 학습
- 문제 유형
- 이진분류: 레이블이 2개, E.g.) 'Yes'/'No'...
- 다중분류: 레이블이 3개 이상, E.g.) '어린이'/'청소년'/'어른' ...
- 회귀(Regression)
- 수치형인 데이터로 학습
- 모델 유형
- 선형 회귀: 연속적인 종속변수를 예측, E.g.) 집값 예측
- 로지스틱 회귀(분류에 가까운 회귀모델): 0과 1 사이 수로 예측, E.g.) 심장병 예측
- 분류(Classification)
- 비지도학습
- 레이블 없이 특성만 가지고 비슷한 속성을 가지는 데이터를 그룹핑하는 학습
- 알고리즘 유형
- 클러스터링: K-means 알고리즘을 활용하여 데이터 간의 유사성을 기준으로 그룹을 형성하고, 이를 통해 숨겨진 패턴이나 데이터 구조를 파악함
- 차원 축소: PCA(주성분 분석)를 활용하여 기존 특성들을 선형 결합한 주성분을 추출하고, 이로써 정보의 손실을 최소화하면서 차원을 축소함
- 강화학습(보상 기반 학습)
- 에이전트가 환경과 상호작용하며 보상을 통해 학습하는 방식
- 강화학습 매커니즘
- 초기화: 에이전트는 초기 정책이나 가치 함수, Q-테이블 등을 설정하고, 환경은 초기 상태를 반환함
- 현재 상태 관찰: 에이전트는 환경으로부터 현재 상태를 관찰함
- 행동 선택: 에이전트는 정책 또는 탐험 전략을 사용해 상태에 대한 행동을 선택함
- 환경에 행동 적용: 선택한 행동을 환경에 적용하면, 환경은 다음 상태와 보상을 반환함
- 보상과 상태 업데이트: 에이전트는 받은 보상과 4의 다음 상태를 기반으로 학습함
- 정책 개선: 에이전트는 학습 결과를 바탕으로 다음 행동 선택 정책을 개선함
- 종료 조건 확인: 목표 상태에 도달했다면 반복을 중단하고, 그렇지 않으면 2번 상태 관찰부터 반복
- 보통 단독으로 하지 않고 지도학습이나 비지도 학습 후 진행
- 지도학습
- 모델 성능
- 훈련 데이터 평가 결과와 데이터 평가 결과를 확인하고 판단(목표 평가 지표: 정확도 90% 이상)
- 일반화: 훈련 95%, 검증 93% → 제일 좋은 모델
- 과소적합: 훈련 66%, 검증 68% → 데이터가 너무 적어서 모델이 너무 단순하여 패턴이나 규칙을 제대로 학습하지 못함
- 과대적합: 훈련 94%, 검증 76% → 훈련데이터가 너무 많거나 데이터 속성이 너무 많아서 과하게 학습하여 학습데이터에 대해서는 정확도가 높지만, 테스트 데이터나 다른 데이터에는 성능이 떨어짐(PCA 필요)
- 훈련 데이터 평가 결과와 데이터 평가 결과를 확인하고 판단(목표 평가 지표: 정확도 90% 이상)
- ML 주요 용어
DL Deep Learning
- 머신러닝 알고리즘의 집합으로 사람의 사고방식을 컴퓨터에게 가르치는 머신러닝의 한 분야
- 핵심 개념
- DL 주요 용어
- 인공신경망(ANN, Artificial Neural Network) 이전 글 참고
- 생물학적 뇌의 뉴런 구조에서 영감을 얻어 만들어진 수학적 모델
- '입력층 → 은닉층 → 출력층'으로 구성됨
- 각 뉴런은 가중치, 편향, 활성화 함수를 통해 신호를 전달하고 처리함
- 뉴런(Neuron)
- 인간의 뉴런을 모방한 계산 단위
- 여러 입력 값을 받아 가중치 곱 + 편향의 합을 계산하고, 활성화 함수를 통해 출력값을 생성함
- 파라미터(Parameters)
- 가중치(Weight): 입력값이 뉴런에 얼마나 영향을 미칠지 결정하는 계수
- 편향(Bias): 뉴런의 출력값을 조정하는 보정값
- 활성화 함수(Activation Function)
- 뉴런의 출력을 결정하는 함수로, 비선형성을 부여
- 인공신경망(ANN, Artificial Neural Network) 이전 글 참고
- 인공신경망(ANN) 개념
- 입력층
- 외부에서 들어온 데이터가 처음 전달되는 층
- 각 뉴런은 하나의 입력값을 받음
- 은닉층
- 입력과 출력 사이에 위치한 계산층(여러 층이 있을 수 있음)
- 각 층의 뉴런은 복잡한 패턴을 학습함
- 가중치(weight)와 편향(bias)를 적용하여 입력을 조합
- 활성화 함수를 통해 결과값 도출
- 출력층
- 최종 예측 결과를 출력하는 층
- 분류 문제일 때: 클래스 수만큼 뉴런 존재
- 회귀 문제일 때: 일반적으로 하나의 뉴런이 존재
- 입력층
- DL 주요 용어
'AI' 카테고리의 다른 글
AWS AIF-C01 시험 정리(2) (0) | 2025.07.09 |
---|---|
AICE Associate 시험 총정리 (0) | 2025.06.30 |
딥러닝(2) - RNN, GAN (0) | 2025.03.24 |
딥러닝(1) - ANN, DNN, CNN (0) | 2025.03.23 |
Comments