AWS AIF-C01 시험 정리(2) 본문
도메인 1. AI 및 ML의 기초
1.2. AI 실제 사용 사례
AI Services
Generative AI
Amazon Bedrock
- 서버리스 방식의 완전관리형 서비스
- AI21, Anthropic, Cohere, Stability AI, Amazon Titan 등 다양한 파운데이션 모델을 단일 API로 사용할 수 있음
- RAG, 파인튜닝, 에이전트 등 개발에 필요한 기능을 제공
- 인프라 관리 없이 보안·책임 있는 AI 기반 생성형 앱을 구축가능함
Amazon Titan
- Bedrock 전용 Amazon 자체 파운데이션 모델 제품군
- 텍스트·멀티모달·이미지 모델을 API로 제공
Amazon Q
- 2023년 11월 출시된 엔터프라이즈용 챗봇 서비스(월 $20)
- Amazon Titan 및 GPT 기반이며 AWS 콘솔 내에서 문서 요약, 트러블슈팅, 코드 보조 등을 지원함
Specialized AI Services
Amazon Lex
- 음성과 텍스트를 모두 지원하는 챗봇/음성봇 구축 도구로, Alexa 기술 기반의 NLU(Natural Language Understanding; 자연어처리)를 포함
Amazon Kendra
- 자연어 검색을 지원하는 엔터프라이즈 문서 검색 서비스로, 내부 데이터(인트라넷, 지식 베이스 등)의 효율적 탐색을 도움
Amazon Personalize
- 실시간/배치 방식 추천 시스템으로, 행동 기반 추천, 개인화 이메일, 맞춤형 콘텐츠 제공 등에 사용
Core
Amazon Comprehend
- 비정형 텍스트에서 언어, 주요 구문, 감정, 주제, PII 등을 분석해 인사이트를 추출하는 NLP 서비스
Amazon Translate
- AWS 문서 및 일반 자료에서 ‘언어 간 자동 번역’을 지원하는 관리형 딥러닝 기반 번역 서비스
Amazon Polly
- 41개 언어, 100개 이상 음성(Neural TTS 포함)을 지원하며 텍스트를 자연스러운 음성으로 변환하는 TTS 서비스
Amazon Transcribe
- 오디오를 텍스트로 변환(STT)하는 서비스로, 회의록 생성, 자막 삽입 등 다양한 응용이 가능
Amazon Textract
- 스캔된 문서에서 텍스트, 필기, 레이아웃, 표 및 키-값 페어를 규칙 없이 자동 추출해 문서 처리 자동화에 활용
Amazon Rekognition
- 이미지 및 영상 분석 서비스로 얼굴 인식/비교, 객체·텍스트 감지 등을 지원하며 커스텀 데이터셋 학습 기능도 포함
Amazon Panorama
- 엣지 디바이스에서 비디오 분석을 할 수 있도록 지원하는 서비스로, 로컬 환경에서 시각 AI를 운용할 수 있음
Amazon Sagemaker
- 데이터 준비부터 모델 학습·튜닝·배포까지 ML 전 주기를 아우르는 완전관리형 ML서비스
- 주요 제공 서비스
- Ground Truth: 사람이 레이블을 지정한 데이터를 훈련하고 모호한 데이터는 주석을 달아주는 서비스
- Data Wrangler: ETL 해주는 서비스(데이터 전처리를 위해 시각적 자료 제공)
- Feature Store: 모델들 간에 특성을 공유하는 서비스
- JumpStart: 다른 유저가 만들어 놓은 모델을 가져다가 커스터마이징할 수 있음
- 사전 훈련된 모델: 파운데이션 모델, 컴퓨터 비전, 자연어처리
- 데이터를 사용하여 파인튜닝
- SageMaker를 사용하여 배포
- Automatic Model Tuning: 가장 최적의 하이퍼파라미터를 찾아줌
- Model Registry: 모델 드리프트가 생겼을 때 아티팩트 관리하는 서비스(버전관리, 이미지관리 등)
- 추론: 학습된 머신러닝 모델을 사용하여 새로운 데이터에 대한 예측이나 판단을 수행
- 배치 변환 추론
- S3에 저장된 대량의 데이터를 일시적으로 처리하고 작업 완료 시 리소스 종료
- 제일 많이 사용되고 다른 추론들과 달리 유일하게 엔드포인트가 없음(오프라인)
- 처리량이 높아 대규모 데이터 처리 가능
- 이벤트 기반, 예약 호출이 가능
- 자주 사용하지 않고 가끔 한번씩 호출할 때(분기당 한 번 수준)
- 추론 실행 순서
- 준비: 학습된 모델 아티팩트와 추론코드를 등록
- 입력: 입력 데이터를 S3 버킷에 업로드
- 변환(Transform Job): 버킷의 데이터가 모델(추론코드 + 모델 아티팩트)를 이용해 추론
- 저장: 추론 후 출력 버킷 내에 넣고 모델은 삭제됨
- 보고: 출력 버킷 내 데이터가 보고 도구를 통해 보고
- 종료: 작업 완료 후 모든 리소스 종료
- 비동기식 추론
- S3에 페이로드 업로드 후 비동기 요청 처리
- 큐를 사용해서 다음 데이터가 대기하는 대기열 요청 방식
- 처리 시간이 길어서 가끔 실행하지만 한번 실행할 때 데이터셋이 큰 경우에 사용
- 추론 실행 순서
- 준비: 모델 생성 + 비동기 엔드포인트 구성 및 배포
- 입력: 입력 데이터를 S3 버킷에 업로드
- 큐잉: InvokeEndpointAsync 호출(S3 경로 전달) → 요청 큐에 적재, S3에 "작업 ID+결과 위치"가 제공
- 추론: 백그라운드에서 모델을 실행해서 예측을 수행
- 저장: 4의 결과를 3에서 지정된 S3 결과 위치에 저장
- 보고: 출력 버킷 내 데이터가 보고 도구를 통해 보고
- 종료: 작업 완료 후 엔드포인트 유지
- 서버리스 추론
- 호출할 때만 리소스 생성하고, 호출하지 않을 때에는 비용 발생하지 않게 서버 없이 진행
- 서버를 선택하거나 관리할 필요 없음
- 자동으로 확장 및 축소가 가능하며, 콜드 스타트가 가능함
- 호출이 간헐적이거나 호출량이 불규칙한 워크로드에 적합함
- 배치변환과 비슷하지만 서버리스는 이벤트 기반 서비스라는 차이점이 있음
- 추론 실행 순서
- 준비: 모델 생성 + 서버리스 엔드포인트 배포(단일 모델, 멀티 모델, 파이프라인 가능)
- 호출: API(InvokeEndpoint) 호출 시, 컨테이너 인스턴스가 즉시 생성됨(콜드스타트로 약간의 지연 발생)
- 추론: 모델이 로드되고 추론 수행
- 종료: 호출 응답 후 컨테이너는 일정 시간 이후 자동으로 리소스 종료
- 실시간 추론
- 서버리스 추론처럼 호출할 때만 리소스 생성하고, 호출하지 않을 때에는 비용 발생하지 않게 서버 없이 진행
- 모델을 SageMaker 호스팅 서비스에 배포하여 엔드포인트를 통해 API로 즉시 응답
- 추론 실행 순서
- 준비: 모델 생성 + 엔드포인트 배포
- 대기상태 유지(서버리스와 다름): 엔드포인트 활성화 후 항상 대기 상태 유지(인스턴스 상시 가동)
- 호출: API(InvokeEndpoint) HTTP POST로 호출
- 추론: 모델이 로드되고 실시간 추론 수행
- 종료: 호출 응답 후에도 엔드포인트는 대기상태로 유지되며, DeleteEndpoint를 사용해서 직접 종료 필요
- 추론 요약
방식주요 사용 상황 모델 배포 입력 방식 처리 방식 결과물 위치 엔드포인트 상태
배치변환 추론아주 드물게 요청되며 대량의 데이터셋을 한꺼번에 예측해야할 경우, 실무에서 제일 자주 쓰이는 방식임 일회성: 모델 → Job S3 배치 처리 S3 내부 사용 후 종료
비동기 추론큰 이미지나 비디오 파일을 처리해야 하는 배치형 요청, 긴 지연이 허용되는 경우 상시: 엔드포인트 배포 S3 + API 큐 → 미동기 S3 내부 상시 대기
서버리스 추론호출이 드물고 처리량이 예측불가능한 경우, 비용 효율성 중시하는 경우 상시: 엔드포인트 배포 API 온라인 응답 반환 호출 시
생성/해제
실시간 추론챗봇처럼 즉시 응답이 필요한 경우, 추론이 자주 사용되는 경우 상시: 엔드포인트 배포 API 온라인 응답 반환 상시 대기
- 배치 변환 추론
- Model Monitor: 프로덕션 환경에서 모델 품질을 모니터링하며 이상이 탐지되면 알림
- 데이터 드리프트: 입력되는 데이터의 특성 분포가 시간이 지남에 따라 학습 시 사용된 데이터와 다르게 바뀌는 현상
- 모델 드리프트: 모델이 배포된 후 시간이 지남에 따라 모델 성능이 점차 저하되는 현상
- Model DashBoard: 여러 모델을 한번에 확인 가능하며, 엔드포인트 성능 지표도 확인 가능
- Canvas: 모델을 빌드할 때 코드없이 GUI 기반으로 빌드 가능(No-Code & Low-Code)
'AI' 카테고리의 다른 글
AWS AIF-C01 시험 정리(1) (0) | 2025.07.07 |
---|---|
AICE Associate 시험 총정리 (0) | 2025.06.30 |
딥러닝(2) - RNN, GAN (0) | 2025.03.24 |
딥러닝(1) - ANN, DNN, CNN (0) | 2025.03.23 |
Comments