
상명대학교 / 서광규 교수
*이 원고는 국제표준문서인 “ITU-T Y.3531 (2020) Cloud computing ? Functional requirements for machine learning as a service”를 토대로 작성되었음
2. 서비스로서의 머신러닝(MLaaS)
2-1. MLaaS의 시스템 컨텍스트
MLaaS는 클라우드 서비스 고객(CSC)에게 제공되는 기능이 ML 프레임워크의 프로비저닝 및 사용인 클라우드 서비스 범주이다. ML 처리에는 많은 양의 훈련 데이터와 ML 모델 훈련과 관련된 매우 복잡한 계산으로 인해 ML 모델 훈련을 위한 많은 양의 컴퓨팅 성능과 리소스가 필요한다. MLaaS는 CSC 요청을 기반으로 클라우드 환경에서 탄력적인 컴퓨팅 기능과 리소스를 제공하여 문제를 해결한다.
MLaaS의 시스템 컨텍스트는 [ITU-T Y.3502; Information technology ? Cloud computing ? Reference architecture]에 설정된 아키텍처 사용자 관점을 기반으로 추가적인 하위 역할과 활동을 제공한다. 이 절에서는 클라우드 컴퓨팅이 ML 생태계에서 ML 데이터 제공자, ML 모델 제공자, ML 프레임워크 제공자 및 ML 프레임워크 고객이라는 네 가지 주요 역할을 지원하는 방법을 설명한다.
클라우드 컴퓨팅 하위 역할은 표 1에 표시된 대로 ML 역할에 매핑될 수 있다. CSP(클라우드 서비스 공급자), CSN(클라우드 서비스 파트너) 및 CSC의 하위 역할은 ML 생태계의 역할 및 하위 역할에 매핑된다.

[표1. 기계 학습 생태계를 MLaaS 시스템 컨텍스트에 매핑]
그림 4는 MLaaS의 클라우드 컴퓨팅 하위 역할을 보여준다. 그림 4는 또한 ML과 관련된 활동을 식별하고 이를 클라우드 컴퓨팅 하위 역할에 할당한다. MLaaS는 CSP 및 CSN의 다른 하위 역할을 활용한다.

[그림4. MLaaS 시스템 컨텍스트]
2-2. CSN:머신러닝 데이터 제공자
CSN:MLDP는 [ITU-T Y.3600 Big data ? Cloud computing based requirements and capabilities]에 지정된 대로 CSN:DP의 데이터 라벨링 및 활동을 제공하는 CSN의 하위 역할이다. 데이터에 대한 CSN:DP의 활동에는 생성, 게시 및 중개가 포함된다. CSN:MLDP의 추가 활동은 다음과 같다.
? 데이터 라벨링 제공
2-2-1. 데이터 라벨링 조항
데이터 라벨링 조항에는 이러한 목적을 위한 도구를 사용하여 라벨링 정보를 생성하는 작업이 포함된다. 수동 라벨러는 도구에서 제공하는 지침에 따라 데이터에 수동으로 주석을 추가한다. 이 활동에는 다음이 포함된다.
? CSP:MLSP의 지침에 따른 라벨 생성
? 라벨이 붙은 데이터에 대한 메타데이터 제공
? ML 데이터를 검색하기 위해 CSP:MLSP에 대한 CSN:DP 카탈로그 업데이트
2-3. CSN:머신러닝 모델 개발자
CSN:MLMD는 다양한 학습 작업 솔루션에서 ML 모델을 지원하는 CSN의 하위 역할이다. CSN:MLMD는 ML 모델 검색 및 활용을 위한 ML 모델 카탈로그를 생성한다. ML 모델 카탈로그에는 구성표, 버전, 사용량, 평가 측정항목과 같은 ML 모델 메타데이터가 포함되어 있다. ML 모델 사용에는 ML 모델의 적용 가능한 학습 작업이 포함된다.
ML 모델에 대한 CSN:MLMD의 활동은 다음과 같다.
- 개발
- 등록
2-3-1. ML 모델 개발
ML 모델 개발에는 ML 모델 개발 및 업데이트, 해당 정보와 함께 ML 모델 게시가 포함된다. 이 활동에는 다음이 포함된다.
? 매개변수의 초기값을 설정하여 ML 모델 개발
? 피드백 및 보고 정보로 ML 모델 업데이트
? ML 모델 학습을 위한 하이퍼파라미터 구성 제공
? 사용법, 입력/출력 데이터 형식 및 예상 성능을 포함한 ML 모델 메타데이터 생성.
2-3-2. ML 모델 등록
ML 모델 등록은 ML 모델 카탈로그를 CSP:MLSP에 제공하는 것이다. ML 모델 카탈로그에는 메타데이터와 함께 ML 모델 정보가 포함되어 있다.
※ 참고 ? ML 모델은 ML 프레임워크에 의해 설정된 구조화된 형식으로 제공될 수 있다.
이 활동에는 다음이 포함된다.
? CSP:MLSP에 대한 ML 모델 액세스 정보 제공
? 적절한 ML 모델을 검색하기 위한 CSP:MLSP에 대한 카탈로그 제공
2-4. CSP:머신러닝 서비스 제공자
SP:MLSP는 ML 모델 학습, 배포 및 관리를 위한 인프라와 도구를 포함한 MLaaS를 제공하는 CSP의 하위 역할이다. 또한 CSP:MLSP는 ML 데이터 수집 및 감사를 지원한다.
※ 참고 - CSP:MLSP는 [ITU-T Y.3600]에 지정된 CSP:BDIP 활동을 제공할 수 있다. CSP:BDIP의 관련 활동은 데이터 수집, 데이터 저장, 데이터 전처리 및 데이터 통합이다.
CSP:MLSP의 추가 활동은 다음과 같다.
? ML 데이터 감사
? 데이터 기능 엔지니어링
? ML 모델 학습
? ML 모델 테스트
? ML 모델 학습 모니터링 및 보고
? ML 모델 배포 관리
? 재학습 정책 관리
2-4-1. ML 데이터 감사
ML 데이터 감사는 보편화되고 관리되는 도구를 제공하여 라벨링 작업을 지원한다. 이 활동은 ML 데이터세트의 라벨링 품질과 안정성을 향상시키는 데 도움이 된다. 이 활동에는 다음이 포함된다.
? CSN:MLDP를 위한 라벨링 환경 및 도구 제공
? 라벨링 품질에 대한 ML 데이터 감사
? CSN:MLDP에 피드백을 보고
2-4-2. 데이터 특성 엔지니어링
데이터 특성 엔지니어링은 특성에 대해 ML 데이터에서 선택, 크기 조정, 추출과 같은 방법을 사용한다. 기능 엔지니어링은 훈련 프로세스의 탐색을 지원하고 성능이 저하된 ML 모델의 위험을 관리한다.
※ 참고 ? 과적합 문제는 성능이 낮은 ML 모델의 예이다. 과적합은 모델이 데이터에 너무 가깝게 적합하고 예측을 일반화하지 못할 때 발생한다.
2-4-3. ML 모델 훈련
ML 모델 학습은 검증을 포함하여 ML 모델에 대한 학습 프로세스를 실행한다. 이 활동에는 다음이 포함된다.
? ML 모델 학습을 위한 가상 머신 및 스토리지 생성
? 하이퍼파라미터 구성과 같은 훈련 관련 정보 입력을 통해 ML 모델 훈련의 트리거링 및 작동
? 학습, 검증 및 테스트를 위해 ML 데이터를 데이터 세트로 분할하기 위한 구성 제공
? ML 모델 성능 검증
? ML 모델 학습 결과 등록 및 저장
2-4-4. ML 모델 테스트
ML 모델 테스트는 훈련된 ML 모델을 배포하기 전에 평가하여 해당 작업에 맞는 성능과 품질을 보장한다.
2-4-5. ML 모델 훈련 모니터링 및 보고
ML 모델 훈련 모니터링 및 보고는 리소스 활용도 측정, 이상 경고, 자동 중지 등의 기능을 제공하여 모델 훈련 프로세스를 지원한다. 보고서 내역은 ML 모델 체계의 오류를 감지하고 재학습 정책을 결정하는 데 활용될 수 있다. 이 활동에는 다음이 포함된다.
? ML 모델 학습 중 리소스 활용도 측정 및 모니터링
? 제공된 ML 모델로 ML 모델 학습을 유지할 수 없는 경우 문제를 보고
? ML 모델 학습 중 ML 모델의 성능을 보고
? 구성된 임계값을 초과하면 자동 중지
※ 참고 ? CSC:MLSU는 리소스 활용 과부하와 같은 자동 중지에 대한 임계값을 구성한다.
2-4-6. ML 모델 배포 관리
ML 모델 배포 관리는 대상 컴퓨팅 환경에 배포하기 위해 학습된 ML 모델 내보내기를 지원한다. CSP:MLSP는 다양한 컴퓨팅 환경을 위한 ML 모델의 여러 형식으로의 변환을 지원한다. 또한 내보낸 모델은 ML 모델 카탈로그의 재학습 및 업데이트를 위해 등록된다.
※ 참고 1 ? 훈련된 ML 모델은 카탈로그에서 업데이트되고 전이 학습을 위한 ML 모델을 서비스하기 위해 제공될 수 있다.
※ 참고 2 ? 전이 학습은 사전 훈련된 ML 모델을 관련 학습 작업에 적용하는 기술이다.
2-4-7. 재학습 정책 관리
재학습 정책 관리는 CSC:MLSU에 대한 재학습 프로세스를 결정한다. 재훈련은 ML 모델의 성능을 보장 및 유지하거나 성능을 향상시킨다. 재학습 정책은 배포된 모델의 예상 성능, 모니터링 기간, 후속 조치 등을 고려한다.
2-5. CSC:머신러닝 서비스 사용자
CSC:MLSU는 CSC의 하위 역할로, ML 프레임워크와 클라우드 서비스를 활용하여 사용자 의도에 따라 ML 애플리케이션을 개발한다.
CSC:MLSU 활동에는 다음이 포함된다.
? ML 서비스 이용
2-5-1. ML 서비스 이용
ML 서비스 사용에는 ML 프레임워크 및 클라우드 서비스를 호출하고 사용하여 ML 애플리케이션을 개발하는 작업이 포함된다.
참 고 문 헌
- ITU-T Y.3531 (2020) Cloud computing ? Functional requirements for machine learning as a service
- ITU-T Y.3600 (2015) Big data ? Cloud computing based requirements and capabilities
- ITU-T Y.3502 (2014) Information technology ? Cloud computing ? Reference architecture
- ITU-T X.1601 (2015) Security framework for cloud computing
저작권 정책
K-ICT 클라우드혁신센터의 저작물인 『국제표준문서에서 MLaaS(Machine Learning as a Service)를 위한 기능 요구사항』은 K-ICT 클라우드혁신센터에서 상명대학교 서광규 교수에게 집필 자문을 받아 발행한 전문정보 브리프로, K-ICT 클라우드혁신센터의 저작권정책에 따라 이용할 수 있습니다.
다만 사진, 이미지, 인용자료 등 제3자에게 저작권이 있는 경우 원저작권자가 정한 바에 따릅니다.