국내 빅데이터 센터 구축 사업과 클라우드


지능정보사회연구소/ 조흥재 부소장


빅데이터 산업에 대한 국가별 경쟁이 치열해지고 있는 가운데 국내에서는 공공데이터와 민간데이터의 융합을 위한 국가주도의 빅데이터 센터 구축사업이 확정되어 10개 분야(지역경제, 헬스케어, 중소기업, 유통·물류, 금융, 교통, 문화·미디어, 환경, 산림, 통신)에 대한 선정과 함께 사업을 착수(‘19. 7월) 하였다.

 
분야수행기관센터 구성
금융비씨카드7개(노타, 닐슨코리아, 다음소프트, SBCN, 망고플레이트, 해빗팩토리, KT)
환경한국수자원공사7개(기상산업기술원, 국립생태원, 환경정책평가연구원, 지질자원연구원, GDS컨설팅그룹, 그린에코스, 아이렉스넷)
문화한국문화정보원8개(국립중앙도서관, 국민체육진흥공단, 문화예술위원회, 야놀자, 청소년활동진흥원, 부산정보산업진흥원, 레드테이블, 레드타이)
교통한국교통연구원7개(울산정보산업진흥원, 포항테크노파크, 아이나비시스템즈, SK텔레콤, KT, KST플레이스, 코리아크레딧뷰로)
헬스케어국립암센터5개(삼성서울병원, 연대 세브란스병원, 건양대병원, 전북대병원, 대구카톨릭대병원)
유통소비매일방송10개(나이스디앤알, 다음소프트, 데이블, 로플랫, 빌트온, 식신, 온누리에이치앤씨, 지인플러스, 코리아크레딧뷰로, 한국우편사업진흥원)
통신KT11개(비씨카드, 인터넷진흥원, 인천테크노파크, 소상공인연합회, 경기대, 어메이징푸드솔루션, 두잉랩, 코난테크놀로지, 오픈메이트, 넥스트이지, 네스)
중소기업더존비즈온8개(빅밸류, 한화손해보험, 한국생산성본부, 한국무역정보통신, 와이즈넛, NICE평가정보, 산업기술진흥협회, 인크루트)
지역경제경기도청5개(경기콘텐츠진흥원, 경기일자리재단, 더아이엠씨, 경기신용보증재단, 한국기업데이터)
산림한국임업진흥원7개(비글, 아로정보통신, 인포보스, 한국산림복지진흥원, 시선아이티, 우림엔알, 삼아항업)

<10대 빅데이터 플랫폼 및 센터 선정 현황>


 

10대 빅데이터 플랫폼 및 센터 구축 사업은 과학기술정보통신부에서 주최하는 사업으로 3년간 1,516억원 및 올 해 640억원 규모로 추진된다. 또한, 공공과 민간의 데이터 연계 및 융합을 위해 필요한 공통 포맷과 개방 표준을 적용하고, 데이터를 생산하는 센터와 플랫폼 간에는 민간 클라우드를 통해 데이터를 연계하여 실시간 또는 주기적으로 이용자들에게 개방?공유할 예정이다.

 

빅데이터 플랫폼은 공공과 민간이 협업하여 데이터를 생산?구축하고 집적된 데이터를 수집?분석?유통하는 역할을 담당한다. 빅데이터 플랫폼 사업과 관련하여 클라우드 기업은 KT, NBP, 아마존 등이 IaaS(Infrastructure as a Service)를 중심으로 클라우드 서비스를 제공한다.

 

이에 따라, 본고에서는 10대 빅데이터 플랫폼 및 센터 구축 사업 중 산림분야에서의 클라우드 활용 내용을 살펴보고 향후 빅데이터 플랫폼 내에서 클라우드의 역할을 조명해 보고자 한다.




산림분야의 빅데이터 플랫폼


산림분야의 빅데이터 플랫폼은 민간 클라우드를 활용하여 플랫폼 기반을 구성하고 데이터 수집?저장, 분석 및 데이터 거래?유통 등 단계별 지원 기능과 원스톱(One-stop) 서비스 제공을 위한 통합 포털로 구축된다.

 

국내 빅데이터 센터 구축 사업 1


< 산림 빅데이터 플랫폼 구성도 >


산림분야의 빅데이터 플랫폼은 트래킹, 산림재해, 생물종 유전체, 대중교통, 항공 사진, 산림복지, 산악기상 정보 등을 가공 및 융합할 수 있는 기반을 마련하고 이를 토대로 서비스 분석모형을 발굴하고 첨단 서비스(산림자원관리, 산림/휴양 복지, 산림 재해안전 등) 제공을 목표로 삼고 있다.

 

또한, 스타트업 및 학술 연구 등에 필요한 샘플데이터를 제공하여 신사업 발굴과 연구를 목적으로 데이터를 개방하여 활용할 수 있도록 지원하고 필요시 전체 데이터를 거래할 수 있도록 거래소를 제공할 예정이다.

 

그리고, 산림분야의 빅데이터 플랫폼에서는 데이터 운영 및 분석활용 등을 효율적으로 적용 할 수 있도록 데이터 저장소, DB 등에 대해 민간 클라우드 기반 인프라를 구축하여 추진할 계획이다.

 

국내 빅데이터 센터 구축 사업 2


< 클라우드 인프라 개념도 >


국내 빅데이터 센터 구축 사업 3


< 클라우드 인프라 상세 구성도 >


 

산림분야 빅데이터 플랫폼에서는 클라우드를 이용하는 영역이 두 곳으로 나뉘는데 첫 번째는 내부에서 이용하는 인프라에 대한 부분이고, 두 번째는 외부 이용자가 접근해서 분석 등의 기능을 활용할 수 있는 DMZ 구간이다. 두 개의 구간은 물리적 망분리를 통해 원천데이터를 보호하면서 내부 이용자가 분석환경을 이용할 수 있는 영역과 외부 이용자가 외부용 분석환경을 이용할 수 있는 영역으로 구분된다.

 

국내 빅데이터 센터 구축 사업 4


< H/W 구성도 >


 

산림분야 빅데이터 플랫폼의 H/W 구성도에서 클라우드가 활용되는 분야는 IaaS 중에서 서버(WEB/WAS, DB, 분석 등)에 집중되어 있음을 볼 수 있다. DMZ 영역의 경우 또한 분석서버 외에는 특별히 클라우드의 역할을 찾아보기 어렵다.

 

산림분야 외에 헬스케어 및 교통분야에서도 클라우드의 활용은 매우 미미하며, 빅데이터 플랫폼의 기능별 또는 레이어(Layer)별 클라우드의 역할을 기대할 수 있음에도 불구하고 적극적으로 활용되지 못하고 있는 것이 현실이다.

 

물론 클라우드의 단점인 서비스 제공자에 대한 락인(Lock-in) 효과가 강하기 때문에 빅데이터 플랫폼의 모듈화를 추구하는 것이 혹시라도 모를 리스크(Risk)를 감소시킬 수는 있겠지만 지속적인 데이터 및 이용자의 증가 등에 탄력적인 대응과 효율적인 서비스 지원을 위해서는 부문별 클라우드 도입이 효과적일 것으로 여겨진다.




마치면서


10대 빅데이터 플랫폼 및 센터 구축 사업은 클라우드와 빅데이터가 서로 융합하여 시너지를 창출 할 수 있는 좋은 기회가 될 수 있을 것으로 예상된다. 하지만, 아직까지 클라우드의 활용 영역은 IaaS에 집중되어 진행되고 있음을 확인할 수 있었다.

 

빅데이터 플랫폼에서 클라우드가 도입될 수 있는 영역(layer)을 나누어 생각해보면 가장 밑단인 인프라에서의 IaaS와 분석 등을 지원할 수 있는 PaaS(Platform as a Service), 빌링 등을 지원할 수 있는 SaaS(Soft as a Service)로 구분 될 수 있다. 여기에서, PaaS의 경우 클라우드 분류체계(붙임 참조)상 30100. 분석(Analytics) 도구 제공 서비스 및 30200. 빅 데이터(Big Data as a Service) 분석 플랫폼 제공 서비스 등을 클라우드 서비스로 이용할 수 있으며, SaaS 는 20100. 과금 관련(Billing : 요금청구 등) 응용프로그램 서비스를 이용할 수 있을 것으로 여겨진다.

 

또한, 이외에도 엣지 컴퓨팅 또는 서비스를 통해 외부 이용자가 통합 포털 또는 빅데이터 플랫폼단의 서비스를 이용하려고 할 때 간단한 계산 및 분석 등을 빠르게 처리할 수 있는 기능도 이용할 수 있을 것이다.

 

빅데이터의 활용성을 극대화하기 대용량 데이터의 분산 및 병렬처리, 고성능의 데이터 처리, 신속한 서비스 등을 위해 클라우드는 인프라 기반부터 서비스 제공 영역까지 활용가치는 플랫폼 설계자에 따라 다양하게 나타나고 시너지를 창출 할 수 있을 것으로 여겨진다.

 

본 리포트에서는 산림분야의 빅데이터 플랫폼을 중심으로 클라우드 활용 내용을 살펴보고 빅데이터 플랫폼 내에서 클라우드 활용 능력을 조명해 본 결과 빅데이터 산업과 밀접한 기술적 상관성을 지난 클라우드가 아직까지도 효용적 가치를 발휘하지 못하고 있는 것으로 보인다.

 

‘클라우드 발전법’ 제정이후 정부 및 공공에서 추진하는 사업들에 대해 클라우드 우선 도입을 검토하여 클라우드 산업의 활성화를 견인하기 위해서는 클라우드 도입의 양적 증대도 필요하지만 정부에서는 클라우드가 도입 될 수 있는 영역에 대한 검토를 통해 다양한 클라우드 서비스 도입을 촉진하고 클라우드 제공기업은 산업 트랜드에 따른 신규 서비스 발굴 등이 함께 병행되어 진다면 산업융합에 따른 시너지를 충분히 창출할 수 있을 것으로 판단된다.




참고자료. 클라우드 산업 분류체계 및 분류코드


10000. IaaS
10100. 백업 및 복구 서비스(Backup & Recovery)
10200. 클라우드 인프라 플랫폼 연결 서비스(Cloud Connect)
10300. 서버 자원 제공 서비스(Compute; Server)
10400. 콘텐츠 전송 네트워크 서비스(Content Delivery Networks)
10500. 인프라 플랫폼 관리 서비스(Services Management)
10600. 스토리지 제공 서비스(Storage)
10700. 데스크톱 가상화(VDI)/ 서비스형 데스크 톱(DaaS) 서비스
10800. IaaS를 위한 클라우드 소프트웨어(S/W)10801. 클라우드 추상화(Cloud Abstraction) 지원 소프트웨어
10802. 클라우드 통합(Cloud Integration) 지원 소프트웨어
10803. 클라우드 서비스(IaaS) 관리(Cloud Management) 지원 소프트웨어
10804. 분산 캐쉬(Distributed Cache) 제공 소프트웨어
10805. 클라우드 인프라 플랫폼 소프트웨어
10806. 클라우드 확장 시스템 관리(Infrastructure Management) 소프트웨어
10807. 스토리지(Storage) 관리 소프트웨어
10808. 데스크톱 가상화(VDI) 소프트웨어
10809. 컨테이너형 애플리케이션 자동 배포 및 관리(오케스트레이션) 소프트웨어
10890. 기타
10900. 클라우드 H/W10901. 클라이언트 단말의 부품(Client Component)
10902. 클라이언트 단말(Client Devices)
10903. 클라이언트 단말용 기술 장치 및 제품(Client Platform)
10904. 클라우드 기반의 네트워크 보안 장비(Network Security Equipment)
10990. 기타
19000. 기타

 
20000. PaaS
20100. 분석(Analytics) 도구 제공 서비스
20200. 빅 데이터(Big Data as a Service) 분석 플랫폼 제공 서비스
20300. 지능형 비즈니스(Business Intelligence) 응용프로그램 개발 플랫폼 제공 서비스
20400. 임시 저장 데이터 전송 서비스(Cashing)
20500. 인지(Cognitive) 컴퓨팅 플랫폼 제공 서비스
20600. 데이터베이스(Database) 구축 지원 플랫폼 서비스
20700. 응용 프로그램 개발 및 테스트(Development & Testing) 지원 플랫폼 서비스
20800. 응용 프로그램 운영(Operation) 지원 플랫폼 서비스
20900. 범용(General Purpose) 애플리케이션 배포 관리 플랫폼 서비스
21000. 응용 프로그램 통합(Integration) 플랫폼 서비스
21100. 서버리스(Serverless) 플랫폼 서비스
21200. PaaS를 위한 클라우드 소프트웨어(S/W)21201. 애플리케이션 구성 관리 자동화(Configuration Automation) 소프트웨어
21202. 클라우드 플랫폼 통합용(Cloud Integration) 소프트웨어
21203. 클라우드 플랫폼 기반 자동화 및 관리(Cloud Management) 소프트웨어
21204. 확장형 데이터(Data) 관리 소프트웨어
21205. 대용량 데이터 처리(MapReduce) 소프트웨어
21206. 클라우드 확장성 검색(Search) 소프트웨어
21207. PaaS 구축용 소프트웨어
21290. 기타
29000. 기타

 
30000. SaaS
30100. 과금 관련((Billing : 요금청구 등) 응용프로그램 서비스
30200. 협업(Collaboration) 도구 제공 서비스
30300. 콘텐츠 관리(Content Management : 제작, 운용, 엑세스 등) 서비스
30400. 고객관계관리(CRM) 서비스
30500. 교육(Education) 콘텐츠 제공 서비스
30600. 문서관리(Document Management) 서비스
30700. 전사적 자원 관리(ERP) 서비스
30800. 금융/재무(Financials) 지원 서비스
30900. 보건/의료(Healthcare) 지원 서비스
31000. 인적자원관리(Human Resources) 서비스
31100. IT 서비스 관리(IT Services Management) 서비스
31200. 개인 사무용(Personal Productivity) 응용프로그램 서비스
31300. 프로젝트 관리(Project Management) 서비스
31400. 영업(Sales) 관리용 서비스
31500. 소셜 네트워크(Social Networks) 지원 응용프로그램 서비스
31600. SaaS를 위한 클라우드 소프트웨어(S/W)31601. 설정 자동화(Configuration Automation) 지원 소프트웨어
31602. 다중 클라우드 자동 연결 소프트웨어
31690. 기타
390000. 기타

 
40000. 클라우드 서비스 중개 및 클라우드 관리 서비스
40100. 클라우드 서비스 결합 및 관리 중개(Aggregation Broker) 서비스
40200. 클라우드 시스템 및 서비스 통합 중개(Integration Broker) 서비스
40300. 다중 클라우드 서비스 최적화 중개(Customization Broker) 서비스
40400. 클라우드 서비스 제공 정책, 등록, 시행 중개(Governance Broker) 서비스
40500. 클라우드 환경을 기반으로 제공되는 IT 운영?관리 및 유지보수 서비스
40600. 클라우드 재판매(Reseller) 서비스
49000. 기타

 
50000. 클라우드 보안 서비스
50100. 서비스형 보안(Security as a Service; SECaSS)50101. 신원 및 접근 관리(Identity and Access Management) 서비스
50102. 데이터 손실 방지(Data Loss Prevention) 서비스
50103. 웹 보안(Web Security) 서비스
50104. 전자 메일 보안(E-mail Security) 서비스
50105. 보안 평가(Security Assessments) 서비스
50106. 침입 관리(Intrusion Management) 서비스
50107. 보안 정보 및 이벤트 관리(Security Information and Event Management) 서비스
50108. 암호화(Encryption) 서비스
50109. 비즈니스 연속성 및 재해 복구(Business Continuity and Disaster Recovery) 서비스
50110. 네트워크 보안(Network Security) 서비스
50190. 기타
50200. 응용프로그램 결합 보안서비스
59000. 기타

 
90000. 기타 클라우드 서비스
90100. 클라우드 컨설팅(Cloud Consulting)
90200. 클라우드 감사(Cloud Audit)
99000. 기타