방대한 양의 데이터 집합과 이를 관리하고 분석하는 기술의 총칭

디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기도 짧고, 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다. 나아가 지금 널리 사용되고 있는 빅데이터의 의미는 엄청난 규모의 데이터 자체를 넘어 이를 관리하고 분석하기 위해 필요한 인력과 조직, 기술을 포괄하고 있다. 즉, 빅 데이터란 기존 데이터베이스 관리 도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합과 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 총칭한다. 빅데이터 환경은 과거에 비해 데이터의 양이 폭증했다는 점과 함께 데이터의 종류도 다양해져 사람들의 행동은 물론 위치정보와 SNS를 통해 생각과 의견까지 분석하고 예측할 수 있다.

디지털 경제의 확산으로 우리 주변에는 규모를 가늠할 수 없을 정도로 많은 정보와 데이터가 생산되는 '빅데이터' 환경이 도래하고 있다. 빅데이터 활용의 선두 주자는 기업이다. 특히 검색과 전자상거래 기업은 방대한 고객 데이터를 분석해 다양한 마케팅 활동을 하고 있다. 구글의 자동번역 시스템, IBM의 슈퍼컴퓨터 '왓슨', 아마존의 도서 추천 시스템은 대표적인 사례다. 공공 부문도 위험관리시스템, 탈세 등 부정행위방지, 공공데이터 공개 정책 등 빅데이터를 활용하기 위해 다양한 노력을 기울이고 있다. 특히 3월에 열린 알파고와 이세돌의 바둑대회 이후 인공지능과 빅데이터에 대한 관심이 높아지면서 정부 부처와 공공기관들이 앞다퉈 빅데이터 활용 방안 연구에 나서고 있다.

 

 관련기사로 알아보기

-디지털타임스

정부·공공기관, 알파고 이후 `빅데이터 붐`

-IT조선

KISTI, 70배 빠른 빅데이터 분석 기술 개발

저작권자 © 단비뉴스 무단전재 및 재배포 금지