웹 크롤링 < 따끈따끈 시사용어 < 기사본문 - 단비뉴스

웹 크롤링

김대호 PD
입력 2021.08.29 16:20

웹페이지로부터 자동으로 데이터를 수집하는 과정

웹 크롤링(Web Crawling)이란 컴퓨터 프로그램을 통해 웹페이지로부터 자동으로 데이터를 수집하는 과정을 의미한다. 특정 웹페이지에 접근해 웹페이지의 내용물을 수집,분류,저장 후, 하이퍼링크 등을 분류 및 저장한다. 이후 같은 과정을 수없이 반복하는데, 모든 과정이 10초에서 30분 등의 일정 간격을 두고 자동으로 진행된다. 크롤링의 결과물은 엑셀 프로그램으로 읽을 수 있는 형태의 방대한 양을 자랑한다. 스파이더(spider) 등으로 불리기도 한다.

최근 여가 플랫폼 기업 '여기어때'가 경쟁업체 '야놀자'의 숙박업소 정보를 무단으로 빼돌렸다며 부정경쟁행위로 인한 10억원의 손해배상 책임이 있다는 법원의 1심 판단이 나왔다. '여기어때'는 2016년부터 크롤링 프로그램을 개발해 '야놀자' 전산 서버에 1,500만 여회 이상 접속해 대량의 정보를 무단 복제했고, 이를 영업전략 수립 등에 사용했다.

관련기사로 알아보기

-한국일보

‘야놀자’ 숙박정보 빼돌린 ‘여기어때’... 법원 “10억 배상하라”

-뉴스1

법원 "야놀자 숙박정보 빼돌린 여기어때 10억 배상 책임"

[김대호 PD]

단비뉴스 미디어콘텐츠부, 유튜브브랜딩팀 김대호입니다.
不狂不及, 미치지 않으면 미치지 못한다.

daeho1218@semyung.ac.kr

김대호 PD의 다른기사 보기

저작권자 © 단비뉴스 무단전재 및 재배포 금지

개인과 구조를 연결하는 고리를 찾아라

고슴벨을 울려라! ① 뉴닉팀

“바다에 물고기보다 플라스틱이 많아질 수도”

책 만드는 사진관, 목도사진관

10년이 지났고, 여전히 말하지 못한다

병원 떠난 전공의 빈자리 메우는 ‘PA간호사’