본문 바로가기

IT/칼리리눅스 - 웹 해킹

(3회차) 칼리리눅스 - httrack 툴을 이용해서 홈페이지를 크롤링해보자

간단 개념

httrack 은 기본적으로 Web Scraping ( 웹 크롤링 ) 의 종류중 하나이며 웹 사이트에서 원하는 정보를 추출하는 방법이다.

링크 체크나 HTML코드 검증과 같은 웹 사이트의 자동 유지 관리 작업을 위해 사용한다고 합니다.


터미널또는 툴에 httrack 입력



미러 하겠냐고 물어봅니다 


생성된 파일확인


주소창을 확인해서 제대로 복사가 됨을 확인