엑셀에서 인터넷 실시간 데이터(주식/게시판 등)를 읽는 방법(웹 크롤링)

인터넷상에서 자주 보는 게시판이나 주식정보를 엑셀로 불러들여 조회하면 해당 사이트를 방문하지 않아도 최신 정보를 알 수 있어 편리하다. 마치 웹 크롤링 기법과 비슷한 방법인데 그 방법을 소개하고자 한다. 따라해보면 조절이 될거야.

첫 번째 예로 영등포구청 홈페이지에 있는 온라인 설문 게시판을 엑셀에서 불러오는 방법이다. 특정 게시판의 글을 엑셀로 불러들이다

먼저 영등포구청 홈페이지를 방문하여 [구민참여>설문조사>온라인설문조사]에 접속하면 된다.

영등포구청 홈페이지 온라인 설문조사

온라인 설문조사는 게시판 형태로 영등포구청에서 시행하는 설문조사가 등록되는 곳이다.

온라인 설문지

온라인 설문 페이지가 뜨면 브라우저 상단에 기재된 인터넷 주소(URL) 전체를 복사(Ctrl+C)한다.

온라인 설문지 URL

그 후 엑셀을 실행하고 [데이터>웹] 메뉴를 클릭한다.

엑셀, 미국 마이크로소프트사에서 개발한 표 계산 소프트웨어 프로그램.

엑셀에서 [데이터] 메뉴는 다양한 DB를 연결할 수 있는 메뉴인데, 그 중 [웹]은 인터넷 상에서 화면에 표출되는 데이터를 크롤링하듯 읽을 수 있다.

데이터 > 웹 메뉴를 클릭하면

다음 할 일은 표출되는 팝업창에 복사한 URL을 붙여넣기(Ctrl+V)한 후 [확인]버튼을 클릭하는 것이다.

URL 입력 후

그러면 위 이미지에 표시한 바와 같이 좌측 영역에 [온라인 설문지 목록]으로 표출되는데, 이렇게 보이면 정상적으로 연결된 것이다. 이렇게 표시되지 않고 위쪽 행에 있는 [Document]만 표시되는 경우 실시간으로 읽을 수 없는 경우이다.[온라인 설문지 목록] 를 클릭하면 오른쪽 영역에 해당 목록이 나타난다.다음은 [로드] 버튼을 클릭한다.로드 버튼을 클릭한 후[쿼리 처리 중] 라는 팝업창이 뜨는데 사라질 때까지 기다린다. 여기서 잠깐!주식으로 성공한 사람들의 필수 공식을 알아보기 위해서는.. 대가성 광고 링크이다.에코노미 FLY 주식 리딩 기업 크로스 매칭 서비스 leaderscpa.com에코노미 FLY 주식 리딩 기업 크로스 매칭 서비스 leaderscpa.com엑셀에해당데이터를가져오는중다음에는 위 화면처럼 엑셀 시트에 데이터를 표시하기 위해 읽어오는 작업을 하는데 기다리면 된다.목록 표시기다리다 보면 위와 같이 온라인 설문조사 목록이 엑셀 시트에 표출되는 것을 볼 수 있다.복사한 URL에 헤더하는 페이지에 있던 리스트가 그대로 표시된다.릴로드위 이미지에서 리스트 영역을 마우스로 클릭하면 엑셀 상단의 메뉴 영역에 [쿼리]라는 메뉴가 생성되는데, 이를 클릭하면 [업데이트] 메뉴가 보인다. [업데이트] 메뉴를 클릭할 때마다 [온라인 설문지 목록]을 새로 불러와 표시한다. 목록만 불러오기 때문에 자세한 내용은 해당 사이트에 접속해 조회해야 한다.쿼리 및 연결 창위 화면 오른쪽에 보이는 [쿼리 및 연결]윈도우에서도 업데이트가 가능하다. 여기서 [속성]메뉴를 클릭하면 아래 팝업창이 나타난다.속성창속성창엑셀에 표출된 셀트리온 관련 주식정보실시간으로 주식 정보를 엑셀로 가져올 수 있다. 이렇게 부른 주식 정보를 응용하면 엑셀로 주식 관리를 할 때 유용하게 활용할 수 있다.엑셀에 표시된 삼성전자 주식정보나에게 필요한 주식 종목의 주가 정보를 모아 표출할 수 있고, 주식 사이트를 방문하지 않아도 조회가 가능하다.특히 회사에서 설치한 보안 프로그램이 주식 사이트를 방문할 때마다 경고 페이지가 먼저 표시돼 귀찮고 신경 쓰일 때 더욱 유용하다.네이버증권, 국내해외증시지수, 시장지표, 뉴스, 증권사리서치 등 제공 finance. naver.com방법은 상기 게시판과 같다. 예는 네이버증권에 들어가 해당 주식 정보를 불러오는 방법이다.네이버증권 셀트리온 검색결과네이버증권에서 셀트리온을 검색해보면 셀트리온 삼형제의 주가 정보가 조회된다.검색결과페이지URL마찬가지로 상기와 같은 해당 페이지의 인터넷 주소를 복사한다. 복사한 URL을 엑셀에 붙이는 방법은 상기 게시판 접속시 설명한 방법을 참조하면 된다.주식정보페이지URL부착후위와 같은 창에서 왼쪽에 [국내종목 검색결과] 텍스트를 클릭하면 오른쪽 영역에 해당종목의 주가정보가 표출된다.[로드]를 클릭하면 셀트리온 삼형제의 주식 정보가 엑셀시트에 표출될 것이다. 좀 더 응용해 보자위에서 설명한 것을 실행해 보면 알겠지만 하나의 URL 정보는 하나의 엑셀 시트에 표출된다. 즉 셀트리온 주식정보시트, 삼성 주식정보시트 이렇게 시트가 따로 구성되는 것이다.삼성과 셀트리온의 주식정보를 한 시트에 표출이와 같이 시트에 따로 표출되는 정보를 위 이미지와 같이 하나의 시트에 맞출 수 있다.추가 메뉴[쿼리 > 추가]로 할 수 있다. 추가 기능을 더 설명하는 것은 생략하지만 여기까지 따라 했다면 그 다음에 나오는 창을 보면 직관적으로 알 수 있기 때문이다.불필요한 행의 지우개또 다른 기능은 필요 없는 행을 삭제하는 것인데 엑셀 행을 그대로 삭제하는 것과는 다른 방법으로 삭제해야 한다.[쿼리 > 편집]메뉴를 통해 가능한데 이를 클릭하면 아래와 같은 편집창이 뜬다.편집창여기서 [행 삭제] 를 클릭하면 행 삭제와 관련된 창이 나타난다. (설명 생략) 최종적으로 화살표로 나타내는 메뉴이다. [닫기 및 로드] 를 클릭하면 적용된다. 어떤 URL은 엑셀에서 읽을 수 없는 경우도 있다. 이럴 땐 다른 페이지를 클릭해 읽을 수 있는 URL을 찾는 노력이 필요하다.여기까지 설명한 엑셀의 웹 크롤링 기법에 엑셀의 매크로 기능을 결합하면 매번 인터넷을 조회하고 조회한 내용을 엑셀의 특정 서식에 입력해야 하는 등의 반복적인 일들을 자동으로 해결할 수도 있습니다.여기까지 설명한 엑셀의 웹 크롤링 기법에 엑셀의 매크로 기능을 결합하면 매번 인터넷을 조회하고 조회한 내용을 엑셀의 특정 서식에 입력해야 하는 등의 반복적인 일들을 자동으로 해결할 수도 있습니다.

error: Content is protected !!