특정 홈페이지에서 본인이 찾고자 하는 자료의 위치를 확인해보도록 하자. 본인의 경우에는 [네이버 증권] - [국내 증시] - [Top 종목] 내에 있는 자료를 스크래핑할 예정이다.
본인이 사용하고자 하는 자료의 위치를 찾았다면 이제 본인이 찾고자 하는 자료가 html 상에서 어떤 태그로 감싸져 있는지 확인해야 하는데, 이는 F12(개발자 모드)에서 어렵지 않게 사용할 수 있다. ※ 크롬과 인터넷 익스플로러 모두 F12(개발자 모드)가 동작하지만, 가시성은 크롬이 훨씬 좋다.
F12를 누르면 오른쪽에 웬 영어만 한가득한 창이 뜰 것인데, 그 창의 왼쪽 상단에 보면 마우스 커서 그림이 하나 있다. 그걸 클릭한 후에 코드 한줄 한줄 마우스를 올려보면 개발자 모드에서 해당 코드가 어떤 자료들을 나타내고 있는지 알려준다. 그렇게 코드 하나 하나를 더블클릭 해가면서, 내가 사용하고자 하는 자료가 어느 위치에 있는지를 확인하면 된다.
그렇게 하나하나 눌러보다 보면, <div class="box_type_l"> 태그에 마우스를 올렸을 때 사용하고자 하는 [Top 종목] 자료의 위치가 활성화된다는 걸 확인할 수 있다.
tag 자료 불러오기
이제 사용하고자 하는 자료의 태그가 <div class="box_type_l">이라는 것을 확인했으니, 코드 내에서 이 태그 안에 있는 자료들을 불러오도록 하자. aa 라는 변수 안에 bsObj.select_one('div.box_type_l") 을 저장한 후, print(aa) 문을 통해 aa라는 변수 안에 입력된 값을 불러오는 것이다.