로그인하여 데이터 크롤링하기
- 특정한 경우, 로그인을 해서 크롤링을 해야만 하는 경우가 존재
- 예) 쇼핑몰에서 주문한 아이템 목록, 마일리지 조회 등
- 이 경우, 로그인을 자동화 하고 로그인에 사용한 세션을 유지하여 크롤링을 진행
로그인 후 데이터 크롤링 하는 방법
-
endpoint 찾기 (개발자 도구의 network를 활용)
- id와 password가 전달되는 form data찾기
- session 객체 생성하여 login 진행
- 이후 session 객체로 원하는 페이지로 이동하여 크롤링
- 강컴 닷컴
- endpoint 활용해서 url 작성 후 로그인 정보 입력
- session 생성 후 post로 값 넘겨주기
- 로그인 후 mypage에서 나의 point 얼마인지 가져오기
한빛 출판사 로그인 후 마일리지 가져오기
- 로그인 endpoint 찾기
- url 작성
- post data
- session 생성
- session post
- 로그인 후 mypage에서 마일리지 값 가져오기
'웹 크롤링 > Jupyter Notebook - 크롤링' 카테고리의 다른 글
주피터 - 웹 크롤링 - 네이버 책 검색기 (0) | 2020.06.15 |
---|---|
####주피터 실습 - 식신로드 서울지역 만점 식당 뽑아오기 (0) | 2020.06.09 |
Jupyter 웹크롤링 - Selenium / 활용해서 뉴스 크롤링& 로그인 (0) | 2020.06.08 |
주피터(웹크롤링)- header / requests / Beautiful Soup / class로 가져오기 / 속성으로 가져오기 / 텍스트 가져오기 (0) | 2020.06.03 |
[Python] Python 가상환경 생성 및 R 주피터 노트북 연결 (0) | 2020.06.02 |
댓글