티스토리 뷰

https://www.youtube.com/watch?v=yQ20jZwDjTE 

 

52줄은 기사 갯수 인덱스 정렬 언뉴트리뷰트

그리고 타이틀은 53줄 find("a") 첫번째 a속성을 찾고 거기에 텍스트 가져와라 그리고 스트립은 필요없는 줄없에라.

54줄은 링크는 유알엘에 a태그에 herf속성이다

55,56,57은 인쇄

만약 첫번째 a가 아니었다면 두번째 a면 div.div.a 이렇게 순서 타고가야겠지? >>순서타는거 헷깔림 한번더 처음부터 들어야할듯;;

2번째 dd는 어케 퍼오는거지?

넥스트 실링?

아님

title이 <dd>6700만원<dd>

까지 햇으니 여기서 

title>dt>span> 이건가? 

 

 

https://wikidocs.net/86334

 

2.7 사이트 정보 추출하기 - beautifulsoup 사용법 (2)

# 네이버 지식인 크롤링 :: 제목 여러개 뽑기 여러개의 제목을 가져오기 위해서는 copy selector 기능만으로는 구현하기 힘들다는 것을 어느 정도 느끼셨을 겁니 ...

wikidocs.net

https://blog.naver.com/gogsally/222571201729

 

[Data Analysis] 파이썬 웹 데이터 수집 : BeautifulSoup 1

웹에서 정보 긁어오기 1.1. 웹 스크레핑(web scraping) 웹 사이트 상에서 원하는 부분에 위치한 정보를 컴...

blog.naver.com


 

 

접근방법은 2개다! 

 

그냥 유알엘에 있는건 리퀘스트로 되고 

동적인것 셀러리윰 써야됨

? 네이버 블로그 같이 유알엘이 안뜨는거건 셀러리윰 써야되나?;; 셀러이움은 동적인것인데 이건 동적도 아닌것 같은디;;

 

리스트 형태로 파인드 올은 저장됨 그래서 아래 콜론하고 [0] [1] 해주면 됨 

위에 경매 할때 이렇게 해주면 되지 않을까 싶음