본문 바로가기

bootcamp11

[웹크롤링] 공부방법!? 1) 네이버뉴스 기사 - 제목/링크 2) 연관검색어 3) 요일별 웹툰 - 제목/작가/평점 - 과제) 장르별 웹툰 - 제목/작가/평점 4) 웹툰 썸네일 이미지 5) 네이버 증권 코스피 200 일별시세 - 날짜 등등 2022. 10. 30.
[웹크롤링] 썸네일 이미지 가져오기 이미지크롤링 HTML 안의 이미지는 없다. 이미지의 src만 있을뿐 해당 url을 리퀘츠 겟을 가지고 오면 html이 아니라 그 이미지 그 자체가 불러와 진다. 이미지 의 주소값만 있을뿐 - 1단계 : get - 이미지가 있는 페이지 가져오기 - 2단계 : select - 이미지 태그를 가져오기 - 2-1 단계 : 이미지 src값 가져오기 - 3단계 : get(이미지src) - 이미지 가져오기 2022. 10. 28.
[웹크롤링] 실습-2 href="webtoon/weekdayList?week=tue">화요웹툰 앞에 프로토콜이 없는이유는 내부로 이동하기 때문에 따로 없다. 네이버 -> 네이버 O , 네이버웹툰 -> 카카오웹툰 a_tags = soup.select(ul.category_tab a) len(a_tags) #9개 -> 요일 전체 월요 화요 ~~ 일요 매일 a_tags=a_tags[1:] 2022. 10. 28.
[웹크롤링] 실습 - 뉴스와 url 링크를 크롤링 하여 엑셀자료 만들기 1단계 2단계 데이터를 딕셔너리화 for a_tag in tags: #새로운 변수에서 tags 기존의 태그 까지 포문을 만듬 news_info['title'].append(a_tag['title']) #news_info 란 딕셔너리에 .append 한다 news_info['title'].append(a_tag['title']) 저장 실행 2022. 10. 27.