파이썬크롤링 2

RSS를 활용한 뉴스 기사 크롤링: 구글 시트와의 완벽한 통합

연합뉴스 정치기사 RSS로 정치뉴스 적재 코드를 만들었습니다.이 코드는 코랩에서 구글드라이브로 바로 넘어가게 돼 있어서, 관리 및 공유에 편리합니다.코드는 실행시킬때만 작동하는데, 새로운 뉴스가 기존 뉴스 상단에 배치되는 방식이니 누적으로 살펴보기 좋습니다.    효율적인 뉴스 데이터 수집: RSS와 구글 코랩의 시너지  RSS를 사용한 뉴스 기사 크롤링은 간단하면서도 효율적입니다. RSS 피드는 웹 콘텐츠를 구조화된 형식으로 제공하여 복잡한 파싱 없이도 최신 업데이트를 쉽게 추출할 수 있게 합니다. 이러한 단순성은 뉴스 기사를 지속적으로 가져오는 데 이상적입니다. 제공된 코드는 구글 콜랩에서 파이썬을 활용하여 연합뉴스의 RSS 피드에서 기사를 가져와 구글 시트 파일에 저장합니다. 이 과정은 필요한 라이..

python 2024.07.16

[혼자하는 파이썬] 구글 뉴스 검색...키워드 입력&기간 조정

혼자한다. 아니다. 지피티와 함께 한다. ***** 이번 구글 검색이 앞선 포스트의 네이버 뉴스 검색과 가장 큰 차이점은 다음과 같다. 네이버는 뉴스 검색을 했을 때 뉴스 게시 날짜를 정확하게 알 수가 없다. 검색일로부터 몇시간 전 또는 몇일 전으로만 나온다. 실제 기사의 게재시점을 정확하게 추적할 수 없었는데, 구글 뉴스 검색에서 이 부분을 해소했다. 이제 정확하게 뉴스 게시 날짜를 알 수 있게 됐다. 그리고 코랩에서 작업함으로써 결과물 저장도 로컬 PC가 아니라 구글 드라이브로 가능하게 되서 자료 공유에도 보다 손 쉬워졌다. ******** 코드 설명은 아래 참고 구글 뉴스 검색에 고급 기능이 있다. '정확한 문구' 와 날짜 기능 입력 기능이다. 아래와 같다. 여기서 [정확한 문구]에 '키워드'를 입..

python 2024.04.21