분류 전체보기 54

[혼자하는 파이썬] 파이썬으로 네이버 뉴스 검색 마스터: 검색어와 기간 설정하기

혼자한다. 아니다. 지피티와 함께 한다. 네이버 뉴스 검색을 위한 파이썬 코드 1. 검색어를 입력할 수 있다.(검색어 종료를 위해서는 end를 입력) 2. 검색 기간을 정할 수 있다. (아래 코드는 7일로 설정) 결과는 다음과 같이 나온다. 키워드를 입력하세요. 입력이 끝나면 'end'를 입력하세요. 키워드 입력: 홍길동 키워드 입력: end 키워드: 홍길동 언론사: OO일보 제목: 파이선 코드 검색..... 링크: https://www. 날짜: 5분 전 . . . . 검색 결과가 엑셀 파일로 저장되었습니다: 2024-03-08_10-05-50_주요뉴스.xlsx from selenium import webdriver from selenium.webdriver.common.keys import Keys f..

python 2024.03.08

[혼자하는 파이썬] 중기부 보도자료 파일 다운로드 크롤링

혼자한다. 아니다. 지피티와 함께 한다. 중기부 홈페이지에 있는 '보도자료' 게시판에서 첨부문서인 보도자료를 다운 받는 파이썬 코드 아래 이미지 첨부를 참고하면 된다. 한 페이지만 크롤링 가능하다. 파일을 모아놓을 별도의 폴더를 생성하게 했고, 폴더명은 코드 실행시간을 넣었다. 목록은 CSV 파일로 저장하게 했다. [20240329] 일부 수정 보도자료 파일명에 특수한 문자가 포함될 때 생기는 오류를 점검해 코드를 업데이트 했다. 아래는 코드 전문 import os import requests from bs4 import BeautifulSoup import csv from datetime import datetime def create_download_folder(): now = datetime.now..

python 2024.03.07

[혼자하는 파이썬] 금융감독원 보도자료 목록 크롤링

혼자한다. 아니다. 지피티와 함께 한다. 정부 기관들은 여러가지 오픈API를 제공한다. 아래 코드는 금융감독원의 보도자료 API를 이용해서 보도자료 목록을 엑셀로 저장하는 코드다. API 코드는 금감원 사이트에서 별도로 받아야 한다. 기간을 지정하고, API 키값을 입력하면 엑셀파일이 생성된다. import requests def crawl_bodo_info(start_date, end_date, auth_key): base_url = f"https://www.fss.or.kr/fss/kr/openApi/api/bodoInfo.jsp?apiType=json&startDate={start_date}&endDate={end_date}&authKey={auth_key}" try: response = reque..

python 2024.03.06

[혼자하는 파이썬] 네이버 뉴스 칼럼 카테고리 크롤링 코드

혼자한다. 아니다. 지피티와 함께 한다. 네이버 뉴스 카테고리에는 오피니언이 있고, 그 밑에 칼럼 카테고리가 따로 있다. 이 칼럼카데고리의 칼럼에 대한 크롤링 코드다 다른 크롤링에 비해서 별다를 건 없다. 한페이지에 다 보여지지 않으니, 셀레니움 써서 스크롤 몇번 해야 한다. [아래는 코드 전문] from selenium import webdriver from selenium.webdriver.common.keys import Keys from bs4 import BeautifulSoup import time import pandas as pd from datetime import datetime from selenium.common.exceptions import NoSuchWindowException..

python 2024.03.05