인턴일기 - 13일(네이버 기사수집 DB정제, 저장코드 수정)
오늘의 업무네이버 기사수집 코드 정정 이전에 만들어뒀던 네이버 기사수집코드를 수정 해야할 이유가 생겨서 진행하게 되었다. 1. URL 기준으로 기존 DB와 중복 제거 함수 추가함수: get_existing_urls_from_db(keyword)DB에서 keyword에 해당하는 기사들의 link만 가져옴결과를 set 형태로 반환def get_existing_urls_from_db(keyword): try: query = f""" SELECT link FROM {cleaned_table_name} WHERE keyword = %(keyword)s """ df = pd.read_sql_query(query, engine, para..
2025.04.20