MJ노트-데이터과학

MJ노트-데이터과학

  • 분류 전체보기 (35)
    • 데이터분석 인턴일기 (35)
    • 데이터분석,인공지능 공부일기 (0)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

MJ노트-데이터과학

컨텐츠 검색

태그

뉴스크롤링 문장중복제거 제로인턴 중복기사제거 2025제로인턴 자카드유사도 데이터분석인턴 문장유사도 형태소분석 다중웹사이트관리 웹사이트크롤링 통합크롤러 한글문장유사도 pgAdmin4 크롤링 파이썬크롤링 네이버api크롤링 웹사이트스크래핑 naverapi #python #크롤링 코사인유사도

최근글

댓글

공지사항

아카이브

CMD(1)

  • 인턴일기 - 13일(네이버 기사수집 DB정제, 저장코드 수정)

    오늘의 업무네이버 기사수집 코드 정정 이전에 만들어뒀던 네이버 기사수집코드를 수정 해야할 이유가 생겨서 진행하게 되었다. 1. URL 기준으로 기존 DB와 중복 제거 함수 추가함수: get_existing_urls_from_db(keyword)DB에서 keyword에 해당하는 기사들의 link만 가져옴결과를 set 형태로 반환def get_existing_urls_from_db(keyword): try: query = f""" SELECT link FROM {cleaned_table_name} WHERE keyword = %(keyword)s """ df = pd.read_sql_query(query, engine, para..

    2025.04.20
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바