MJ노트-데이터과학

MJ노트-데이터과학

  • 분류 전체보기 (35)
    • 데이터분석 인턴일기 (35)
    • 데이터분석,인공지능 공부일기 (0)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

MJ노트-데이터과학

컨텐츠 검색

태그

중복기사제거 코사인유사도 네이버api크롤링 뉴스크롤링 다중웹사이트관리 2025제로인턴 문장중복제거 웹사이트크롤링 naverapi #python #크롤링 형태소분석 pgAdmin4 자카드유사도 한글문장유사도 웹사이트스크래핑 데이터분석인턴 크롤링 문장유사도 파이썬크롤링 통합크롤러 제로인턴

최근글

댓글

공지사항

아카이브

pg_dump(1)

  • 인턴일기 - 12일차(웹데이터 수집, API호출, 데이터정제 및 가공, PostgreSQL저장, pg_dump, 쿼리,Fiddler)

    📋 오늘 작업 요약🟡 1. 웹 데이터 수집 (웹 크롤링 & API 호출)Fiddler를 이용해 웹사이트 요청 분석Request Header와 API URL을 분석해서 requests 라이브러리로 자동 호출certiMst 리스트 API → seqNo로 상세 API 호출총 67페이지(=670건)의 게시글 상세 정보 수집✅ 결과: 전체 데이터를 자동으로 수집하는 Python 코드 작성 완료💼 분석 업무 분류:🔍 데이터 수집(ETL)→ 웹에서 비정형 API 데이터를 분석 목적으로 정형화🟡 2. 데이터 정제 및 가공상세 API에서 필요한 필드만 추출하는 함수 extract_data 작성결과를 리스트로 모은 후 pandas.DataFrame으로 변환열 순서 바꾸기, 인덱스 재설정, 모든 컬럼을 소문자·sn..

    2025.04.15
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바