2025. 4. 24. 21:23ㆍ데이터분석 인턴일기
오늘의 업무
ISO인증원 정보 수집 및 입력
컨설팅사 정보입력 시작
어제와 마찬가지로 ISO인증원 정보를 입력하는 업무를 진행하였다.
✅ ISO 관련 업무
- 이미지 및 텍스트 자료에서 ISO 인증 번호만 추출
- ISO 9001, 14001, 45001, 22000, 27001, 13485, 37001, 37301 등 다양한 인증번호를 콤마로 구분해 한 줄로 정리.
- ISO 관련 설명이나 부가내용 제거.
- 중복 ISO 번호 제거 요청 반영.
- ISO 외 다른 규격 (IATF 16949, FSSC 22000 등) 도 정리 포함.
🧾 인증기관 및 회사 소개문 정리
- 수십 개 인증기관(예: 에이스, ICR, MSR, EUROCERT 등)의 소개문에서:
- 줄바꿈 제거, 문단을 한 줄로 정리.
- 중복되는 표현 정리.
- 불필요한 강조(“감사합니다” 등) 간소화 요청 처리.
🕰️ 연혁 정리 작업
- 연혁 이미지 자료 다수에서:
- 연도별 연혁 추출 및 표로 정리
- 같은 연도 내 여러 항목은 콤마로 구분
- 특정 요청에는 초록색/회색 텍스트만 분리해서 연도별로 정리
- “큰 글씨만 연혁으로 남겨달라”는 요청도 반영.
📋 기타 정리 작업
- ISO 인증 외에도:
- 할랄, FSSC, GDPR, EN 1090, AS/EN 9100 등의 표준/인증에 대한 설명 요청 및 요약 제공.
- 정부기관/수출지원사업 등 컨설팅 수주 이력 정리.
- 인증 관련 기관별 협약 내용, 수행기관 지정 내역 등을 한 줄 또는 표 형식으로 정리.
🔠 OCR 및 이미지 텍스트 처리
- 이미지 내 텍스트를 정확하게 추출하고,
- 줄바꿈 제거
- 또는 표 형식으로 연도별 정리
- 필요에 따라 텍스트 단순화 및 병합.
단순히 회사소개, 연혁, ISO 인증 번호를 입력 하는 것 뿐이었지만 홈페이지에서 텍스트를 추출해서 수집형식에 맞게 바꾸는 작업은 생각보다 오래걸리기도하고 힘을 많이 빼고 할 수 있는 일도 아니었다.
그리고 수많은 인증원의 히스토리와 기업 소개내용을 보면서 나름대로 추려지는 특징들이 있어서 정리해보고자 한다.
✅ 1. 공통된 미션과 가치
거의 모든 인증기관이 강조하는 키워드:
- 신뢰 / 투명성 / 공정성
→ 인증기관으로서의 객관성과 공신력 확보가 필수 가치로 자리잡고 있음. - 고객 중심 / 고객 맞춤형 서비스
→ 중소기업과 스타트업 대상 인증 수요 증가에 따라 유연하고 친절한 컨설팅 제공. - 지속 가능 경영 / ESG
→ ESG, 탄소중립, 사회적 책임 등 미래지향적 가치 중심으로 확대되는 추세.
🧭 2. 주요 인증 분야별 특화
각 인증원들이 다루는 ISO 및 기타 인증 분야별 특화
| 품질/환경/안전 | ISO 9001, 14001, 45001 |
| 식품/화장품 | ISO 22000, FSSC 22000, ISO 22716, HACCP |
| 정보보안 | ISO/IEC 27001, 27701 |
| 윤리/법규 | ISO 37001(반부패), ISO 37301(컴플라이언스) |
| 에너지/지속가능성 | ISO 50001, ISO 26000, ESG, 탄소중립 |
| 의료/자동차/특수 | ISO 13485, IATF 16949, ISO 19443(원자력) |
→ 이처럼 업종/목적에 따라 다양한 인증 시스템을 갖추고 있어 기업별 맞춤 인증이 가능.
🌍 3. 글로벌 지향성 강화
- JAS-ANZ, IAS, ANAB 등 해외 인정기관 등록
- 비건, 할랄, FSSC, Kosher 등 글로벌 식품/화장품 규격 확대
- 영문 보고서, 국제심사원 배출 등 글로벌 인프라 강화
→ 인증 기관들도 이제는 국내 + 수출 기업을 동시에 대응하는 전략을 채택 중.
🔧 4. 플랫폼/디지털 기반 확대
- PAPERLESS 시스템, 빅데이터 인증 관리
- ESG 통합 플랫폼, 온라인 교육, 리스크 평가 툴 제공 등
→ 인증기관도 디지털 기반으로 진화, 효율성과 확장성 확보 중.
.
AI시대와 정보의 홍수 속에서 인증원이 사업영역 확대를 통해 더많은 일들을 하려고 하는 것이 보여진다.
또한 ESG, 환경 관련 새로운 인증들이 추가 되고 있는 경향이 보인다.
인증원 완료 후 이번에는 컨설팅사 정보를 수집하는 것을 시작하였다.
인증의 종류도 비고와 ISO인증으로 나누고 연락처 표시형식도 바꿔야해서 조금더 번거롭다.
내일부터 본격적으로 컨설팅사 정보수집 예정!
정보를 수집하면서 이슈가 있던 기업에 대해서는 따로 정리해서 공유용으로 팀장님께 제출 할 예정이다.
1. 이슈있던 기업리스트

2. 중복 등록되어있는 회사 확인 후 중복표기하기

'데이터분석 인턴일기' 카테고리의 다른 글
| 인턴일기 - 19, 20일차(World IT show) (5) | 2025.05.03 |
|---|---|
| 인턴일기 - 18일차(데이터 수집_마지막, 수집된 데이터 검토) (0) | 2025.04.24 |
| 인턴일기 - 15일차(ISO인증원 정보 수기입력) (0) | 2025.04.20 |
| 인턴일기 - 14일차(수기로 크롤링하기, 통합크롤러 코드검토) (0) | 2025.04.20 |
| 인턴일기 - 13일(네이버 기사수집 DB정제, 저장코드 수정) (0) | 2025.04.20 |