Python으로 폴더 안 PPTX 파일에서 키워드 찾고 정리하기
2025. 4. 18. 17:07ㆍ자동화 실험
반응형
반복을 없애는 첫 번째 실험: 문서 속 키워드 탐색을 자동화하다
업무의 30%는 "검색과 정리"다
보고서를 작성하거나 과거 회의 자료를 찾을 때,
우리는 흔히 수십 개의 PowerPoint 파일을 열고 닫으며
특정 키워드가 어디 있는지 직접 찾아야 하는 수고를 반복한다.
이제는 그런 일을 Python이 대신해줄 수 있다.
오늘은 폴더 안의 PPTX 파일을 자동으로 검색해서,
지정된 키워드가 몇 번째 슬라이드에 있는지 정리해주는 실험을 진행한다.
실험 목표
- ✅ 특정 키워드 목록을 정해둔다.
- ✅ 여러 PPTX 파일을 대상으로 슬라이드 내 텍스트에서 키워드 탐색
- ✅ 어느 파일의 몇 번째 슬라이드에 어떤 키워드가 있는지 정리
- ✅ 결과를 Excel 파일로 저장 (보고서 제출, 팀 공유 목적)
사용 도구
도구 | 설명 |
Python | 자동화의 중심 언어 |
python-pptx | PPTX 파일 읽기 |
openpyxl | 결과를 Excel로 저장 |
os, re | 파일 탐색 및 키워드 정규식 처리 |
실험 코드 요약
import os
import re
from pptx import Presentation
from openpyxl import Workbook
# 1. 검색 키워드 불러오기
keywords = ['SFR-001', '회의록', '자동화', '보고서']
# 2. 대상 폴더 지정
folder_path = r"C:\pptx자료"
# 3. 결과 저장용 엑셀 생성
wb = Workbook()
ws = wb.active
ws.append(['파일명', '슬라이드 번호', '키워드', '내용'])
# 4. 파일 순회 및 키워드 탐색
for filename in os.listdir(folder_path):
if filename.endswith(".pptx"):
ppt = Presentation(os.path.join(folder_path, filename))
for i, slide in enumerate(ppt.slides):
for shape in slide.shapes:
if hasattr(shape, "text"):
text = shape.text
for keyword in keywords:
if re.search(keyword, text, re.IGNORECASE):
ws.append([filename, i+1, keyword, text.strip()[:50]])
# 5. 결과 저장
wb.save("pptx_keyword_result.xlsx")
실험 결과: 사람이 30분 걸릴 걸 3초로
실제로 테스트해본 결과,
약 20개의 PPTX 파일(총 120개 슬라이드) 중
찾고자 하는 키워드들이 있는 슬라이드를 정확히 찾아내고,
엑셀에 자동 정리된 결과까지 생성되었다.
📄 결과 예시 (Excel):
파일명 | 슬라이드 번호 | 키워드 | 내용 |
회의자료1.pptx | 3 | 자동화 | …업무 자동화 도입으로 반복 업무 감소… |
제품소개.pptx | 5 | SFR-001 | …SFR-001 제품군의 개선 포인트는… |
개선 포인트
- 특정 키워드가 강조되는 색상/형식 조건도 추가 가능
- 슬라이드 이미지 썸네일 생성 및 링크 연동 실험 예정
- 키워드 자동 분류 → 태깅 시스템으로 확장 가능
이 실험이 의미 있는 이유
- 반복 작업을 코드로 바꿨다는 것 자체가 시간을 되찾은 경험이었다
- 누구나 이런 식으로 업무 속 "숨은 노가다"를 찾아서 자동화할 수 있다
- 자동화는 거창한 시스템이 아니라 작은 불편에 주목하는 것에서 시작된다
마무리하며 – 오토마스터의 실험 기록 #1
이번 실험은 단순한 텍스트 탐색을 넘어
**"업무 흐름을 분석하고 자동화 포인트를 발굴하는 과정"**이었다.
앞으로도 실제로 필요한 자동화, 즉시 쓸 수 있는 코드,
그리고 작은 성취감을 쌓아가는 실험을 공유할 예정이다.
당신의 업무에도, 지금 당장 자동화할 수 있는 반복이 있다.
코드는 나의 시간 복구 도구다.
반응형
'자동화 실험' 카테고리의 다른 글
가격 비교 크롤링 실험 – 자동화로 살펴본 진짜 최저가 찾기 (0) | 2025.04.25 |
---|---|
나만의 뉴스 큐레이터 – RSS 기반 키워드 뉴스 자동 수집 실험 (2) | 2025.04.21 |
폴더 정리 자동화 실험 – 날짜/확장자별로 깔끔하게 정리 (0) | 2025.04.20 |
업무 자동화 실험 툴 정리 - 내가 자주 쓰는 도구 7가지 (2) | 2025.04.19 |
이 블로그를 왜 시작했는가 – 자동화를 향한 작은 반란 (0) | 2025.04.18 |