카테고리 없음

실전프로젝트 - 발표 및 피드백 정리

iron-min 2025. 12. 17. 20:47
대시보드 프로젝트 종합 피드백 정리1. 전반 평가 요약 (총평)
  • 프로젝트 완성도 매우 높음
  • 데이터 이해 → 전처리 → 구간화 → 통계 검증 → ML → 대시보드까지
  •  논리 흐름(기승전결)이 명확하게 연결된 프로젝트
  • “많은 것을 했고, 그것을 제대로 설명했다”는 점에서 우수한 사례
  • 공정 엔지니어 + QA/QC 관점이 잘 반영된 실무형 분석 프로젝트
“제가 보기에도 이 PPT는 정말 많은 것들을 했고, 완벽한 흐름으로 정리되어 있다.”
2. 가장 높게 평가받은 핵심 강점
2.1 데이터 구조에 대한 정확한 문제 인식
  • 원본 데이터가 루트(로트) 단위 시계열 데이터
  • → 단순 row 기준으로 보면 샘플 수가 매우 적어 통계적 의미가 약함
  • 이 문제를:
    • *구간 분할(segmenting)*이라는 방법으로 해결
    • 단순 증식이 아니라 공정 의미를 보존한 분할
 “데이터가 적다는 문제를 회피하지 않고, 구조적으로 해결했다”2.2 도메인 기반 구간 분할이 매우 적절함
구간을 다음과 같이 정의한 점이 높게 평가됨:
  • Ramp-up (발열 및 상승 구간)
  • Steady (실제 기계 안정 동작 구간)
  • Ramp-down (종료 및 출력 감소 구간)
이 분할은:
  • 단순 수학적 분할이 아니라
  • 실제 설비 동작 원리와 일치
  • 제조 공정 엔지니어가 봐도 납득 가능한 구조
“이건 데이터 분석의 기본인데, 전체를 보고 구간을 나눠 분석한 점이 정말 좋았다.”
2.3 구간화 이후 통계적 의미가 생겼다는 점을 명확히 증명
  • 원본 상태에서는:
    • 샘플 수 부족 → 통계 검증이 의미 없음
  • 구간 분할 이후:
    • 구간별 분포 비교
    • 시그마 기반 이상 탐지
    • 통계적 검증 가능
 ‘왜 구간을 나눴는가’에 대한 가장 설득력 있는 답변2.4 시계열 패턴을 고려한 Feature Engineering
  • 단순 평균/최대/최소가 아니라
    • 변화량(diff)
    • lag feature
    • rolling 기반 feature
  • 시계열 ML에서 중요한
    • “패턴을 어떻게 숫자로 바꿨는가”를 잘 보여줌
“시계열 패턴을 고려해서 피처를 만들었다는 점이 정말 좋았다.”
2.5 머신러닝 모델 선정의 타당성
  • 데이터 규모, 구조, 목적을 고려하여
    • 과도한 시계열 딥러닝 X
    • 설명력 + 안정성 중심 모델 선택
  • 모델 선택 과정이 합리적이고 방어 가능
 “모델 선정도 완벽했다”2.6 대시보드 관점의 명확성
  • 분석용이 아니라 의사결정용 대시보드
  • 대상:
    • 공정 엔지니어
    • QA/QC 담당자
  • 초점:
    • “지금 공정에서 뭘 조정해야 불량이 줄어드는가”
“엔지니어 기준으로, 공정을 어떻게 개선할지를 보여주는 대시보드”
3. 아쉬웠던 점 (보완 필요 포인트)
3.1 Rolling Window 설정 근거 설명 부족 (가장 중요한 피드백)
  • 가장 핵심적인 아쉬운 부분
  • 시계열 ML에서는:
    • 어떤 rolling window를 왜 썼는지가 매우 중요
문제점:
  • rolling window 크기 선택의
    • 물리적 의미
    • 공정적 의미
    • 실험적 근거
  • 이 부분이 텍스트/시각 자료로 충분히 설명되지 않음
요구된 보완 방향:
  • 왜 3인지, 5인지, 10인지
  • 공정 시간과 어떻게 대응되는지
  • window 변화에 따른 패턴 비교 시각화
“이게 설명되지 않으면, 시계열 ML로서의 완성도가 떨어진다.”
3.2 ‘최적 공정 시간’ 결론의 논리적 방향 수정 필요
  • “최적 공정 시간을 찾겠다”는 표현은
    • 현실 공정에서는 다소 위험한 표현
왜냐하면:
  • 공정은
    • 설비 스펙
    • 로트 차이
    • 투입 수량
  • 제품 특성
    •  에 따라 달라짐
권장되는 프레임:
  •  시간 자체를 맞춘다
  •  설비 기준 / 로트 기준 / 수량 기준에서
  •  시간이 어떻게 달라져야 하는지를 설명
 결론은 맞지만, 초점이 ‘시간’이 아니라 ‘기준’이어야 함3.3 Sigma 기준 선택에 대한 설명 보강 필요
현재 설명:
  • 3σ → 너무 민감하지 않음
  • 2σ + 20% 기준 → 분량 감지가 잘 됨
보완 요구:
  • SPC에서 3σ가 “절대 규칙”이 아님
  • 공정 특성에 따라 기준은 달라질 수 있음
  • 왜 이 공정에서는 이 기준이 적합한지
    • 불량 특성
    • 리스크 허용 수준
    • 알파/베타 오류 관점
3.4 Rolling Sigma vs 전체 Sigma 혼동 가능성
  • 일부 그래프가:
    • 전체 시그마인지
  • 롤링 시그마인지
    •  혼동될 수 있음
필요한 보완:
  • “이 그래프는 rolling sigma 기반”
  • “이 기준선은 전체 분포 기반”
  • 명확한 텍스트/범례/주석
3.5 Alpha / Beta 오류 설명 보강
  • 1종 오류(Alpha), 2종 오류(Beta)는
    • 항상 헷갈리는 개념
  • 현재는:
    • 그래프는 좋지만
    • 개념 설명이 부족
보완 방향:
  • 개념 정의
  • 왜 이 프로젝트에서는 이 오류를 더 중요하게 봤는지
  • 왜 sigma 기준과 연결되는지
4. 종합 결론
  • 기술적 완성도: 매우 높음
  • 도메인 이해도: 탁월
  • 논리 구조: 명확
  • 실무 활용성: 높음
보완만 된다면:
  • rolling window 근거
  • sigma 기준 철학
  • 공정 기준 프레임
 “100점짜리 프로젝트”에 도달 가능
“전반적으로는 정말 완벽했고, 몇 가지만 보완하면 흠잡을 데 없는 프로젝트다.”