카테고리 없음

품질관리를 위한 고급 통계_4회차

iron-min 2025. 12. 31. 20:45

1. 신뢰성 개발 프로세스

3단계 순서

1단계 : 목표설정

고객조건 및 데이터 분석, 고장 정의 및 메커니즘 규명(과거 데이터가 없는 경우 -> FMEA)

2단계 : 시험 및 개선안 도출

고장 재현, 가속 스트레스 시험, 개선안 도출

3단계 : 필드 모니터링

실제 운용 데이터 기록, 피드백 반영 및 제품 진화

 

 

2. 신뢰성 개발에서의 데이터 분석 역할

① 주요 목표

  • 고장률 최소화
  • 수명 최적화
  • 운영 비용 절감

② 데이터 분석의 필요성

  • 단순히 물리적 고장 원인 파악만으로는 부족
  • 시험 데이터 + 필드 데이터 분석을 통한 개선 검증 필요
  • 가속시험 정합성 검증수명 예측 가능

③ 데이터 출처

  • 실제 필드 데이터 (현장에서 수집)
  • 실험 데이터 (시험/가속시험에서 획득)

④ 분석 활용

  • 고장률 분석
  • 수명 예측
  • 신뢰성 모델링

⑤ 활용되는 통계 기법

  • 수명분석(Weibull, Exponential 등)
  • 고장률 추정 및 MTBF/MTTF 계산
  • 신뢰구간 및 정합성 검증

 

3. 신뢰성 데이터 분석시 사용되는 핵심 통계 용어

왜 필요한가?

  • 고장을 수학·통계적으로 정의해야 체계적인 분석 가능
  • 수리불가능 부품: 최초 고장만 고려
  • 수리가능 부품: 수리 후에도 고장이 반복 → 후속 고장과 최초 고장을 연계 분석 필요

핵심개념

  • 고장(Failure): 제품·부품이 요구 기능을 수행하지 못하는 상태
  • 수리 가능 여부:
    • Non-repairable: 최초 고장만 분석
    • Repairable: 수리 후 발생하는 반복 고장까지 고려
  • 수명(Lifetime / TTF, Time to Failure): 고장 발생까지 걸린 시간
  • 고장률(Failure Rate, λ): 단위 시간당 발생하는 고장 빈도
  • MTTF (Mean Time To Failure): 평균 고장까지 걸리는 시간
  • MTBF (Mean Time Between Failures): 평균 고장 간격 (수리가능 부품 대상)
  • 수리율(Repair Rate, μ): 고장 후 수리되어 복구되는 속도

 

고장률은 시간의 흐름에 따라

1) 감소하는 형태(Decreasing failure rate)

2)증가하는 형태(Increasing failure rate)

3)일정 값을 유지하는 형태(Constant failure rate)의 세 유형으로 나뉨

 

고장데이터 종류

 

수명자료 분석 방법

① 모수적 방법 VS 비모수적 방법

 

신뢰성 수명분석 방법으로는 크게 모수적 방법비모수적 방법이 있습니다. 모수적 방법은 해당 데이터를 따르는 가장 유사한 분포를 선정하여 가정한 후 해당 분포의 모수를 추정하여 수명을 예측하는 방법 회귀분석이라고 생각하면 쉬움

비모수 방법이란 수명분포 F(t)가 연속이고, 몇몇 경우에만 t에 따라 증가한다는 것 외에는 어떠한 가정도 설정하지 않는 것

 

  • 완전 고장데이터를 이용해 수명분포함수(F(t))와 신뢰도 함수(R(t))를 표현 가능
  • X축: 고장 발생 시간
  • Y축: 경험적 분포함수값(누적 확률)

 

② 경험적 분포 추정 방법

경험적 분포는 특정 분포를 가정하지 않고, 추정량(Estimator)을 통해 계산함.

주요 추정 방법:

  • Kaplan–Meier 추정량: 생존함수 추정 (검열데이터 포함 가능)
  • Nelson 추정량: 누적 고장률(Cumulative Hazard Function) 기반 추정
  • TTT (Total Time on Test) 변환: 분포 형태(증가/감소 고장률) 직관적 확인

 

③ Nelson 추정 방법

  • 누적 고장률 함수(H(t))와의 관계를 활용
  • 그래프를 통해 고장률 추세를 파악 가능
    • 고장 증가 추세 → 마모 단계
    • 고장 감소 추세 → 초기 고장 단계

정리

  • Kaplan–Meier: 생존 확률 추정
  • Nelson: 누적 고장률 기반 → 고장률 변화 확인
  • TTT: 분포 특성(증가/감소) 직관적 해석

 

 

 

수명분석 과정

① 데이터 전처리

정제되지 않은 데이터를 받게되면, 데이터 분석을 하기 용이하게 데이터를 바꿔야해요. 예를 들어 이상치결측치가 있어요. 예를들어, 누적 주행거리에 -23km 라는 값이 들어가 있으면 이상하죠? 이렇게 이론적으로 경험적으로 말이 안되는 수치를 제거해야해요. 결측치는 값 입력이 누락된 경우를 이야기해요. 빈칸으로 비워져있거나 다른 문자가 들어가 있거나 등등 다양한 경우가 존재하죠. 또 중복된 데이터가 있을 수 있는데요, 이부분도 확인해서 제거해주어야한답니다.

 

② 누적 주행거리 vs 사용일 수

일반적으로 자동차 부품의 고장데이터 분석시에 우리는 두개의 데이터 중 하나를 선택해야해요. 바로 누적 주행거리 기준으로 분석할지, 사용일 수 기준으로 분석할지 고민해야합니다.

부식을 예로 들어볼까요? 부식은 주행거리가 늘어날수록 더욱 진행될 수도 있지만, 차량이 움직이지 않을때도 부식은 게속 진행되죠. 이 경우에는 고장시점까지의 주행거리 데이터를 분석하는 것이 아닌 사용일수 기반으로 분석을 해야합니다. 이처럼 부품의 고장 특성을  통해 어떤 데이터로 분석해야할지 정해야 합니다.

 

③ 분포 선택

우리는 모수적 방법을 사용할텐데요, 아래 그림처럼 여러가지 분포들 중 하나를 선택해야 함

분포 종류에는 지수분포, 감마분포, 대수정규분포, 와이블분포 등이 있음. 각각의 분포를 데이터에 가장 적합하도록 fitting한 다음 해당 파라미터를 도출합니다. 이 파라미터를 도출하는 방법은 주로 최대우도법(MLE)를 사용하게 되는데 ⇒ 최대우도법은 다음에~ 이후, 데이터를 가장 잘 따르는 분포를 선택해야하는데요, 선택하는 방법에는 로그우도값, AIC, BIC, Anderson-Darling 값 등을 비교하여 채택하게됩니다. 로그우도값은 클수록, AIC, BIC 값은 작을수록 가장 적합한 분포인데, 아래의 통계량을 보니 Weibull 분포가 가장 적합한 것으로 확인했네요.

 

 

④ 분석 및 결과 해석

모델을 선택하고 fitting을 하면 아래와 같은 그래프를 그릴 수 있어요. 아래는 와이블분포를 가정하여 그린 그래프 인데, X축은 시간, Y축은 전체 부품중 몇 퍼센트가 고장날지를 알려주는 값이에요. 이 그래프와 값을 통해 우리는 수명예측을 할 수 있고, 와이블 분포의 형상모수 값을 통해 고장의 형태(초기,우발,마모/열화) 또한 추측할 수 있죠. 이를 통해 전체 부품 중 1%가 고장날 수 있는 시점, 10%가 고장날 수 있는 시점 등을 계산할수도 있어요.

 

 

와이블 분포 직선 변환 과정

① 기본 그래프

  • S자 형태의 F(t) 곡선:
    • 고장 누적 확률(Unreliability)을 시간에 따라 표현
    • 원래는 비선형(곡선)

 

② 축 변환 아이디어

  • 곡선을 직선(y=ax+b) 형태로 바꾸기 위해
    • X축, Y축을 로그 스케일로 변환
    • 확률지를 활용하여 직선으로 나타냄

 

 

와이블분포를 직선으로 바꾸는 이유

1) 곡선 그대로의 해석이 어렵기 때문에

  • 원래의 누적분포함수(F(t))는 S자 곡선 형태
  • 곡선에서 바로 모수(β, λ)를 읽어내기는 힘듦
  • 따라서, 데이터를 직선화시켜서 해석을 쉽게 만듦

2) 직선으로 바꾸면 모수 추정이 쉬워짐

  • 변환하면 식이 다음과 같이 1차 직선식이 됨 Y=βX+b
  • 기울기(β) → 형상 모수 (Shape parameter)
  • 절편(b) → 척도 모수 (Scale parameter)와 관련

👉 즉, 직선 그래프에서 선형 회귀처럼 기울기와 절편만 읽으면 모수를 바로 추정할 수 있음.