1. 신뢰성 개발 프로세스

3단계 순서
1단계 : 목표설정
고객조건 및 데이터 분석, 고장 정의 및 메커니즘 규명(과거 데이터가 없는 경우 -> FMEA)
2단계 : 시험 및 개선안 도출
고장 재현, 가속 스트레스 시험, 개선안 도출
3단계 : 필드 모니터링
실제 운용 데이터 기록, 피드백 반영 및 제품 진화
2. 신뢰성 개발에서의 데이터 분석 역할
① 주요 목표
- 고장률 최소화
- 수명 최적화
- 운영 비용 절감
② 데이터 분석의 필요성
- 단순히 물리적 고장 원인 파악만으로는 부족
- 시험 데이터 + 필드 데이터 분석을 통한 개선 검증 필요
- 가속시험 정합성 검증 및 수명 예측 가능
③ 데이터 출처
- 실제 필드 데이터 (현장에서 수집)
- 실험 데이터 (시험/가속시험에서 획득)
④ 분석 활용
- 고장률 분석
- 수명 예측
- 신뢰성 모델링
⑤ 활용되는 통계 기법
- 수명분석(Weibull, Exponential 등)
- 고장률 추정 및 MTBF/MTTF 계산
- 신뢰구간 및 정합성 검증
3. 신뢰성 데이터 분석시 사용되는 핵심 통계 용어
왜 필요한가?
- 고장을 수학·통계적으로 정의해야 체계적인 분석 가능
- 수리불가능 부품: 최초 고장만 고려
- 수리가능 부품: 수리 후에도 고장이 반복 → 후속 고장과 최초 고장을 연계 분석 필요
핵심개념
- 고장(Failure): 제품·부품이 요구 기능을 수행하지 못하는 상태
- 수리 가능 여부:
- Non-repairable: 최초 고장만 분석
- Repairable: 수리 후 발생하는 반복 고장까지 고려
- 수명(Lifetime / TTF, Time to Failure): 고장 발생까지 걸린 시간
- 고장률(Failure Rate, λ): 단위 시간당 발생하는 고장 빈도
- MTTF (Mean Time To Failure): 평균 고장까지 걸리는 시간
- MTBF (Mean Time Between Failures): 평균 고장 간격 (수리가능 부품 대상)
- 수리율(Repair Rate, μ): 고장 후 수리되어 복구되는 속도

고장률은 시간의 흐름에 따라
1) 감소하는 형태(Decreasing failure rate)
2)증가하는 형태(Increasing failure rate)
3)일정 값을 유지하는 형태(Constant failure rate)의 세 유형으로 나뉨

고장데이터 종류

수명자료 분석 방법
① 모수적 방법 VS 비모수적 방법
신뢰성 수명분석 방법으로는 크게 모수적 방법과 비모수적 방법이 있습니다. 모수적 방법은 해당 데이터를 따르는 가장 유사한 분포를 선정하여 가정한 후 해당 분포의 모수를 추정하여 수명을 예측하는 방법 회귀분석이라고 생각하면 쉬움
비모수 방법이란 수명분포 F(t)가 연속이고, 몇몇 경우에만 t에 따라 증가한다는 것 외에는 어떠한 가정도 설정하지 않는 것

- 완전 고장데이터를 이용해 수명분포함수(F(t))와 신뢰도 함수(R(t))를 표현 가능
- X축: 고장 발생 시간
- Y축: 경험적 분포함수값(누적 확률)
② 경험적 분포 추정 방법
경험적 분포는 특정 분포를 가정하지 않고, 추정량(Estimator)을 통해 계산함.
주요 추정 방법:
- Kaplan–Meier 추정량: 생존함수 추정 (검열데이터 포함 가능)
- Nelson 추정량: 누적 고장률(Cumulative Hazard Function) 기반 추정
- TTT (Total Time on Test) 변환: 분포 형태(증가/감소 고장률) 직관적 확인
③ Nelson 추정 방법
- 누적 고장률 함수(H(t))와의 관계를 활용
- 그래프를 통해 고장률 추세를 파악 가능
- 고장 증가 추세 → 마모 단계
- 고장 감소 추세 → 초기 고장 단계
정리
- Kaplan–Meier: 생존 확률 추정
- Nelson: 누적 고장률 기반 → 고장률 변화 확인
- TTT: 분포 특성(증가/감소) 직관적 해석

수명분석 과정
① 데이터 전처리
정제되지 않은 데이터를 받게되면, 데이터 분석을 하기 용이하게 데이터를 바꿔야해요. 예를 들어 이상치와 결측치가 있어요. 예를들어, 누적 주행거리에 -23km 라는 값이 들어가 있으면 이상하죠? 이렇게 이론적으로 경험적으로 말이 안되는 수치를 제거해야해요. 결측치는 값 입력이 누락된 경우를 이야기해요. 빈칸으로 비워져있거나 다른 문자가 들어가 있거나 등등 다양한 경우가 존재하죠. 또 중복된 데이터가 있을 수 있는데요, 이부분도 확인해서 제거해주어야한답니다.
② 누적 주행거리 vs 사용일 수
일반적으로 자동차 부품의 고장데이터 분석시에 우리는 두개의 데이터 중 하나를 선택해야해요. 바로 누적 주행거리 기준으로 분석할지, 사용일 수 기준으로 분석할지 고민해야합니다.
부식을 예로 들어볼까요? 부식은 주행거리가 늘어날수록 더욱 진행될 수도 있지만, 차량이 움직이지 않을때도 부식은 게속 진행되죠. 이 경우에는 고장시점까지의 주행거리 데이터를 분석하는 것이 아닌 사용일수 기반으로 분석을 해야합니다. 이처럼 부품의 고장 특성을 통해 어떤 데이터로 분석해야할지 정해야 합니다.
③ 분포 선택
우리는 모수적 방법을 사용할텐데요, 아래 그림처럼 여러가지 분포들 중 하나를 선택해야 함
분포 종류에는 지수분포, 감마분포, 대수정규분포, 와이블분포 등이 있음. 각각의 분포를 데이터에 가장 적합하도록 fitting한 다음 해당 파라미터를 도출합니다. 이 파라미터를 도출하는 방법은 주로 최대우도법(MLE)를 사용하게 되는데 ⇒ 최대우도법은 다음에~ 이후, 데이터를 가장 잘 따르는 분포를 선택해야하는데요, 선택하는 방법에는 로그우도값, AIC, BIC, Anderson-Darling 값 등을 비교하여 채택하게됩니다. 로그우도값은 클수록, AIC, BIC 값은 작을수록 가장 적합한 분포인데, 아래의 통계량을 보니 Weibull 분포가 가장 적합한 것으로 확인했네요.

④ 분석 및 결과 해석
모델을 선택하고 fitting을 하면 아래와 같은 그래프를 그릴 수 있어요. 아래는 와이블분포를 가정하여 그린 그래프 인데, X축은 시간, Y축은 전체 부품중 몇 퍼센트가 고장날지를 알려주는 값이에요. 이 그래프와 값을 통해 우리는 수명예측을 할 수 있고, 와이블 분포의 형상모수 값을 통해 고장의 형태(초기,우발,마모/열화) 또한 추측할 수 있죠. 이를 통해 전체 부품 중 1%가 고장날 수 있는 시점, 10%가 고장날 수 있는 시점 등을 계산할수도 있어요.

와이블 분포 직선 변환 과정
① 기본 그래프
- S자 형태의 F(t) 곡선:
- 고장 누적 확률(Unreliability)을 시간에 따라 표현
- 원래는 비선형(곡선)

② 축 변환 아이디어
- 곡선을 직선(y=ax+b) 형태로 바꾸기 위해
- X축, Y축을 로그 스케일로 변환
- 확률지를 활용하여 직선으로 나타냄

와이블분포를 직선으로 바꾸는 이유
1) 곡선 그대로의 해석이 어렵기 때문에
- 원래의 누적분포함수(F(t))는 S자 곡선 형태
- 곡선에서 바로 모수(β, λ)를 읽어내기는 힘듦
- 따라서, 데이터를 직선화시켜서 해석을 쉽게 만듦
2) 직선으로 바꾸면 모수 추정이 쉬워짐
- 변환하면 식이 다음과 같이 1차 직선식이 됨 Y=βX+b
- 기울기(β) → 형상 모수 (Shape parameter)
- 절편(b) → 척도 모수 (Scale parameter)와 관련
👉 즉, 직선 그래프에서 선형 회귀처럼 기울기와 절편만 읽으면 모수를 바로 추정할 수 있음.