품질관리를 위한 고급 통계

카테고리 없음

품질관리를 위한 고급 통계_4회차

iron-min 2025. 12. 31. 20:45

1. 신뢰성 개발 프로세스

3단계 순서

1단계 : 목표설정

고객조건 및 데이터 분석, 고장 정의 및 메커니즘 규명(과거 데이터가 없는 경우 -> FMEA)

2단계 : 시험 및 개선안 도출

고장 재현, 가속 스트레스 시험, 개선안 도출

3단계 : 필드 모니터링

실제 운용 데이터 기록, 피드백 반영 및 제품 진화

2. 신뢰성 개발에서의 데이터 분석 역할

① 주요 목표

고장률 최소화
수명 최적화
운영 비용 절감

② 데이터 분석의 필요성

단순히 물리적 고장 원인 파악만으로는 부족
시험 데이터 + 필드 데이터 분석을 통한 개선 검증 필요
가속시험 정합성 검증 및 수명 예측 가능

③ 데이터 출처

실제 필드 데이터 (현장에서 수집)
실험 데이터 (시험/가속시험에서 획득)

④ 분석 활용

고장률 분석
수명 예측
신뢰성 모델링

⑤ 활용되는 통계 기법

수명분석(Weibull, Exponential 등)
고장률 추정 및 MTBF/MTTF 계산
신뢰구간 및 정합성 검증

3. 신뢰성 데이터 분석시 사용되는 핵심 통계 용어

왜 필요한가?

고장을 수학·통계적으로 정의해야 체계적인 분석 가능
수리불가능 부품: 최초 고장만 고려
수리가능 부품: 수리 후에도 고장이 반복 → 후속 고장과 최초 고장을 연계 분석 필요

핵심개념

고장(Failure): 제품·부품이 요구 기능을 수행하지 못하는 상태
수리 가능 여부:
- Non-repairable: 최초 고장만 분석
- Repairable: 수리 후 발생하는 반복 고장까지 고려
수명(Lifetime / TTF, Time to Failure): 고장 발생까지 걸린 시간
고장률(Failure Rate, λ): 단위 시간당 발생하는 고장 빈도
MTTF (Mean Time To Failure): 평균 고장까지 걸리는 시간
MTBF (Mean Time Between Failures): 평균 고장 간격 (수리가능 부품 대상)
수리율(Repair Rate, μ): 고장 후 수리되어 복구되는 속도

고장률은 시간의 흐름에 따라

1) 감소하는 형태(Decreasing failure rate)

2)증가하는 형태(Increasing failure rate)

3)일정 값을 유지하는 형태(Constant failure rate)의 세 유형으로 나뉨

고장데이터 종류

수명자료 분석 방법

① 모수적 방법 VS 비모수적 방법

신뢰성 수명분석 방법으로는 크게 모수적 방법과 비모수적 방법이 있습니다. 모수적 방법은 해당 데이터를 따르는 가장 유사한 분포를 선정하여 가정한 후 해당 분포의 모수를 추정하여 수명을 예측하는 방법 회귀분석이라고 생각하면 쉬움

비모수 방법이란 수명분포 F(t)가 연속이고, 몇몇 경우에만 t에 따라 증가한다는 것 외에는 어떠한 가정도 설정하지 않는 것

완전 고장데이터를 이용해 수명분포함수(F(t))와 신뢰도 함수(R(t))를 표현 가능
X축: 고장 발생 시간
Y축: 경험적 분포함수값(누적 확률)

② 경험적 분포 추정 방법

경험적 분포는 특정 분포를 가정하지 않고, 추정량(Estimator)을 통해 계산함.

주요 추정 방법:

Kaplan–Meier 추정량: 생존함수 추정 (검열데이터 포함 가능)
Nelson 추정량: 누적 고장률(Cumulative Hazard Function) 기반 추정
TTT (Total Time on Test) 변환: 분포 형태(증가/감소 고장률) 직관적 확인

③ Nelson 추정 방법

누적 고장률 함수(H(t))와의 관계를 활용
그래프를 통해 고장률 추세를 파악 가능
- 고장 증가 추세 → 마모 단계
- 고장 감소 추세 → 초기 고장 단계

정리

Kaplan–Meier: 생존 확률 추정
Nelson: 누적 고장률 기반 → 고장률 변화 확인
TTT: 분포 특성(증가/감소) 직관적 해석

수명분석 과정

① 데이터 전처리

정제되지 않은 데이터를 받게되면, 데이터 분석을 하기 용이하게 데이터를 바꿔야해요. 예를 들어 이상치와 결측치가 있어요. 예를들어, 누적 주행거리에 -23km 라는 값이 들어가 있으면 이상하죠? 이렇게 이론적으로 경험적으로 말이 안되는 수치를 제거해야해요. 결측치는 값 입력이 누락된 경우를 이야기해요. 빈칸으로 비워져있거나 다른 문자가 들어가 있거나 등등 다양한 경우가 존재하죠. 또 중복된 데이터가 있을 수 있는데요, 이부분도 확인해서 제거해주어야한답니다.

② 누적 주행거리 vs 사용일 수

일반적으로 자동차 부품의 고장데이터 분석시에 우리는 두개의 데이터 중 하나를 선택해야해요. 바로 누적 주행거리 기준으로 분석할지, 사용일 수 기준으로 분석할지 고민해야합니다.

부식을 예로 들어볼까요? 부식은 주행거리가 늘어날수록 더욱 진행될 수도 있지만, 차량이 움직이지 않을때도 부식은 게속 진행되죠. 이 경우에는 고장시점까지의 주행거리 데이터를 분석하는 것이 아닌 사용일수 기반으로 분석을 해야합니다. 이처럼 부품의 고장 특성을 통해 어떤 데이터로 분석해야할지 정해야 합니다.

③ 분포 선택

우리는 모수적 방법을 사용할텐데요, 아래 그림처럼 여러가지 분포들 중 하나를 선택해야 함

분포 종류에는 지수분포, 감마분포, 대수정규분포, 와이블분포 등이 있음. 각각의 분포를 데이터에 가장 적합하도록 fitting한 다음 해당 파라미터를 도출합니다. 이 파라미터를 도출하는 방법은 주로 최대우도법(MLE)를 사용하게 되는데 ⇒ 최대우도법은 다음에~ 이후, 데이터를 가장 잘 따르는 분포를 선택해야하는데요, 선택하는 방법에는 로그우도값, AIC, BIC, Anderson-Darling 값 등을 비교하여 채택하게됩니다. 로그우도값은 클수록, AIC, BIC 값은 작을수록 가장 적합한 분포인데, 아래의 통계량을 보니 Weibull 분포가 가장 적합한 것으로 확인했네요.

④ 분석 및 결과 해석

모델을 선택하고 fitting을 하면 아래와 같은 그래프를 그릴 수 있어요. 아래는 와이블분포를 가정하여 그린 그래프 인데, X축은 시간, Y축은 전체 부품중 몇 퍼센트가 고장날지를 알려주는 값이에요. 이 그래프와 값을 통해 우리는 수명예측을 할 수 있고, 와이블 분포의 형상모수 값을 통해 고장의 형태(초기,우발,마모/열화) 또한 추측할 수 있죠. 이를 통해 전체 부품 중 1%가 고장날 수 있는 시점, 10%가 고장날 수 있는 시점 등을 계산할수도 있어요.

와이블 분포 직선 변환 과정

① 기본 그래프

S자 형태의 F(t) 곡선:
- 고장 누적 확률(Unreliability)을 시간에 따라 표현
- 원래는 비선형(곡선)

② 축 변환 아이디어

곡선을 직선(y=ax+b) 형태로 바꾸기 위해
- X축, Y축을 로그 스케일로 변환
- 확률지를 활용하여 직선으로 나타냄

와이블분포를 직선으로 바꾸는 이유

1) 곡선 그대로의 해석이 어렵기 때문에

원래의 누적분포함수(F(t))는 S자 곡선 형태
곡선에서 바로 모수(β, λ)를 읽어내기는 힘듦
따라서, 데이터를 직선화시켜서 해석을 쉽게 만듦

2) 직선으로 바꾸면 모수 추정이 쉬워짐

변환하면 식이 다음과 같이 1차 직선식이 됨 Y=βX+b
기울기(β) → 형상 모수 (Shape parameter)
절편(b) → 척도 모수 (Scale parameter)와 관련

👉 즉, 직선 그래프에서 선형 회귀처럼 기울기와 절편만 읽으면 모수를 바로 추정할 수 있음.

현재글품질관리를 위한 고급 통계_4회차

iron-min 님의 블로그

iron-min 님의 블로그 입니다.

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

iron-min 님의 블로그