1. 제조업 품질 문제 근본 원인 규명 방법
1단계 : 고품 현상 구체화
문제 해결의 첫걸음은 고품의 현상을 명확히 정의하는 것입니다. 고품 현상을 구체화하면 문제를 설계, 제조, 부품의 세 가지 관점에서 효율적으로 분석할 수 있습니다.
1.1. 현상 구체화 방법
- BoB(Best of Best) vs. WoW(Worst of Worst) 비교: 정상 제품과 불량 제품 간의 작동이나 성능 차이를 비교해 문제점을 발견합니다.
- 외관 불량 트렌드 분석: 모델 또는 로트별 불량 발생률의 추이와 변동을 파악하여 문제가 꾸준히 발생하는지, 아니면 돌발적으로 발생하는지 구분합니다.
- 작동 불량의 성능 분포 확인: 단순히 작동 여부만 볼 것이 아니라, 성능 값의 분포를 분석하여 중심값에 문제가 있는지, 혹은 산포(분산)에 문제가 있는지 파악합니다.
2단계 : 주요 요인 후보 선정 및 FTA 도 작성
고품 현상을 구체화했다면, 이제 영향 요인들을 정리하고 핵심 후보들을 선별하는 과정이 필요합니다.
2.1. 요인 도출 및 선정 방법
- 영향 요인 나열: 여러 사람의 의견을 모아 고품 현상에 영향을 줄 수 있는 30~50개 정도의 요인들을 나열합니다. QC공정도나 FMEA(잠재적 고장 형태 및 영향 분석) 자료를 활용하면 도움이 됩니다.
- 주요 요인 후보 선정: 나열된 요인들에 대해 여러 사람이 중요도를 점수로 매겨 8~15개 정도의 핵심 요인 후보를 압축합니다. 기술 전문가의 자문을 받으면 정확도를 높일 수 있습니다.
- FTA(고장목 분석)도 작성: 선정된 주요 요인 후보들을 영역별(설계, 제조, 부품)로 그룹핑하여 FTA도를 작성합니다. 이를 통해 고품과 원인 간의 인과관계를 논리적으로 시각화할 수 있습니다.
3단계: 주요 요인과 고품 간의 인과관계 규명
선정된 주요 요인 후보들이 실제 고품에 영향을 미치는지 과학적으로 확인하는 단계입니다. 인과관계는 독립적으로 영향을 미치는 경우와 요인들의 조합에 의해 영향을 미치는 경우를 모두 고려해야 합니다.
3.1. 인과관계 규명 방법
- ① 3현(현장, 현물, 현실)을 통한 정상 상태 확인: 현장에 직접 방문하여 설비의 수평 상태나 설계 치수 등 주요 요인들이 기준에 맞게 적용되고 있는지 육안으로 확인합니다.
- ② 기존 자료를 활용한 데이터 분석: 설계 조건, 제조 조건 등의 기존 데이터를 수집하여 분석합니다. 상관 분석, 0-1 산점도, 짝 비교, 부품 추적 실험법 등을 활용해 인과관계를 밝힙니다. 특히 짝 비교와 부품 추적 실험법은 BoB와 WoW 데이터를 비교하는 데 효과적입니다.
- ③ 실험을 통한 영향 확인: 기존 조건이 아닌 새로운 실험을 통해 인과관계를 규명합니다. 직교 배열 실험법이나 변수 추적 실험법을 활용하여 주요 요인 후보들의 영향을 체계적으로 검증합니다.
2. FTA도
FTA(Fault Tree Analysis)는 고장 원인을 분석하는 연역적 방법으로, 품질 문제 해결에 매우 유용합니다.
① FTA도 구성 요소
- 정상사상(Top Event): 해결하고자 하는 바람직하지 못한 사건. (예: 성능 부적합)
- 중간사상(Intermediate Event): 정상사상의 하위 레벨. (예: 설계 부적합, 제조 부적합)
- 기본사상(Basic Event): 더 이상 분해할 수 없는 최소 단위의 요인. (예: 온도, RPM, 갭) 이들은 개선 대상이 됩니다.
- 논리 기호(Logic Gate): 사상 간의 관계를 나타내는 기호. 일반적으로 OR gate는 여러 원인 중 하나만 발생해도 고장이 나는 경우, AND gate는 모든 원인이 동시에 발생해야 고장이 나는 경우를 나타냅니다. 초기에는 OR gate로 시작하고, 데이터 분석을 통해 AND gate를 구분해 나가는 것이 효율적입니다.


Step 1. 정상사상(Top Event) 설정
- 분석할 재해·사고 유형을 선정한다. (위험도 고려)
- 재해발생 확률 목표값을 설정한다.
Step 2. 대상 플랜트·프로세스 특성 파악
- 분석대상 시스템·공정·작업 내용을 파악한다.
- 관련 도면·배치도·운전 지침서 등을 확보·숙지한다.
- 과거의 재해사례·통계를 폭넓게 조사한다.
- 관련 작업자 실수(Human Error)의 원인과 영향을 조사한다.
Step 3. Fault Tree(FT) 작성
- Top Event(정상사상)의 1차 원인을 분석한다.
- Top Event와 1차 원인을 논리게이트(AND/OR)로 연결한다.
- 1차 원인의 2차 원인(결함사상)을 분석한다.
- 1차·2차 원인 관계도 논리게이트로 연결한다.
- 위 과정을 더 이상 분해할 수 없는 기본사상(Basic Event)까지 반복한다.
Step 4. FT 구조 해석
- 작성된 FT를 수학적 처리(Boolean Algebra)로 간소화한다.
- 최소 컷세트(Minimal Cut Sets)·최소 패스세트(Minimal Path Sets)를 구한다.
- Top Event에 영향을 미치는 중요 중간·기본사상을 파악한다.
Step 5. FT 정량화
- 기본사상의 발생빈도·고장율·에러 데이터를 정리한다.
- 이를 이용해 중간사상·정상사상의 발생확률을 계산한다.
- 계산 결과를 과거 재해 발생률과 비교하고 큰 차이가 있으면 FT를 재검토한다.
Step 6. 해석 결과 평가
- 재해 발생 확률이 허용 위험수준을 초과할 경우, 이를 감소시키기 위한 대책을 수립한다.

② FTA도 활용의 이점
- 논리적 문제 해결 문화 구축: 고품의 인과관계를 논리적으로 전개하여 팀원 간의 소통을 원활하게 만듭니다.
- 영향 구분: 요인의 독립적인 영향과 조합에 의한 영향을 명확히 구분할 수 있습니다.
- 전체 파악 용이: 고품 발생, 핵심 원인, 해결책을 한눈에 파악하여 문제 해결의 전체 로드맵을 제공합니다.

3. AQL (합격 품질 한계)
AQL은 합격 품질 한계(Acceptable Quality Limit)의 약자로, ISO 2859-1 표준에 따라 정의된 최소한의 허용 가능한 품질 수준을 의미합니다. 이는 대량 생산된 제품의 품질 검사 시, 무작위로 추출한 샘플에서 허용되는 최대 불량품 수를 나타냅니다.
① AQL의 주요 특징
- 통계적 품질 관리: 전체 생산 로트의 품질을 100% 전수 검사하지 않고, 소수의 샘플만 검사하여 전체 로트의 합격/불합격 여부를 결정하는 통계적 방법입니다.
- 백분율 또는 비율로 표시: 일반적으로 전체 수량 대비 결함 수의 비율(%)로 표현됩니다.
- 산업별 차이: 제품의 용도와 산업에 따라 AQL 수준이 달라집니다. 특히 의료 제품과 같이 안전과 직결된 분야는 매우 엄격한 AQL 기준을 적용합니다.
② 결함의 세 가지 수준
AQL은 결함의 심각도에 따라 세 가지 범주로 분류하여 관리합니다.
- 치명적 결함 (Critical Defects):
- 정의: 사용자의 안전에 직접적인 위험을 초래하거나, 법적 규제를 위반하는 심각한 결함.
- 예시: 전기 제품의 감전 위험, 유해 물질 누출 등.
- 주요 결함 (Major Defects):
- 정의: 제품의 기능이나 성능에 영향을 주어 사용이 불가능하거나 심각하게 불편한 결함.
- 예시: 작동 불능, 주요 기능 오류, 눈에 띄는 큰 스크래치 등.
- 사소한 결함 (Minor Defects):
- 정의: 제품의 기능에는 영향을 주지 않지만, 소비자의 만족도를 떨어뜨릴 수 있는 미미한 결함.
- 예시: 작은 흠집, 색상 불일치, 마감 처리 불량 등.
③ AQL 계산 방법
AQL은 두 개의 특정 테이블을 사용하여 계산합니다. 이 두 테이블은 검사에 필요한 샘플 크기와 해당 샘플에서 허용 가능한 결함의 개수를 결정하는 데 사용됩니다.
- 첫 번째 테이블: 로트 크기(전체 생산 수량)를 기반으로 검사 수준에 맞는 샘플 크기를 결정합니다.
- 두 번째 테이블: 선택된 샘플 크기와 AQL 값(예: 2.5%)을 기준으로, 허용 가능한 불량품의 수를 결정합니다. 샘플 내 불량품 수가 이 허용치를 초과하면 해당 로트는 불합격 처리됩니다.

AQL 샘플 문자표 (Table 1) 설명
- AQL 샘플 문자표(Table 1)는 품질 검사를 위해 "얼마나 많은 제품을 샘플로 뽑아야 하는지"를 알려주는 표입니다.
이 표를 사용하는 순서는 다음과 같습니다.
- 전체 물량(Lot size) 확인: 검사할 제품의 총 수량이 몇 개인지 확인합니다.
- 검사 수준 선택: 일반적인 검사를 할지, 더 엄격하거나 덜 엄격한 검사를 할지 결정합니다.
이 두 가지 정보를 표에서 찾으면, 해당 칸에 적혀 있는 '알파벳'이 바로 샘플 크기를 나타내는 코드(샘플 문자)입니다.
④ 핵심 용어 및 개념
- Lot or batch size (로트 크기): 한 번에 검사할 제품의 총 수량입니다. 표의 가장 왼쪽 세로줄에 구간별로 표시되어 있습니다.
- 예시: 510개짜리 제품을 검사한다면, '501 to 1200' 구간에 해당합니다.
- Inspection levels (검사 수준): 검사를 얼마나 꼼꼼하게 할지 정하는 기준입니다.
- 보통 검사 수준 (General Inspection Levels): I, II, III
- 일반적으로 II 수준을 가장 많이 사용합니다. I은 조금 덜 엄격하고, III는 가장 엄격한 검사 수준입니다.
- 특별 검사 수준 (Special Inspection Levels): S-1, S-2, S-3, S-4
- 일반적으로 제품 파손 위험이 크거나, 검사 비용이 매우 높은 경우에 사용됩니다. S-4가 가장 엄격한 수준입니다.
- 보통 검사 수준 (General Inspection Levels): I, II, III
4. 제품 신뢰성 척도
① MTBF (평균 고장 간격)
MTBF는 수리 가능한 시스템이 고장 없이 작동하는 평균 시간을 나타냅니다. 이는 시스템의 안정성을 측정하는 중요한 지표로, 고장 간 발생 시간의 평균값을 계산하여 시스템이 얼마나 자주 고장나는지를 평가합니다.
MTBF 공식:
- 예를 들어, 시스템이 1,000시간 동안 5번 고장이 발생했다면:
- MTBF = 총 가동 시간 / 고장 횟수 = 1,000시간 / 5 = 200시간
② MTTF (평균 고장 시간)
MTTF는 수리 불가능한 시스템이 고장나기까지의 평균 시간을 의미합니다. 이 값은 일반적으로 시스템의 수명을 예측하는 데 사용됩니다.
MTTF 공식:
- 예를 들어, 10개의 전구가 각각 1,000시간 동안 사용된 후 고장난다면:
- MTTF = 총 가동 시간 / 고장 횟수 = (10 x 1,000시간) / 10 = 1,000시간
③ MTTR (평균 수리 시간)
MTTR은 시스템이 고장난 후 수리 완료까지 소요되는 평균 시간을 의미합니다. MTTR 값은 유지보수 작업의 효율성을 평가하는 지표로 사용됩니다.
MTTR 공식:
- 예를 들어, 5번의 수리 작업에 총 10시간이 소요되었다면:
- MTTR = 총 수리 시간 / 수리 횟수 = 10시간 / 5 = 2시간
④ 가용성
가용성은 시스템이 필요할 때 정상적으로 작동할 확률을 의미하며, MTBF와 MTTR을 결합하여 계산할 수 있습니다.
가용성 공식:
- 가용성 = MTBF / (MTBF + MTTR)
- 예를 들어, MTBF가 200시간이고 MTTR이 4시간인 경우:
- 가용성 = 200 / (200 + 4) ≈ 98.04%
5. 욕조곡선
욕조 곡선 (Bathtub Curve) 개념
- 욕조 곡선(Bathtub Curve)은 제품의 수명 주기 동안 고장률(Failure Rate)이 시간에 따라 어떻게 변하는지를 보여주는 그래프입니다. 그래프의 모양이 마치 욕조를 옆에서 본 것처럼 생겼기 때문에 이러한 이름이 붙었습니다.
이 곡선은 크게 세 가지 기간으로 나뉘며, 각 기간별로 고장의 원인과 특징이 다릅니다.

① 초기 고장 기간 (Early-Failure Period)
- 특징: 제품 사용 초기, 고장률이 높은 상태에서 급격히 감소하는 기간입니다.
- 고장 원인:
- 제조 결함: 조립 불량, 품질이 낮은 부품 사용 등 제조 공정에서 발생한 문제.
- 설계 문제: 제품 설계 자체에 내재된 결함.
- 초기 스트레스: 사용 초기에 제품이 받는 예상치 못한 스트레스.
- 관리 방안: 이 기간의 고장을 줄이기 위해 초기 가동 검사(Burn-in Test)나 철저한 품질 관리를 통해 잠재적 결함이 있는 제품을 미리 걸러내는 것이 중요합니다.
② 우발 고장 기간 (Useful-Life Period)
- 특징: 고장률이 낮고 안정적으로 유지되는 기간입니다.
- 고장 원인:
- 우발적 요인: 외부 충격, 예상치 못한 환경 변화, 사용자의 실수 등 예측하기 어려운 원인으로 인해 발생합니다.
- 관리 방안: 이 기간에는 고장률이 낮으므로, 제품의 신뢰성을 유지하기 위해 정기적인 예방 정비나 사용자 교육이 중요합니다.
③ 마모 고장 기간 (Wear-Out Period)
- 특징: 제품의 수명이 다해가면서 고장률이 급격하게 증가하는 기간입니다.
- 고장 원인:
- 노화 및 마모: 부품의 자연적인 노후화, 피로, 마모 등으로 인해 발생합니다.
- 관리 방안: 이 기간의 고장은 자연스러운 현상이므로, 부품 교체나 재정비를 통해 제품의 수명을 연장하거나, 새로운 제품으로 교체하는 것을 고려해야 합니다.
6. 와이블 분포 (Weibull Distribution)
- 와이블 분포(Weibull Distribution)는 고장률이 일정하지 않은 상황까지 모두 모델링할 수 있는 매우 유연한 확률 분포입니다. 이 분포는 욕조 곡선의 세 가지 단계, 즉 초기 고장, 우발 고장, 마모 고장을 모두 설명할 수 있습니다.

와이블 분포의 핵심: 형상 매개변수 (β)
와이블 분포는 형상 매개변수(β, Beta) 값에 따라 곡선의 모양이 달라집니다. 이 β 값이 고장 메커니즘을 나타내며, 고장률의 변화 추이를 설명해 줍니다.
- β < 1 (예: β = 0.85):
- 고장률 감소: 시간이 지남에 따라 고장률이 감소하는 형태입니다.
- 해당 기간: 주로 욕조 곡선의 초기 고장 기간에 해당됩니다. 이는 제품 사용 초기에 제조 결함이나 초기 스트레스 등으로 고장이 많이 발생하다가, 시간이 지나면서 불량품이 걸러져 고장률이 낮아지는 현상을 나타냅니다.
- β = 1:
- 고장률 일정: 고장률이 일정하게 유지되는 형태입니다.
- 해당 기간: 욕조 곡선의 우발 고장 기간에 해당됩니다. 이는 외부 충격이나 예측 불가능한 우연한 사건에 의해 고장이 발생하는 것을 나타냅니다. (이 경우, 와이블 분포는 지수분포와 동일해집니다.)
- β > 1 (예: β = 2, β = 3.5):
- 고장률 증가: 시간이 지남에 따라 고장률이 증가하는 형태입니다.
- 해당 기간: 욕조 곡선의 마모 고장 기간에 해당됩니다. 이는 제품 부품이 노후화되거나 마모되면서 고장 발생률이 점점 높아지는 현상을 나타냅니다.
와이블 분포의 활용
와이블 분포는 제품 수명 분석과 신뢰성 예측에 폭넓게 사용됩니다. β 값을 분석하면 해당 제품이 현재 어떤 고장 단계에 있는지 파악할 수 있으며, 이를 통해 예방 정비 계획을 수립하거나 제품 수명을 예측하는 데 활용할 수 있습니다.