Info) 아래 포스팅은 LGAimers에서 제공하는 AI 전문가 과정 중 한양대학교 배석주 교수님의 [품질과 신뢰성] 강의를 정리한 것입니다. 정리된 내용들은 강의를 토대로 작성되었으나 수강자인 저의 이해도에 따라 일부 틀린 부분이 있을 수 있다는 점 알려드립니다. 잘못된 점이 발견될 시에는 즉각 수정하도록 하겠습니다. 

1. 스마트 품질 경영

1.1 품질 4.0과 스마트 품질경영

전사적 품질관리 (Total Quality Management)는 우수한 제품 및 서비스 등을 고객에 제공하기 위해 품질에 중점을 두고 기업 전 부문의 참여를 통해 고객만족과 이익창출로 회사의 장기적인 성공에 목표를 두는 조직 전체의 체계적 노력을 말한다. 시대가 지나면서 소비자들의 요구사항은 증가하였지만 많은 기업들이 여전히 전통적인 품질 관리 경영을 고수하고 있는 상황 속에서 제품 복잡도와 다양성이 증가하게 되고 제품 수명 사이클이 짧아지게 되자 기존의 방식으로는 효과를 보기 어렵게 되었다. 이에 따라 전사적인 품질관리와 스마트 품질경영에 대한 요구가 커지고 있다.  

품질 4.0은 이러한 변화에 발맞춰 등장하게 되었는데 ICT 융합을 통해 종전의 사후검사 및 보증에서 벗어나 사전에 수집, 분석된 빅데이터를 활용하여 선제적 불량예지 및 보전 중심으로 진화된 품질경영시스템이라고 정의할 수 있다. 기존의 품질관리기법에 더해 IoT, 빅데이터 기술을 접목하여 스마트한 품질관리와 경영을 가능하게 하였다. 이러한 품질 4.0과 4차산업혁명에 등장한 신기술들이 융합되어 기존의 공장들이 스마트공장화 되어가고 있다.

1.2 품질관리 개선 영역

스마트 품질경영에서는 제품의 가치사슬의 전 영역에 대한 품질관리가 진행되는데 예방적 품질관리와 반응적 품질관리 그리고 품질관리 문화 등 품질과 관련된 모든  부분에 대한 관리 개선이 필요하다.

예방적(Preventive) 품질관리 : 단순히 제품 제조에서의 품질만이 품질관리라고 할 수 없다. 제품 설계부터 고객에게 전달되기 까지의 전 단계를 관리해야 할 필요성이 있다. 이러한 관점에 기반하여 제품 개발부터 시장 출시에 이르는 전 과정 상에서 제품의 품질을 보장하기 위해 설계된 프로세스를 예방적 품질관리라고 할 수 있다. 기존의 전통적인 제조단계에서의 품질관리를 확장하는 개념으로, 최고의 품질을 이루기 위해서는 가치사슬의 첫 단계인 개념정의 및 제품설계부터 품질관리가 시작되어야 한다는 선제적 품질 관리 영역이다. 가령, 고객의 요구사항을 들어보고 제품 설계 시에 반영하는 작업들이 예방적 품질관리에 해당한다.

 반응적(Reactive) 품질관리 : 제품 판매 이후의 품질관리를 말하며 수리 및 AS, 고장 처리 및 지속적인 개선 프로세스 등을 포괄하는 품질관리 영역이다. 이를 위해서는 현장에서 최대한 빠르고 신속한 대처가 이루어져야 하며 KPI, RFID 등 프로세스를 최적화할 필요가 있다.  

품질관리 문화 : 최고의 품질을 달성하는 것은 단순히 제조업 부서만의 임무나 책임은 아니다. 제조 파트 외에도 여러 부서간의 협업과 대화를 통한 합의를 이루어내는 것이 매우 중요하며 이를 위해 기업 내에 품질 관리에 대한 문화가 정착되어야 한다. 많은 회사에서들에서 품질 책임자가 CEO에게 직접 품질 결과를 보고할 수 있도록 하여 조직 전반에 품질 관리 문화를 정착해 나가고 있다.

1.3 품질 4.0의 구성요소

빅데이터(Volume, Variety, Velocity, Veracity) 

애널리틱스(설명적, 진단적, 예측적, 처방적(규범적)) 

연결성(제품, 설비, 프로세스와의 연결성) 

협업(소셜 미디어와 블록체인 등의 협업을 가능하게 하는 기술 활용)

1.4 빅데이터를 활용한 스마트 품질경영

복잡한 공정을 통해 생산되는 제품군, 반도체나 디스플레이 같은 경우 단순한 분석을 통해 공정의 품질상태를 파악하기 힘들기 때문에 이러한 경우 빅데이터를 활용해 분석할 수 있다. 그러나 엄청난 규모의 빅데이터를 얻게 된다하더라도 이로부터 추출한 정보가 샘플 추출에서 얻은 정보와 별반 다를게 없다면 빅데이터 분석은 의미가 없다. 빅데이터는 데이터의 규모, 속도, 정확성 및 다양성 등의 특성을 갖는데, 이 중에서 다양성이 매우 중요하다. 빅데이터 분석에 있어 데이터 확보가 관건이기 때문에 가공에 사용한 적이 없는 기계와 시스템으로부터 원천 데이터를 수집할 필요가 있다. 

빅데이터 분석은 수많은 고급 인력과 시스템을 필요로 하고 분석을 통해 얻어낸 결과가 실패할 확률이 높기 때문에 많은 비용을 초래하게 된다. 따라서 기업의 입장에서 빅데이터를 도입하는 것은 상당한 비용 감수를 요구하게 된다. 개별 기업에서 이러한 비용은 큰 부담이 될 수 있지만 복수의 기업이 함께 데이터를 확보하고 분석을 한다면 빅데이터 분석의 실패를 줄일 수 있고 많은 효과를 기대할 수 있다.  

1.5 스마트 품질경영 혁신방안

1) 실시간 커뮤니티 피드백을 제공하는 방안 :

소셜 네트워크 채널과 텍스트 마이닝 등의 애널리틱스 기술을 통해 품질과 관련된 다양한 이슈를 파악할 수 있음. 고객 관점에서의 품질 문제를 파악할 수 있다는 장점이 있음. 소셜미디어 레이더(고객 시장에서 의미 있는 패턴뿐만 아니라 정서 분석을 바탕으로 적절한 조치 방안을 모색하는 방법)을 구축할 수 있음.

2) 원격진단 및 유지보수 :

센서들을 활용하여 근본 원인분석을 수행하고 사물인터넷을 기반으로 여러 설비의 센서 피드백을 결합하여 새로운 형태의 설비데이터를 확보할 수 있음. 가령, 예측 진단 솔루션과 같이 차량 또는 설비의 상태를 모니터링하고 향후 패턴을 예측하여 이후에 발생 가능한 오작동과 고장을 사전에 파악할 수 있음. 또한, 원격 유지 보수 솔루션을 도입하여 고객이 품질 문제를 인식하기 이전에 미리 해결함으로서 서비스 품질을 크게 향상시킬 수 있음. 

3) 고도화 된 공급망 품질관리 : 공급업체 성과기록 및 과거 사고 데이터를 통해 예측을 수행하기 위해 기반 데이터를 적극적으로 취득하는 것이 중요함. 아이템 수준의 데이터 수집이 가능하다면 품질경영에 큰 이점이 될 수 있음.

1.6 실제 터치 패널 제조 공정에서 ICT 기술이 도입된 사례

공정 모니터링 시스템의 품질 예측 및 불량 요인 분석 알고리즘 개발 과정

1) 공정변수와 품질 계측지의 상관관계를 파악할 수 있는 지표 도출

- 터치 패널 공정의 공정변수(X) : 생산설비에서 Glass를 가공할 때의 조건 및 계측치(59개)

군집분석을 통해 유사 패턴을 가지는 공정변수를 제거하여 30개로 축소 가능(각 군집 내에서 변동이 가장 큰 대표 공정변수를 추출)

이후 회귀 분석의 변수 선택법을 통해 17개의 공정변수로 축소 가능(품질 계측에 영향을 주는 주요 공정변수를 추출, adjusted R^2는 0.8이상이 유지되도록 하는 동시에 RMSEP는 가능한 최소가 되도록 함)

- 품질 계측 변수(y) : 생산 공정 이후 품질 특성치(18개)

- 데이터 수(sample) : 정상(102개) / 불량(5개)

출처: 배석주 교수님 강의 자료

2) 공정변수를 통해 품질 계측지를 예측할 수 있는 가상 계측 시스템 구축(예측 모형 구축)

회귀 분석의 경우 공정 변수간 다중공선성 문제가 야기될 수 있기 때문에 주성분분석(공정변수의 정보를 주성분이라 불리는 변수로 변환)이나 부분최소제곱분석(공정변수와 품질 계측치의 정보를 잠재변수로 변환)을 이용하여 가상 계측 시스템을 구축할 수 있다. 이렇게 도출된 예측 모형을 이용하여 새로운 공정 변수값(X)에 대한 계측치(Y)를 예측할 수 있다.

가상계측을 통해서는 품질 특성치를 예측할 수 있을 뿐만 아니라 주요 공정 변수를 모니터링하여 공정의 이상 변동을 조기에 파악할 수 있다. 가령, 다변량 관리도에서 관리상한과 하한을 설정한 후 새로 들어온 데이터가 범위를 벗어나는 지 확인한다. 만약 관리 범위를 벗어난 경우에는 기여도 분석을 통해 공정 이상에 기여한 공정변수를 탐지하고 관리하여 다음 공정에서의 발생가능한 품질 문제를 예방할 수 있다. 

 

출처: 배석주 교수님 강의 자료

2. 신뢰성 개념과 중요성

2.1 신뢰성의 중요성 및 정의

품질 비용은 잠재적 위험이 되기 때문에 제품 라이프 사이클 관점에서 Total Cost의 관리는 필요하다. 개발단계에서 시장품질은 예측 가능하여야 하고 제어되어야 한다. 기업은 제품 설계 제조 과정에서는 수익을 창출할 수 없지만 제조 이후 판매 단계에서 비로소 이익을 만들 수 있다. 이때 고객 클레임이나 리콜과 같은 품질 비용이 많이 발생하게 되면 그만큼 기업이 얻을 수 있는 수익은 줄어들게 된다. 이처럼 기업은 제품의 신뢰성을 유지함으로서 가능한 많은 수익을 유지하도록 해야한다.

신뢰성은 주어진 작동 환경에서 주어진 시간 동안 시스템이 고유의 기능을 수행할 성질을 의미한다. 이를 확률로서 표현하게 되면 신뢰도가 된다. 품질과 신뢰성은 비슷하면서도 다른 의미를 가지고 있는데 우선 시간 관점에서 품질은 현시점의 제품의 특성을 나타내는 정적인 요소인 반면 신뢰성은 미래의 성능과 고장을 반영하는 동적 요소이다. 품질은 주로 생산단계에서의 관리가 필요하며 신뢰성은 초기 설계 및 개발 단계에서부터 개선/관리가 필요한 영역이다. 품질을 측정하는 척도로는 불량율, 평균, 분산이 있으며 신뢰성을 측정하는 척도로는 고장률, 수명, 신뢰도가 있다. 품질은 단기간에 측정 개선이 가능한 부분이지만 신뢰도는 장기간의 측정과 복잡한 관리 과정을 가지고 있어 기업에서는 신뢰성을 등한시하는 경향이 있다. 

2.2 신뢰성 분석의 필요성

뢰성에 영향을 주는 고장의 원인들

약한 설계 : 제품이 초기부터 취약하게 설정되었거나 설계 오류 내지 부적합한 설계로 인한 고장의 원인

과부하 : 제품이 사용되는 과정에서 설계된 강도로는 견딜 수 없을 정도의 부하가 가해지도록 하는 고장 원인

강도와 부하의 산포 : 강도가 부하보다 더 높게 설계되었다고 하더라도 생산 혹은 사용 과정에서 강도 및 부하에 산포가 발생하여 부하가 강도보다 크게 되는 고장 원인

마모 : 초기에 충분한 강도로 설계된 제품이 사용에 따라 마모되어 고장을 유발하게 되는 원인

시간 매커니즘 : 배터리의 방전, 장시간 고온 노출 및 인장 부하에 의한 변형, 전자부품 파라미터 값의 변화 등 시간의 경과에 따라 발생하는 고장 원인

잠재된 작동 : 모두 정상의 부품으로 제대로 조립된 제품이 특정 순서나 패턴으로 동작시킬 경우에만 발생하는 고장 원인

오류 : 설계 오류, 소프트웨어 코딩 오류, 조립 오류, 시험 오류, 잘못된 사용, 부적절한 유지보수 등 각종 오류에 기인한 고장 원인

2.3 신뢰성 척도 

신뢰성 문제를 체계적으로 처리하기 위해서는 시스템의 고장을 수학적으로 설명할 수 있어야 한다. 시스템은 여러개의 부품으로 구성되어 부품 고장의 모형화를 통해 시스템의 신뢰성 평가가 가능하다. 이때 고장의 발생은 불확실성을 내포하고 있기 때문에 확률변수와 분포함수 등의 확률/통계 기반으로 수명을 모형화하게 된다. 가령, 수명T의 고장 밀도함수 f(t)와 고장분포함수 F(t)는 다음과 같이 모델링할 수 있다. (수명은 부품이 작동을 시작하는 시점부터 고장이 관측될 때까지 경과한 시간으로 정의할 수 있다.

출처: 배석주 교수님 강의 자료

척도 신뢰성
신뢰도
Reliability
시스템 또는 부품이 작동을 시작해서 특정 시점 t까지 고장나지 않고 작동하고 있을 확률을 의미하며 시구간[0,t] 동안 고장나지 않을 확률로서 시간t에 대한 함수이다. 신뢰도 함수(Reliability Function)는 생물,의학분야에서 생존함수라고도 부르며 아래와 같이 정리될 수 있다. 


고장률
Failure rate
특정 시점까지 고장나지 않고 작동하던 부품이 다음 순간에 고장날 가능성이 얼마나 될 것인지 나타내는 척도로 시점 t에서 작동하는 부품이 시구간[t, t+dt]에서 고장날 확률로 정의된다. 



고장률(Failure rate)과 욕조곡선(Bath Tub Curve)

- 제품초기에는 불완전한 제조나 불충분한 품질관리로 인해 고장률이 높지만 사용하면서 고장이 시간에 따라 줄어드는 유아 고장기(infant failure period)라고 하며 SPC, Burn-in 등을 통해 대응이 가능하다
 
- 이후에는 우발 요인에 의해 고장이 발생하게 되어 고장률이 일정하게 나타나는 우발고장기(random failure period)이며 보다 충분한 안전계수를 도입하거나 derating을 통해 방지할 수 있다.

- 사용 말기에는 노화나 마모로 인해 고장률이 증가하는 마모고장기(wear failure period)이며 예방보전을 통해 고장율을 감소시킬 수 있다.

다음과 같이 시간에 따라 고장률의 변화가 욕조 모양을 보이고 있어 욕조 곡선으로 표현된다.



순간 고장율(Instantaneous Failure Rate) : 어떤 시점까지 동작하고 있는 시스템이 계속되는 단위시간 동안 고장을 일으킬 비율
평균 고장율(Average Failure Rate) : 총 동작시간 동안의 고장 개수

평균 고장시간
MTTF: Mean-Time-To-Failure
수리불가시스템(Non-Repairable System)에서 고장이 발생하기 까지의 평균시간이다.

평균 고장간격
MTBF: Mean-Time-Between-Failure
수리가능시스템(Repairable System)에서 고장간격(고장과 다음 고장 사이의 간격) 간의 평균 동작시간

평균잔여수명
MRL: Mean Residual Life
자동차, 선박, 항공기 등의 중고제품을 구입할 경우, 향후 얼마나 더 사용할 수 있는지 평가하는 척도로 이미 t시간 동안 사용된 부품이 x시간 동안 추가 사용될 수 있는 확률이다. 

보전도
Maintainability
고장난 시스템이 주어진 조건 하에서 규정된 시간 내에 수리(보전)을 완료할 확률
가용도
Availability
수리 가능한 시스템이 어떤 특정 시점에 기능을 유지하고 있을 확률

2.4 신뢰성 데이터

수명데이터 : 의도된 기능을 제대로 수행하고 있거나 고장인지의 여부로 판정하기에 이진데이터(binary) 형태를 보이며 정상 사용 조건에서 시험을 실시하면 시간이 너무 오래 걸리기 때문에 가속수명시험을 사용한다. 

성능데이터 : 최근에 제품의 수명이 길어지고 고장이 잘 나지 않는 상황이라 시간 경과에 따른 제품의 성능을 측정하여 고장이라고 생각되는 역치까지의 시간을 예측하는 시험 데이터로 연속적인 값(continuous)을 가지게 된다. 가속열화시험을 이용하여 측정한다. 

또한 신뢰성 데이터는 다음과 같이 4가지 형태를 가지게 된다. 

완전데이터 : 모든 시료가 고장날 때까지 실험을 실시하여 완전한 고장데이터를 구하는 방법

정시중단 데이터 : 특정 시간 기준을 정해놓고 그때까지의 고장 데이터와 중도절단 데이터를 기반으로 수명을 예측하는 방법 (2000시간까지 시험을 실시하여 4개의 고장 데이터, 2개의 중도 절단 데이터를 기반으로 신뢰도 예측)

정수중단 데이터 : 특정 고장 개수를 정해놓고 위와 같이 시험을 실시하는 방법(4개의 고장이 발생할 때까지의 시간을 통해 신뢰도 예측)

구간데이터 : 일정 시간마다 샘플을 체크하여 구간 내 고장 개수를 예측하여 신뢰성을 판단하는 방법(시간을 2000시간으로 고정하고 일정 간격마다 샘플을 체크하여 고장 발생 데이터를 기록하여 신뢰도를 예측)

출처: LGAimers / https://www.lgaimers.ai/

+ Recent posts