안녕하세요. 자율주행 SW 안전 전문가를 목표로 하는 플라잉 준 입니다.
오늘은 ISO26262 관련 E/E 시스템의 하드웨어 요소인 Analogue I/O 와 Digital I/O 와 관련된 안전 매커니즘 (Safety Mechanism) 및 진단 커버리지 (Diagnostic Coverage) 에 대해 정리하도록 하겠습니다.
Analogue and Digital I/O
Analogue I/O, Digital I/O 에 적용할 수 있는 안전 매커니즘을 설명하기에 앞서, 먼저 이 두 가지에 대해 설명하도록 하겠습니다.
Analogue and Digital I/O 는 위의 E/E 시스템에 있는 하드웨어 요소로 Sensor 또는 Actuator 와의 통신을 위해 사용되는 요소입니다. 이 장치는 각각 아날로그 또는 디지털 신호를 입력으로 받거나 해당 신호를 출력을 해주는 기능을 합니다.
Safety Mechanism & Diagnostic Coverage
그럼 이번 글 메인 주제인 Analogue and Digital I/O 에 적용할 수 있는 안전 매커니즘과 진단 커버리지에 대해 설명하도록 하겠습니다.
먼저 아래에서 정리하는 안전 매커니즘에 대한 진단 커버리즘은 낮음 (Low), 중간 (Meduim), 높음(High) 로 분류되며 수치로는 각각 60%, 90%, 99%의 Coverage 를 의미합니다.
적용할 수 있는 안전 매커니즘에 대해 설명하기에 앞서 Analogue and Digital I/O 에 대한 Failure mode 에 대해 정리하면 아래와 같습니다.
Hardware Element | Failure mode |
Analogue I/O | Incorrect Input Incorrect Output |
Digital I/O | Incorrect Input Incorrect Output |
위의 입력과 출력에 대한 부정확성에 따른 오류를 검출하기 위한 안전 매커니즘은 아래와 같습니다.
- Failure detection by online monitoring (Digital I/O 한정)
- Test pattern
- Code protection for digital I/O
- Multi-channel parallel output
- Monitored outputs
- Input comparison / voting (1 out of 2, 2 out of 3 또는 더 많은 리던던시)
위의 안전 매커니즘에 대한 설명은 아래와 같은 형태로 정리하도록 하겠습니다.
Safety Mechanism (Diagnostic Coverage : Coverage)
목적 :
설명 :
예제 :
참고사항 :
Failure detection by online monitoring (DC : 낮음 (low, 60%))
목적 : 온라인 상황에서 정상적인 작동에 대한 응답으로 시스템의 동작을 모니터링하여 오류를 감지하기 위함
설명 : 특정 조건에서 시스템의 시간 동작에 대한 정보를 사용하여 오류를 감지하는 매커니즘
예제
- 스위치가 정상적으로 작동되고 있는 상황에서 예상 시간에 상태가 변경되지 않으면 오류가 감지된 것입니다. 일반적으로 문제가 발생하는 특정 Element / Component 를 찾는건 불가능하다.
참고사항
- 일반적으로 online monitoring 을 구현을 위한 특정 하드웨어 요소는 없음
- 온라인 모니터링은 시스템 활성화의 특정 조건과 관련하여 시스템의 비정상적인 동작을 감지
예를 들어, 차량 속도가 0과 다를 때 특정 파라미터가 반전되면 이 파라미터와 차량 속도 사이의 일관성 감지가 고장 감지로 이어집니다.
온라인 모니터링 기법은 크게 두 가지로 구분됩니다.
- 1. 모델 기반 기법 (Model-based technique)
- State estimation, parity space, parameter identification 등의 기법을 적용하여 센서가 모니터링하는 대상에 대한 수하적 모델을 개발하여 모니터링
- 2. 모델 프리 기법 (Model-free technique)
- 대상에 대한 수학적 모델이 아닌 관찰된 결과를 기반으로 개발된 감지기를 통해 모니터링
모델 기반 기법 (Model-based technique)
모델 기반 기법의 경우는 위에서 설명한 수학적 모델에 기능적으로 중복된 값들을 입력하여 예측값 계싼, 예측값과 실제 모니터링 된 값 비교 등을 수행함으로써 오류를 감지합니다. 이는 제어 대상에 대한 이해를 바탕으로 함으로 화이트 박스 접근 (white-box approach) 로 분류되며 해당 기법을 적용할 경우 아래의 기능들이 개발되어야 합니다.
- 모델 (model): 기능적으로 중복된 입력 값들을 활용하여 예측 값을 계산
- 차이 측정 (distance measure): 예측 값과 실제 모니터링 된 센서 값과의 차이 (residual0 을 계산, 신호 상의 노이즈 등에 대한 강건한 판단을 위해 평균, 분산 등의 통계적 연산이 활용
- 오류 감지 (detecting rule): 측정된 차이를 통해 오류 여부 판정
모델 프리 기법 (Model-free technique)
모델 프리 기법의 경우의 오류 감지기는 일반적으로 휴리스틱 기반의 규칙들로 구성되거나, 인공지능 기법들인 신경망 (neural network), 패턴 분류 (pattern classification) 들이 활용됩니다. 해당 기법은 모델 기반 기법과는 다르게 제어 대상에 대한 이해 보다는 제어 대상의 외부에서 관찰된 결과에 기반함으로 블랙-박스 접근(black-box approach) 로 분류됩니다.
Test pattern
목적 : 정적 장애(stuck-at failures) 및 혼선을 감지하기 위함
설명
- 입력 및 출력 단위의 데이터 흐름에 독립적인 주기적 테스트를 진행하여 정의된 테스트 패턴을 사용하여 관측치를 예상 값과 비교하여 오류를 감지하는 매커니즘
- 테스트 커버리지는 테스트 패턴 정보, 테스트 패턴 수신 및 테스트 패턴 평가 간의 독립성 정도에 따라 다릅니다.
- 시스템의 기능적 동작은 테스트 패턴에 의해 허용할 수 없을 정도로 영향을 받지 않습니다.
Code protection for digital I/O
목적 : 입력/출력 데이터 흐름에서 random hardware failure 및 systematic failure 를 감지하기 위함
설명 :
- 정보 중복 (입력 및 출력 데이터에 특정 정보 삽입) 하거나 시간 중복 (동일한 메시지를 2번 전송) 기법을 사용하여 데이터 흐름에서 발생할 수 있는 오류를 감지하는 매커니즘
예제
- 캐리어 주파수 신호를 센서의 출력 신호에 중첩한 다음 논리 장치에서 캐리어 주파수의 존재를 확인
- 논리 장치와 최종 액추에이터 사이를 통과하는 신호의 유효성을 모니터링할 수 있도록 중복 코드 비트를 출력 채널에 추가하여 유효성 확인
Multi-channel parallel output
목적 : random hardware failure (stuck-at failures) 를 감지하기 위함 (외부 영향으로 인한 failure, 타이밍 장애, 해결 failure, 드리프트 failure 및 일시적 failure)
설명 : 다중 채널에 병렬적으로 출력되는 데이터 흐름에 관하여 외부 비교기를 통해 임의의 하드웨어 오류를 검출하는 매커니즘
Monitored outputs
목적 : 컴포넌트의 개별적인 failure 를 감지하기 위함 (외부 영향으로 인한 failure, 타이밍 failure, addressing failure, 드리프트 failure (for analogue signal) 및 일시적 failure)
설명 : 독립적인 입력이 있는 출력의 (dataflow-dependent comparision) 를 통해 정의된 허용 오차 범위(시간, 값)를 준수하는지 확인하여 오류가 있는지 검출하는 매커니즘
참고사항
- 감지된 오류가 항상 결함 있는 출력과 관련될 수는 없습니다.
Input comparison/voting (1 out of 2, 2 out of 3 or better redundancy)
목적 : 컴포넌트의 개별적인 failure 를 감지하기 위함 (외부 영향으로 인한 failure, 타이밍 failure, addressing failure, 드리프트 failure (for analogue signal) 및 일시적 failure)
설명 : 다중 채널에서 받는 독립적인 입력의 비교 (dataflow-dependent comparision) 를 통해 정의된 허용 오차 범위(시간, 값)를 준수하는지 확인하여 오류를 검출하는 매커니즘
동일한 값을 입력으로 받는 두 개 이상의 채널에서 신뢰성 높은 입력 값 (1 out of 2) 또는 다수결 원칙 (2 out of 3, 3 out of 4, m out of n)을 사용하여 다른 값을 출력하는, 즉 오류가 발생한 컴포넌트를 감지
정리
위에서 정리한 내용은 특정 도메인에서 프로젝트를 진행할 때 참고할 수 있는 내용 정도로 생각해 주시고 활용해주시면 감사하겠습니다 :)
긴글 읽어 주셔서 감사드립니다.