USB 와이드 다이나믹 레인지 바이노큘러 카메라의 작동 원리와 기술적 특징은 무엇인가요?
간단히 말해, 두 개의 카메라로 구성되며, 일반적으로 사람 눈 사이 거리의 절반 간격으로 배치되어 인간의 시각을 모방합니다. 두 개의 다른 시점에서 동시에 이미지를 캡처하고 알고리즘을 사용하여 깊이 및 색상 정보가 포함된 단일 이미지로 융합함으로써 더욱 현실적인 3D 시각 효과를 얻습니다.
머신 비전, 지능형 인식, 공간 지각과 같은 분야에서 인간의 눈과 유사한 스테레오 이미징을 시뮬레이션하는 능력 덕분에 바이노큘러 카메라는 3D 공간 정보를 획득하는 핵심 장치가 되었습니다. 영롱신 지능형 2UK2 와이드 다이내믹 레인지 바이노큘러 카메라 모듈은 2메가픽셀 고화질 이미징, 90dB 와이드 다이내믹 레인지, 3축 자이로스코프, 듀얼 실리콘 마이크 등의 기능을 통합합니다. 하드웨어 협업 및 알고리즘 최적화를 통해 복잡한 시나리오에서 고정밀 인식과 안정적인 출력을 달성합니다. 본 문서는 이 모듈의 작동 원리와 기술적 특징이라는 두 가지 측면에서 체계적으로 분석할 것입니다.
I. 핵심 작동 원리
(I) 이진 입체 시각 영상 원리
2UK2는 패시브 바이노큘러 비전 기술을 사용합니다. 핵심 로직은 인간의 양안 시차 거리 측정 메커니즘을 시뮬레이션하여 듀얼 카메라를 통해 장면 이미지를 동시에 획득하고 공간 깊이 정보를 계산합니다. 하드웨어 기반은 고정된 수평 간격(베이스라인 거리)을 가진 두 개의 2메가픽셀 센서로 구성됩니다. 두 카메라는 서로 다른 관점에서 동일한 장면을 동시에 캡처하여 1920×1080 해상도의 두 이미지(좌우 채널)를 생성하고, 이를 수평으로 스티칭하여 3840×1080@30FPS의 복합 비디오 스트림을 출력합니다.
깊이 계산의 핵심은 시차 계산과 삼각 측량입니다. 시스템은 특징점 매칭 알고리즘을 사용하여 좌우 이미지에서 동일한 객체의 픽셀 위치를 찾고, 좌우 이미지 간의 시차(동일한 객체가 좌우 이미지에서 가지는 픽셀 오프셋)를 계산합니다. 듀얼 카메라의 베이스라인 거리 및 렌즈 초점 거리와 같은 알려진 매개변수를 결합하여, 시스템은 삼각 측량 공식을 사용하여 객체의 3D 좌표를 역으로 추론합니다. 시차는 거리에 반비례하며, 거리가 가까울수록 시차가 커집니다. 2메가픽셀의 고해상도와 결합하여 밀리미터 수준의 깊이 위치 정확도를 달성할 수 있습니다. 한편, 30FPS의 프레임 속도는 깊이 정보의 실시간 업데이트를 보장하여 동적 장면에서의 인식 요구를 충족합니다.
(II) 90dB 광역 동적 범위 영상 원리
Wide Dynamic Range (WDR) 기술은 밝은 부분과 어두운 부분이 모두 존재하는 장면에서 발생하는 영상 왜곡 문제를 해결하는 것을 목표로 합니다. 90dB의 동적 범위는 카메라가 가장 밝은 영역과 가장 어두운 영역 간의 조명 비율을 3162:1로 인식할 수 있음을 의미합니다 (dB = 20log(가장 밝은 조명/가장 어두운 조명)). 이는 일반적인 인간의 시야 범위를 훨씬 뛰어넘는 수준입니다. 2UK20은 센서 레벨의 다중 프레임 노출 융합 기술을 사용하여 진정한 광대역 동적 범위에 속하며, 이는 기존 디지털 광대역 동적 범위의 소프트웨어 보간 최적화와는 다릅니다.
작업 흐름은 다음과 같습니다. 센서는 동일한 장면에 대해 서로 다른 노출 시간으로 두 개(또는 그 이상)의 이미지 프레임을 신속하게 획득합니다. 한 프레임은 짧은 노출을 사용하여 밝은 영역의 디테일을 캡처하고 과다 노출을 방지합니다. 다른 프레임은 긴 노출을 사용하여 어두운 영역의 정보를 복원하고 노출 부족을 보정합니다. DSP 칩의 픽셀 수준 융합 알고리즘을 통해 두 프레임의 유효 픽셀 정보를 추출하고, 과다 노출 및 노출 부족 영역의 왜곡된 픽셀을 제거하여 최종적으로 밝은 영역과 어두운 영역 모두에서 선명한 디테일을 가진 이미지를 합성합니다. 이는 역광, 직사광선, 그림자 교차와 같은 복잡한 조명 환경에 적응할 수 있습니다.
III. 삼축 자이로스코프와 양안 시야 융합 원리
모듈에 내장된 3축 자이로스코프(IMU)는 장치의 각속도 및 선형 가속도 데이터를 시각 프레임 속도를 훨씬 초과하는 높은 빈도로 획득할 수 있습니다. 핵심 기능은 동적 장면에서 양안 시야의 단점을 보완하는 것입니다. 양안 시야 시스템은 빠르게 움직이거나, 장면 텍스처가 누락되거나, 일시적인 가려짐이 발생하는 경우 특징점 매칭 실패 및 깊이 계산 간격과 같은 문제에 취약합니다. 자이로스코프는 실시간 장치 자세 변경 데이터를 출력하여 "비전 + 관성"의 협업 보상을 달성할 수 있습니다.
데이터 융합 알고리즘을 통해 자이로스코프의 자세 데이터를 활용하여 다음 프레임의 위치 변화를 예측할 수 있으며, 이는 바이노큘러 시스템이 특징점을 빠르게 포착하고 모션 블러로 인한 영상 오류를 보정하는 데 도움을 줍니다. 동시에, 시각 정보가 일시적으로 손실될 경우 자이로스코프 데이터는 장치의 자세 추정을 유지하여 깊이 계산의 중단을 방지합니다. 이러한 융합 아키텍처는 "시각 정보로 관성 드리프트를 보정하고, 관성 정보로 시각 정보의 사각지대를 보상하는" 상호 보완적인 장점을 형성하여 동적 장면에서의 인식 안정성을 향상시킵니다.
(IV) 듀얼 실리콘 마이크 오디오 수집 및 협업 원리
내장된 듀얼 실리콘 마이크는 배열 레이아웃을 채택하여 빔포밍 기술을 활용해 방향성 사운드 픽업 및 노이즈 감소를 달성합니다. 두 개의 마이크는 동시에 사운드 신호를 획득하며, 알고리즘은 두 신호 간의 위상 및 시간 차이를 계산하여 사운드 소스 방향을 정확하게 위치시킵니다. 동시에 주변 소음에 대한 위상 취소를 수행하여 신호 반전 및 중첩을 통해 비대상 방향의 소음(예: 공기 흐름 소음 및 배경 소음)을 억제하는 동시에 대상 사운드 소스를 강화합니다.
오디오 수집 및 시각 이미징은 동기화된 오디오-비주얼 데이터 스트림을 형성합니다. 하드웨어 수준의 타이밍 보정은 소리와 이미지 프레임의 정밀한 정렬을 보장하여 오디오-비주얼 융합 분석(예: 입술 읽기, 음원 위치 추적 및 이미지 동기화)에 대한 기본 지원을 제공하며, 전통적인 별도의 오디오-비주얼 장치의 동기화 지연 문제를 피합니다.
II. 핵심 기술 특징
(I) 고화질 이미징 및 고프레임 속도 출력, 정확성과 실시간 성능의 균형
이 모듈은 듀얼 2메가픽셀 CMOS 센서를 탑재하여 채널당 1920×1080 해상도 이미지를 출력합니다. 수평 스티칭을 통해 3840×1080의 초광각 이미지를 생성하며, 이는 작은 대상의 세부 사항을 포착하기에 충분한 픽셀 밀도를 제공합니다. 센서는 1/2.9인치 센서 크기와 2.8µm의 픽셀 크기를 사용합니다. 최적화된 감광 회로와 결합하여 저조도 환경에서 신호 대 잡음비가 38dB에 도달하여, 저조도 환경에서도 이미지 선명도를 유지하고 노이즈 간섭을 줄입니다.
안정적인 30FPS 프레임 속도는 일반적인 동적 장면의 요구 사항을 완벽하게 충족합니다. 하드웨어 수준의 프레임 동기화 기술은 듀얼 카메라 획득의 타이밍 오류를 마이크로초 이내로 제어하여 프레임 비동기화로 인한 시차 계산 편차를 방지하고 깊이 측정 정확도를 위한 근본적인 보장을 제공합니다. 또한 무손실 RAW 형식 출력을 지원하여 더 많은 이미지 세부 정보를 보존하고 백엔드 알고리즘 최적화를 위한 공간을 확보합니다.
(II) 90dB 광역 동적 범위, 복잡한 조명 환경에 적응
90dB의 넓은 동적 범위는 산업용 애플리케이션에서 중간 수준입니다. 센서의 네이티브 멀티 프레임 노출 기술을 활용하여 디지털 와이드 다이내믹 레인지(dWDR)에 비해 이미지 충실도와 디테일 보존이 뛰어나며, 과도한 샤프닝이나 색상 왜곡이 없습니다. 출입 통제, 실외 감시, 차량 장착 비전 시스템과 같은 강한 조명 및 역광 시나리오에서 얼굴 특징과 배경 환경을 모두 명확하게 표현하여 "밝은 영역은 과다 노출되고 어두운 영역은 저조도"와 같은 기존 카메라의 문제점을 피할 수 있습니다.
넓은 다이나믹 레인지 알고리즘과 센서 간의 깊이 있는 협업을 통해 자동 노출 조절이 가능하며, 장면의 광도에 따라 노출 시간 조합을 동적으로 조절합니다. 직사광선(예: 한낮의 태양)부터 저조도 환경(예: 실내 야간)까지 넓은 범위의 조명 조건에 적응하여 수동 개입 없이도 선명한 이미지를 안정적으로 출력합니다.
(III) 3축 자이로스코프 퓨전으로 동적 인지 안정성 향상
3축 자이로스코프의 도입으로 모듈은 동작 자세를 감지할 수 있으며, 장치의 피치, 롤, 요 동작을 실시간으로 모니터링할 수 있습니다. 샘플링 주파수는 킬로헤르츠 수준에 도달합니다. 모바일 로봇, 휴대용 장치, 차량 장착 시나리오와 같은 동적 응용 분야에서 장치 떨림으로 인한 이미지 흐림을 효과적으로 상쇄하여, 바이너리 시스템이 움직이는 목표 추적 및 정확한 거리 측정을 달성하도록 돕습니다.
이 융합 아키텍처는 센서 계층 - 전처리 계층 - 융합 계층 - 최적화 계층의 4단계 처리 메커니즘을 사용합니다. 자이로스코프 데이터는 시각 데이터를 실시간으로 보정하는 데 사용되어 시차 계산의 동작 오류를 수정합니다. 이를 통해 빠르게 움직이거나 진동하는 환경에서도 깊이 측정 정확도 감쇠가 5% 이내로 제어되어 순수 바이너리 비전 시스템보다 훨씬 뛰어난 성능을 발휘합니다.
(IV) 다중 렌즈 적응성 확장 시나리오
해당 모듈은 기본적으로 90° 광각 렌즈를 제공하여 대부분의 일반적인 시나리오에서 요구되는 시야각 범위를 충족합니다. 또한 다양한 시야각과 왜곡 제어 수준을 갖춘 풍부한 선택의 옵션 렌즈를 제공하여 다양한 애플리케이션 시나리오에 적응할 수 있습니다. 왜곡 없는 시리즈 렌즈(45°, 60°, 89°, 100°)는 저왜곡 광학 설계를 채택하여 왜곡률을 0.5% 이내로 엄격하게 제어함으로써 이미지 기하학적 무결성을 최대한 보존합니다. 따라서 머신 비전 측정 및 고정밀 얼굴 인식과 같이 이미지 왜곡에 민감한 시나리오에 적합합니다. 120° 마이크로 왜곡 렌즈는 넓은 시야각을 유지하면서 왜곡을 최소화하여 장면 범위와 이미징 정확도의 균형을 맞추며, 전시장 및 회의실과 같은 중대형 공간의 파노라마 인지에 적합합니다. 165° 광각 렌즈는 대규모 장면 캡처를 가능하게 하여 실외 모니터링 및 대형 장소 커버리지 요구 사항에 적응합니다. 220° 글로벌 렌즈는 어안 광학 구조를 사용하여 거의 사각지대 없는 파노라마 획득을 달성합니다. AI 스티칭 알고리즘과 결합하면 밀폐된 공간에서 전체 시야각을 커버할 수 있으며, VR 시나리오, 소형 서버실 모니터링 및 기타 특수 시나리오에 적합합니다.
모든 렌즈는 M12 표준 인터페이스를 사용하여 편리한 설치 및 분해, 강력한 호환성을 제공합니다. 또한 850nm 적외선 필터와 같은 선택적 협대역 필터를 지원하여 적외선 이미징 기능을 확장하고 야간 얼굴 인식과 같은 저조도 시나리오에 적응합니다. 통합된 광학 보정 방식을 통해 어떤 렌즈를 사용하든 0.5% 미만의 낮은 왜곡 수준을 유지하여 이미지 기하학적 왜곡이 양안 시차 계산 및 깊이 측정에 미치는 영향을 효과적으로 줄입니다. 이를 통해 다양한 렌즈 구성에서 일관된 인식 정확도를 보장하고 백엔드 알고리즘 최적화를 위한 안정적인 이미지 기반을 제공합니다.
(V) 협업 오디오-비주얼 인식을 위한 이중 실리콘 마이크 오디오 통합
내장된 듀얼 실리콘 마이크는 산업 등급 노이즈 감소 솔루션을 채택하여 단일 마이크 녹음 대비 노이즈 감소 성능을 40% 이상 향상시켰습니다. 이를 통해 60dB의 소음 환경(예: 작업장 및 공공장소)에서도 사람 목소리 인식 정확도를 95% 이상 달성합니다. 동적 이득 조정 기술은 다양한 볼륨의 음원을 자동으로 적응시켜, 작은 목소리의 불분명한 녹음과 큰 목소리의 왜곡을 방지합니다.
오디오-비디오 동기화는 하드웨어 타이밍 보정을 사용하며, 지연 시간은 10ms 이내로 제어됩니다. 이를 통해 음원 위치 파악과 영상 연동이 가능합니다. 음원의 위상차를 통해 음원 위치를 파악한 후, 양안 시야와 연동하여 목표 영역에 집중하며, 지능형 모니터링 및 인간-컴퓨터 상호작용과 같이 오디오-비디오 협업 분석이 필요한 시나리오에 적합합니다.
III. 적용 시나리오 및 기술적 가치
Yinglongxin 2UK2 모듈은 넓은 동적 범위, 고정밀 깊이 인식, 시청각 협업 기능을 갖추고 있어 출입 통제 및 근태 관리 시스템, 지능형 로봇, 차량 비전, 보안 모니터링 등 다양한 분야에 폭넓게 적용 가능합니다. 출입 통제 시나리오에서는 넓은 동적 범위와 적외선 렌즈의 조합으로 역광 및 야간 환경에서의 얼굴 인식 문제를 해결할 수 있습니다. 모바일 로봇 분야에서는 자이로스코프와 바이노큘러 융합을 통해 내비게이션 및 장애물 회피 정확도를 향상시킬 수 있습니다. 차량 시나리오에서는 초광각 이미징 및 동적 보상으로 차선 인식 및 장애물 거리 측정과 같은 기능을 구현할 수 있습니다.
본 모듈의 핵심 가치는 하드웨어 기능 통합과 알고리즘의 협업 최적화를 통해 단일 비전 또는 오디오 장치의 애플리케이션 한계를 극복하는 데 있습니다. "고화질 영상 + 정밀 거리 측정 + 안정적인 자세 + 선명한 음성 수신"이라는 포괄적인 기능을 통해 복잡한 시나리오에서의 지능형 인식 요구를 충족하며, 단말 장치에 매우 신뢰할 수 있는 기반 인식 솔루션을 제공합니다.