[Paper] Streamable Neural Fields
Abstract
neural field → 새로운 데이터 표현 패러다임, 다양한 신호 표현에서 성공적인 퍼포먼스를 보여줬다.
본 논문에서는 다양한 width의 실행 가능한 sub network로 구성된 streamable neural network를 제안한다.
단일 네트워크를 시간에 따라 스트리밍 가능하게 하고 다양한 품질과 부분을 재구성할 수 있다.
Introduction
neural field: 입력을 공간 또는 시간 좌표로 사용하고 임의의 해상도로 신호 값을 생성하는 mlp를 사용
현재 neural field가 가지고 있는 과제:
- 신호 전송은 전체 매개 변수를 보내고 받는 방식으로 이루어지기 떄문에 지연 시간과 처리량을 줄이고 처리하는데 최적의 모델 크기를 찾는 것이 중요하다
- raw 신호는 종종 서로 다른 해상도 또는 품질로 전송되어야 한다. 이때 다른 품질을 나타내는 네트워크 여러개를 저장하는 방법은 storage공간의 낭비이다.
이를 극복하기 위해 논문에서 제안한 방법
- 훈련된 단일 네트워크를 다양한 폭의 실행 가능한 하위 네트워크로 분리할 수 있도록 하는 훈련 기술 및 구조 설계
- 각 하위 네트워크는 신호의 일부를 나타낸다
key ideas
- 여러 시각적 품질과 공간적 범위를 표현하고 스트림 라인에서 신호를 디코딩할 수 있는 단일 신경망을 제안
Method
다양한 width의 실행 가능한 sub network로 구성된 스트리밍 가능한 neural field의 훈련 기술 및 구조에 대해 설명.
훈련이 완료되면 단일 네트워크는 retraining없이 다양한 품질의 신호를 제공할 수 있다.
좁은 sub network는 저주파 신호를 보존하고 더 넓은 sub network는 고주파 세부 정보를 포함한다.
Network architecture and progressive training
- 처음은 작고 좁은 MLP로 훈련을 시작하여 결과가 수렴하면 임의의 크기만큼 폭이 증가
- 점진적 신경망 구조와 유사하게 새로 추가된 hidden unit에서 가중치를 제거하여 추가된 유닛이 소규모 유닛의 출력에 영향을 미치는 것을 방지
- 이러한 방법으로 대규모 네트워크가 소규모 네트워크에서 학습한 지식을 사용하고 소규모 네트워크가 캡쳐할 수 없는 잔여 신호만 학습하도록 장려한다
- 원하는 신호 품질 또는 공간/시간 크기가 충족될 때까지 이 프로세스를 반복한다
Progressive training vs slimmable training
- 슬림화 가능한 네트워크에서의 훈련기술 → 이미지 및 비디오 피팅 작업의 목표도 달성할 수 있다.
- 제안된 점진적 훈련과 달리 미리 정의된 폭에 걸쳐 반복하고 해당 폭의 하위 네트워크를 취한 후 목표 신호 예측을 사용하여 손실을 계산.
- 하위 네트워크의 그레디언트는 모든 폭을 방문할 떄까지 누적되고 가중치가 한번에 업데이트 된다.