Vision and Language

All Posts in Vision and Language

Unsupervised Natural Language Video Localization

Project Description ICCV 2021 Accepted as Oral Paper!! 자세한 내용을 추후 업데이트 하겠습니다. NC소프트에서 지원받아 변리사님과 함께 국내 특허를 출원하였습니다. (출원번호 10-2021-0076124) Natural Language Video Localization (NLVL)은 위의 영상과 같이 비디오와 자연어 쿼리가 주어졌을 때 비디오에서 쿼리가 가리키는 부분을 찾아내는 문제입니다. 앞선 포스트에서는 이 문제를 Fully-supervised learning을 통해 해결하였습니다. 그러나 이러한 접근법은 필연적으로 엄청난 양의 데이터를 모아야 한다는 단점이 있습니다. 특히, NLVL을 위해서는 (비디오, 자연어 쿼리, 쿼리가 가리키는 영역)의 삼중쌍을 모아야 하나, 이러한 형태의 데이터는...

Vision and Language

Jinwoo Nam's profile image

Jinwoo Nam

2021-01-10 22:00
Natural Language Video Localization

Project Description NC소프트로부터 좋은 기회를 얻어 진행하게 된 프로젝트입니다. Natural Language Video Localization (NLVL)은 위의 영상과 같이 비디오와 자연어 쿼리가 주어졌을 때 비디오에서 쿼리가 가리키는 부분을 찾아내는 문제입니다. 다시 말해, 문제의 Input과 Output은 다음과 같습니다. Input 랜덤한 길이의 비디오 비디오의 한 부분을 가리키는 자연어 문장 (e.g. “A person is sitting at a table eating a sandwich”) Output 비디오에서 자연어가 가리키는 구간 정보 (e.g. “8s~13s”) 프로젝트 목표 프로젝트는 NLVL을 위해 개발된 DiDeMo[1] 데이터셋에서 Stat-of-the-art 성능을 달성하는...

Vision and Language

Jinwoo Nam's profile image

Jinwoo Nam

2020-09-09 22:00