ICCV 2017论文列表 - IEEE International Conference on Computer Vision, ICCV 2017, Venice, Italy, October 22-29, 2017.| 数据学习 (DataLearner)

iccv 2017 论文列表

IEEE International Conference on Computer Vision, ICCV 2017, Venice, Italy, October 22-29, 2017.

Unsupervised Domain Adaptation for Face Recognition in Unlabeled Videos.

Kihyuk Sohn Sifei Liu Guangyu Zhong Xiang Yu Ming-Hsuan Yang Manmohan Chandraker

StackGAN: Text to Photo-Realistic Image Synthesis with Stacked Generative Adversarial Networks.

Han Zhang Tao Xu Hongsheng Li

Representation Learning by Learning to Count.

Mehdi Noroozi Hamed Pirsiavash Paolo Favaro

One Network to Solve Them All - Solving Linear Inverse Problems Using Deep Projection Models.

Jen-Hao Rick Chang Chun-Liang Li Barnabás Póczos B. V. K. Vijaya Kumar

Deep Adaptive Image Clustering.

Jianlong Chang Lingfeng Wang Gaofeng Meng Shiming Xiang Chunhong Pan

Scale Recovery for Monocular Visual Odometry Using Depth Estimated with Deep Convolutional Neural Fields.

Xiaochuan Yin Xiangwei Wang Xiaoguo Du Qijun Chen

Semi-Global Weighted Least Squares in Image Filtering.

Wei Liu Xiaogang Chen Chunhua Shen Zhi Liu Jie Yang

GPLAC: Generalizing Vision-Based Robotic Skills Using Weakly Labeled Images.

Avi Singh Larry Yang Sergey Levine

The "Something Something" Video Database for Learning and Evaluating Visual Common Sense.

Raghav Goyal Samira Ebrahimi Kahou Vincent Michalski Joanna Materzynska Susanne Westphal Heuna Kim Valentin Haenel Ingo Fründ Peter Yianilos Moritz Mueller-Freitag Florian Hoppe Christian Thurau Ingo Bax Roland Memisevic

Learning Action Recognition Model from Depth and Skeleton Videos.

Hossein Rahmani Mohammed Bennamoun

Tube Convolutional Neural Network (T-CNN) for Action Detection in Videos.

Rui Hou Chen Chen Mubarak Shah

TORNADO: A Spatio-Temporal Convolutional Regression Network for Video Action Proposal.

Hongyuan Zhu Romain Vial Shijian Lu

Localizing Moments in Video with Natural Language.

Lisa Anne Hendricks Oliver Wang Eli Shechtman Josef Sivic Trevor Darrell Bryan C. Russell

R-C3D: Region Convolutional 3D Network for Temporal Activity Detection.

Huijuan Xu Abir Das Kate Saenko

Joint Prediction of Activity Labels and Starting Times in Untrimmed Videos.

Tahmida Mahmud Mahmudul Hasan Amit K. Roy-Chowdhury

Adversarial Examples Detection in Deep Networks with Convolutional Filter Statistics.

Xin Li Fuxin Li

Learning Bag-of-Features Pooling for Deep Convolutional Neural Networks.

Nikolaos Passalis Anastasios Tefas

Deep Scene Image Classification with the MFAFVNet.

Yunsheng Li Mandar Dixit Nuno Vasconcelos

Deep Clustering via Joint Convolutional Autoencoder Embedding and Relative Entropy Minimization.

Kamran Ghasedi Dizaji Amirhossein Herandi Cheng Deng Weidong Cai Heng Huang

Interpretable Transformations with Encoder-Decoder Networks.

Daniel E. Worrall Stephan J. Garbin Daniyar Turmukhambetov Gabriel J. Brostow

Temporal Context Network for Activity Localization in Videos.

Xiyang Dai Bharat Singh Guyue Zhang Larry S. Davis Yan Qiu Chen

Unified Deep Supervised Domain Adaptation and Generalization.

Saeid Motiian Marco Piccirilli Donald A. Adjeroh Gianfranco Doretto

Semantic Image Synthesis via Adversarial Learning.

Hao Dong Simiao Yu Chao Wu Yike Guo

Efficient Low Rank Tensor Ring Completion.

Wenqi Wang Vaneet Aggarwal Shuchin Aeron

Semi Supervised Semantic Segmentation Using Generative Adversarial Network.

Nasim Souly Concetto Spampinato Mubarak Shah

3DCNN-DQN-RNN: A Deep Reinforcement Learning Framework for Semantic Parsing of Large-Scale 3D Point Clouds.

Fangyu Liu Shuaipeng Li Liqiang Zhang Chenghu Zhou Rongtian Ye Yuebin Wang Jiwen Lu

Training Deep Networks to be Spatially Sensitive.

Nicholas I. Kolkin Gregory Shakhnarovich Eli Shechtman

Deep Functional Maps: Structured Prediction for Dense Shape Correspondence.

Or Litany Tal Remez Emanuele Rodolà Alexander M. Bronstein Michael M. Bronstein

Image2song: Song Retrieval via Bridging Image Content and Lyric Words.

Xuelong Li Di Hu Xiaoqiang Lu

Scene Categorization with Spectral Features.

Salman H. Khan Munawar Hayat Fatih Porikli

Flip-Invariant Motion Representation.

Takumi Kobayashi

Scaling the Scattering Transform: Deep Hybrid Networks.

Edouard Oyallon Eugene Belilovsky Sergey Zagoruyko

HashNet: Deep Learning to Hash by Continuation.

Zhangjie Cao Mingsheng Long Jianmin Wang Philip S. Yu

Human Pose Estimation Using Global and Local Normalization.

Ke Sun Cuiling Lan Junliang Xing Wenjun Zeng Dong Liu Jingdong Wang

Understanding and Mapping Natural Beauty.

Scott Workman Richard Souvenir Nathan Jacobs

Video Scene Parsing with Predictive Feature Learning.

Xiaojie Jin Xin Li Huaxin Xiao Xiaohui Shen Zhe Lin Jimei Yang Yunpeng Chen Jian Dong Luoqi Liu Zequn Jie Jiashi Feng Shuicheng Yan

Semantic Jitter: Dense Supervision for Visual Comparisons via Synthetic Images.

Aron Yu Kristen Grauman

Soft-NMS - Improving Object Detection with One Line of Code.

Navaneeth Bodla Bharat Singh Rama Chellappa Larry S. Davis

Deep Spatial-Semantic Attention for Fine-Grained Sketch-Based Image Retrieval.

Jifei Song Qian Yu Yi-Zhe Song Tao Xiang Timothy M. Hospedales

Deeper, Broader and Artier Domain Generalization.

Da Li Yongxin Yang Yi-Zhe Song Timothy M. Hospedales

Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks.

Zhaofan Qiu Ting Yao Tao Mei

Long Short-Term Memory Kalman Filters: Recurrent Neural Estimators for Pose Regularization.

Huseyin Coskun Felix Achilles Robert S. DiPietro Nassir Navab Federico Tombari

Offline Handwritten Signature Modeling and Verification Based on Archetypal Analysis.

Elias N. Zois Ilias Theodorakopoulos George Economou

A Discriminative View of MRF Pre-processing Algorithms.

Chen Wang Charles Herrmann Ramin Zabih

Non-rigid Object Tracking via Deformable Patches Using Shape-Preserved KCF and Level Sets.

Xin Sun Ngai-Man Cheung Hongxun Yao Yiluan Guo

Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy Visual Tracking.

Heng Fan Haibin Ling

Monocular Video-Based Trailer Coupler Detection Using Multiplexer Convolutional Neural Network.

Yousef Atoum Joseph Roth Michael Bliss Wende Zhang Xiaoming Liu

Saliency Pattern Detection by Ranking Structured Trees.

Lei Zhu Haibin Ling Jin Wu Huiping Deng Jin Liu

Recurrent Color Constancy.

Yanlin Qian Ke Chen Jarno Nikkanen Joni-Kristian Kamarainen Jiri Matas

Pixel Recursive Super Resolution.

Ryan Dahl Mohammad Norouzi Jonathon Shlens

Realistic Dynamic Facial Textures from a Single Image Using GANs.

Kyle Olszewski Zimo Li Chao Yang Yi Zhou Ronald Yu Zeng Huang Sitao Xiang Shunsuke Saito Pushmeet Kohli Hao Li

Face Sketch Matching via Coupled Deep Transform Learning.

Shruti Nagpal Maneet Singh Richa Singh Mayank Vatsa Afzel Noore Angshul Majumdar

Range Loss for Deep Face Recognition with Long-Tailed Training Data.

Xiao Zhang Zhiyuan Fang Yandong Wen Zhifeng Li Yu Qiao

Multi-scale Deep Learning Architectures for Person Re-identification.

Xuelin Qian Yanwei Fu Yu-Gang Jiang Tao Xiang Xiangyang Xue

Intrinsic 3D Dynamic Surface Tracking based on Dynamic Ricci Flow and Teichmüller Map.

Xiaokang Yu Na Lei Yalin Wang Xianfeng Gu

RGB-Infrared Cross-Modality Person Re-identification.

Ancong Wu Wei-Shi Zheng Hong-Xing Yu Shaogang Gong Jianhuang Lai

Estimating Defocus Blur via Rank of Local Patches.

Guodong Xu Yuhui Quan Hui Ji

Reflectance Capture Using Univariate Sampling of BRDFs.

Zhuo Hui Kalyan Sunkavalli Joon-Young Lee Sunil Hadap Jian Wang Aswin C. Sankaranarayanan

A Lightweight Single-Camera Polarization Compass with Covariance Estimation.

Wolfgang Stürzl

Deltille Grids for Geometric Camera Calibration.

Hyowon Ha Michal Perdoch Hatem Alismail In So Kweon Yaser Sheikh

Camera Calibration by Global Constraints on the Motion of Silhouettes.

Gil Ben-Artzi

Submodular Trajectory Optimization for Aerial 3D Scanning.

Mike Roberts Shital Shah Debadeepta Dey Anh Truong Sudipta N. Sinha Ashish Kapoor Pat Hanrahan Neel Joshi

Refractive Structure-from-Motion Through a Flat Refractive Interface.

François Chadebecq Francisco Vasconcelos George Dwyer Rene M. Lacher Sébastien Ourselin Tom Vercauteren Danail Stoyanov

Editable Parametric Dense Foliage from 3D Capture.

Paul A. Beardsley Gaurav Chaurasia

Convolutional Dictionary Learning via Local Processing.

Vardan Papyan Yaniv Romano Michael Elad Jeremias Sulam

Active Decision Boundary Annotation with Deep Generative Models.

Miriam W. Huijser Jan C. van Gemert

End-to-End Face Detection and Cast Grouping in Movies Using Erdös-Rényi Clustering.

Sou-Young Jin Hang Su Chris Stauffer Erik G. Learned-Miller

TALL: Temporal Activity Localization via Language Query.

Jiyang Gao Chen Sun Zhenheng Yang Ram Nevatia

Learning from Video and Text via Large-Scale Discriminative Clustering.

Antoine Miech Jean-Baptiste Alayrac Piotr Bojanowski Ivan Laptev Josef Sivic

DeepSetNet: Predicting Sets with Deep Neural Networks.

Seyed Hamid Rezatofighi Vijay Kumar B. G Anton Milan Ehsan Abbasnejad Anthony R. Dick Ian D. Reid

Towards End-to-End Text Spotting with Convolutional Recurrent Neural Networks.

Hui Li Peng Wang Chunhua Shen

Quantitative Evaluation of Confidence Measures in a Machine Learning World.

Matteo Poggi Fabio Tosi Stefano Mattoccia

Learning 3D Object Categories by Looking Around Them.

David Novotný Diane Larlus Andrea Vedaldi

Learning Multi-attention Convolutional Neural Network for Fine-Grained Image Recognition.

Heliang Zheng Jianlong Fu Tao Mei Jiebo Luo

3D Graph Neural Networks for RGBD Semantic Segmentation.

Xiaojuan Qi Renjie Liao Jiaya Jia Sanja Fidler Raquel Urtasun

BIER - Boosting Independent Embeddings Robustly.

Michael Opitz Georg Waltner Horst Possegger Horst Bischof

Weakly-Supervised Learning of Visual Relations.

Julia Peyre Ivan Laptev Cordelia Schmid Josef Sivic

What is Around the Camera?

Stamatios Georgoulis Konstantinos Rematas Tobias Ritschel Mario Fritz Tinne Tuytelaars Luc Van Gool

Personalized Cinemagraphs Using Semantic Understanding and Collaborative Learning.

Tae-Hyun Oh Kyungdon Joo Neel Joshi Baoyuan Wang In So Kweon Sing Bing Kang

Spatiotemporal Modeling for Crowd Counting in Videos.

Feng Xiong Xingjian Shi Dit-Yan Yeung

Dynamic Label Graph Matching for Unsupervised Video Re-identification.

Mang Ye Andy Jinhua Ma Liang Zheng Jiawei Li Pong C. Yuen

A Multilayer-Based Framework for Online Background Subtraction with Freely Moving Cameras.

Yizhe Zhu Ahmed M. Elgammal

Moving Object Detection in Time-Lapse or Motion Trigger Image Sequences Using Low-Rank and Invariant Sparse Decomposition.

Moein Shakeri Hong Zhang

A Multimodal Deep Regression Bayesian Network for Affective Video Content Analyses.

Quan Gan Shangfei Wang Longfei Hao Qiang Ji

Dense and Low-Rank Gaussian CRFs Using Deep Embeddings.

Siddhartha Chandra Nicolas Usunier Iasonas Kokkinos

Nonparametric Variational Auto-Encoders for Hierarchical Representation Learning.

Prasoon Goyal Zhiting Hu Xiaodan Liang Chenyu Wang Eric P. Xing Carnegie Mellon

Unsupervised Object Segmentation in Video by Efficient Selection of Highly Probable Positive Features.

Emanuela Haller Marius Leordeanu

Focusing Attention: Towards Accurate Text Recognition in Natural Images.

Zhanzhan Cheng Fan Bai Yunlu Xu Gang Zheng Shiliang Pu Shuigeng Zhou

AutoDIAL: Automatic Domain Alignment Layers.

Fabio Maria Carlucci Lorenzo Porzi Barbara Caputo Elisa Ricci Samuel Rota Bulò

ThiNet: A Filter Level Pruning Method for Deep Neural Network Compression.

Jian-Hao Luo Jianxin Wu Weiyao Lin

Rotation Equivariant Vector Field Networks.

Diego Marcos Michele Volpi Nikos Komodakis Devis Tuia

Segmentation-Aware Convolutional Networks Using Local Attention Masks.

Adam W. Harley Konstantinos G. Derpanis Iasonas Kokkinos

Multimodal Gaussian Process Latent Variable Models with Harmonization.

Guoli Song Shuhui Wang Qingming Huang Qi Tian

Tensor RPCA by Bayesian CP Factorization with Complex Noise.

Qiong Luo Zhi Han Xiai Chen Yao Wang Deyu Meng Dong Liang Yandong Tang

Sparse Exact PGA on Riemannian Manifolds.

Monami Banerjee Rudrasis Chakraborty Baba C. Vemuri

Self-Organized Text Detection with Minimal Post-processing via Border Learning.

Yue Wu Prem Natarajan

The Mapillary Vistas Dataset for Semantic Understanding of Street Scenes.

Gerhard Neuhold Tobias Ollmann Samuel Rota Bulò Peter Kontschieder

RDFNet: RGB-D Multi-level Residual Feature Fusion for Indoor Semantic Segmentation.

Seungyong Lee Seong-Jin Park Ki-Sang Hong

Exploiting Spatial Structure for Localizing Manipulated Image Regions.

Jawadul H. Bappy Amit K. Roy-Chowdhury Jason Bunk Lakshmanan Nataraj B. S. Manjunath

Generalized Orderless Pooling Performs Implicit Salient Matching.

Marcel Simon Yang Gao Trevor Darrell Joachim Denzler Erik Rodner

Illuminating Pedestrians via Simultaneous Detection and Segmentation.

Garrick Brazil Xi Yin Xiaoming Liu

WordSup: Exploiting Word Annotations for Character Based Text Detection.

Han Hu Chengquan Zhang Yuxuan Luo Yuzhuo Wang Junyu Han Errui Ding

Extreme Clicking for Efficient Object Annotation.

Dim P. Papadopoulos Jasper R. R. Uijlings Frank Keller Vittorio Ferrari

Object-Level Proposals.

Jianxiang Ma Anlong Ming Zilong Huang Xinggang Wang Yu Zhou

Locally-Transferred Fisher Vectors for Texture Classification.

Yang Song Fan Zhang Qing Li Heng Huang Lauren J. O'Donnell Weidong Cai

Learning to Estimate 3D Hand Pose from Single RGB Images.

Christian Zimmermann Thomas Brox

Boosting Image Captioning with Attributes.

Ting Yao Yingwei Pan Yehao Li Zhaofan Qiu Tao Mei

AnnArbor: Approximate Nearest Neighbors Using Arborescence Coding.

Artem Babenko Victor S. Lempitsky

SSH: Single Stage Headless Face Detector.

Mahyar Najibi Pouya Samangouei Rama Chellappa Larry S. Davis

RoomNet: End-to-End Room Layout Estimation.

Chen-Yu Lee Vijay Badrinarayanan Tomasz Malisiewicz Andrew Rabinovich

Referring Expression Generation and Comprehension via Attributes.

Jingyu Liu Liang Wang Ming-Hsuan Yang

Mutual Enhancement for Detection of Multiple Logos in Sports Videos.

Yuan Liao Xiaoqing Lu Chengcui Zhang Yongtao Wang Zhi Tang

Online Multi-object Tracking Using CNN-Based Single Object Tracker with Spatial-Temporal Attention Mechanism.

Qi Chu Wanli Ouyang Hongsheng Li Xiaogang Wang Bin Liu Nenghai Yu

Deep Generative Adversarial Compression Artifact Removal.

Leonardo Galteri Lorenzo Seidenari Marco Bertini Alberto Del Bimbo

Blob Reconstruction Using Unilateral Second Order Gaussian Kernels with Application to High-ISO Long-Exposure Image Denoising.

Gang Wang Carlos Lopez-Molina Bernard De Baets

Convergence Analysis of MAP Based Blur Kernel Estimation.

Sunghyun Cho Seungyong Lee

Image Super-Resolution Using Dense Skip Connections.

Tong Tong Gen Li Xiejie Liu Qinquan Gao

Understanding Low- and High-Level Contributions to Fixation Prediction.

Matthias Kümmerer Thomas S. A. Wallis Leon A. Gatys Matthias Bethge

Simultaneous Detection and Removal of High Altitude Clouds from an Image.

Tushar Sandhan Jin Young Choi

AOD-Net: All-in-One Dehazing Network.

Boyi Li Xiulian Peng Zhangyang Wang Jizheng Xu Dan Feng

Non-linear Convolution Filters for CNN-Based Learning.

Georgios Zoumpourlis Alexandros Doumanoglou Nicholas Vretos Petros Daras

Blur-Invariant Deep Learning for Blind-Deblurring.

Thekke Madam Nimisha Akash Kumar Singh A. N. Rajagopalan

Automatic Content-Aware Projection for 360° Videos.

Yeong Won Kim Chang-Ryeol Lee Dae Yong Cho Yong Hoon Kwon Hyeok-Jae Choi Kuk-Jin Yoon

Jointly Attentive Spatial-Temporal Pooling Networks for Video-Based Person Re-identification.

Shuangjie Xu Yu Cheng Kang Gu Yang Yang Shiyu Chang Pan Zhou

Learning Dense Facial Correspondences in Unconstrained Images.

Ronald Yu Shunsuke Saito Haoxiang Li Duygu Ceylan Hao Li

DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs.

K. Ram Prabhakar V. Sai Srikar R. Venkatesh Babu

From RGB to Spectrum for Natural Scenes via Manifold-Based Mapping.

Yan Jia Yinqiang Zheng Lin Gu Art Subpa-Asa Antony Lam Yoichi Sato Imari Sato

Efficient Algorithms for Moral Lineage Tracing.

Markus Rempfler Jan-Hendrik Lange Florian Jug Corinna Blasse Eugene W. Myers Bjoern H. Menze Bjoern Andres

FLaME: Fast Lightweight Mesh Estimation Using Variational Smoothing on Delaunay Graphs.

W. Nicholas Greene Nicholas Roy

Taking the Scenic Route to 3D: Optimising Reconstruction from Moving Cameras.

Oscar Mendez Maldonado Simon Hadfield Nicolas Pugeault Richard Bowden

Dynamics Enhanced Multi-camera Motion Segmentation from Unsynchronized Videos.

Xikang Zhang Bengisu Özbay Mario Sznaier Octavia I. Camps

Optimal Transformation Estimation with Semantic Cues.

Luc Van Gool Danda Pani Paudel Adlane Habed

Monocular Dense 3D Reconstruction of a Complex Dynamic Scene from Two Perspective Frames.

Suryansh Kumar Yuchao Dai Hongdong Li

Depth Estimation Using Structured Light Flow - Analysis of Projected Pattern Flow on an Object's Surface.

Ryo Furukawa Ryusuke Sagawa Hiroshi Kawasaki

Ray Space Features for Plenoptic Structure-from-Motion.

Yingliang Zhang Peihong Yu Wei Yang Yuanxi Ma Jingyi Yu

2D-Driven 3D Object Detection in RGB-D Images.

Jean Lahoud Bernard Ghanem

Joint Estimation of Camera Pose, Depth, Deblurring, and Super-Resolution from a Blurred Image Sequence.

Haesol Park Kyoung Mu Lee

Visual Odometry for Pixel Processor Arrays.

Laurie Bose Jianing Chen Stephen J. Carey Piotr Dudek Walterio W. Mayol-Cuevas

Learning Spread-Out Local Feature Descriptors.

Xu Zhang Felix X. Yu Sanjiv Kumar Shih-Fu Chang

Learning to Push the Limits of Efficient FFT-Based Image Deconvolution.

Jakob Kruse Carsten Rother Uwe Schmidt

Unrolled Memory Inner-Products: An Abstract GPU Operator for Efficient Vision-Related Computations.

Yu-Sheng Lin Wei-Chao Chen Shao-Yi Chien

Practical and Efficient Multi-view Matching.

Eleonora Maset Federica Arrigoni Andrea Fusiello

Weakly- and Self-Supervised Learning for Content-Aware Deep Image Retargeting.

Donghyeon Cho Jinsun Park Tae-Hyun Oh Yu-Wing Tai In So Kweon

Structure-Measure: A New Way to Evaluate Foreground Maps.

Deng-Ping Fan Ming-Ming Cheng Yun Liu Tao Li Ali Borji

MemNet: A Persistent Memory Network for Image Restoration.

Ying Tai Jian Yang Xiaoming Liu Chunyan Xu

DCTM: Discrete-Continuous Transformation Matching for Semantic Flow.

Seungryong Kim Dongbo Min Stephen Lin Kwanghoon Sohn

Learning High Dynamic Range from Outdoor Panoramas.

Jinsong Zhang Jean-François Lalonde

Shadow Detection with Conditional Generative Adversarial Networks.

Vu Nguyen Tomas F. Yago Vicente Maozheng Zhao Minh Hoai Dimitris Samaras

Makeup-Go: Blind Reversion of Portrait Edit.

Ying-Cong Chen Xiaoyong Shen Jiaya Jia

EnhanceNet: Single Image Super-Resolution Through Automated Texture Synthesis.

Mehdi S. M. Sajjadi Bernhard Schölkopf Michael Hirsch

Learning Video Object Segmentation with Visual Memory.

Pavel Tokmakov Karteek Alahari Cordelia Schmid

Detail-Revealing Deep Video Super-Resolution.

Xin Tao Hongyun Gao Renjie Liao Jue Wang Jiaya Jia

Video Frame Synthesis Using Deep Voxel Flow.

Ziwei Liu Raymond A. Yeh Xiaoou Tang Yiming Liu Aseem Agarwala

Semantic Video CNNs Through Representation Warping.

Raghudeep Gadde Varun Jampani Peter V. Gehler

Spatial-Aware Object Embeddings for Zero-Shot Localization and Classification of Actions.

Pascal Mettes Cees G. M. Snoek

Neural Ctrl-F: Segmentation-Free Query-by-String Word Spotting in Handwritten Manuscript Collections.

Tomas Wilkinson Jonas Lindström Anders Brun

Constrained Convolutional Sparse Coding for Parametric Based Reconstruction of Line Drawings.

Sara Shaheen Lama Affara Bernard Ghanem

AMTnet: Action-Micro-Tube Regression by End-to-end Trainable Deep Architecture.

Suman Saha Gurkirt Singh Fabio Cuzzolin

Action Tubelet Detector for Spatio-Temporal Action Localization.

Vicky Kalogeiton Philippe Weinzaepfel Vittorio Ferrari Cordelia Schmid

Unsupervised Video Understanding by Reconciliation of Posture Similarities.

Timo Milbich Miguel Ángel Bautista Ekaterina Sutter Björn Ommer

Learning-Based Cloth Material Recovery from Video.

Shan Yang Junbang Liang Ming C. Lin

Interleaved Group Convolutions.

Ting Zhang Guo-Jun Qi Bin Xiao Jingdong Wang

Active Learning for Human Pose Estimation.

Buyu Liu Vittorio Ferrari

Adversarial Inverse Graphics Networks: Learning 2D-to-3D Lifting and Image-to-Image Translation from Unpaired Supervision.

Hsiao-Yu Fish Tung Adam W. Harley William Seto Katerina Fragkiadaki

Supplementary Meta-Learning: Towards a Dynamic Model for Deep Neural Networks.

Feihu Zhang Benjamin W. Wah

Unsupervised Learning from Video to Detect Foreground Objects in Single Images.

Ioana Croitoru Simion-Vlad Bogolin Marius Leordeanu

Summarization and Classification of Wearable Camera Streams by Learning the Distributions over Deep Features of Out-of-Sample Image Sequences.

Alessandro Penna Sadegh Mohammadi Nebojsa Jojic Vittorio Murino

Side Information in Robust Principal Component Analysis: Algorithms and Applications.

Niannan Xue Yannis Panagakis Stefanos Zafeiriou

Approximate Grassmannian Intersections: Subspace-Valued Subspace Learning.

Calvin Murdock Fernando De la Torre

Self-Supervised Learning of Pose Embeddings from Spatiotemporal Relations in Videos.

Ömer Sümer Tobias Dencker Björn Ommer

Domain-Adaptive Deep Network Compression.

Marc Masana Joost van de Weijer Luis Herranz Andrew D. Bagdanov Jose M. Álvarez

Consensus Convolutional Sparse Coding.

Biswarup Choudhury Robin Swanson Felix Heide Gordon Wetzstein Wolfgang Heidrich

Learning Discriminative αβ-Divergences for Positive Definite Matrices.

Anoop Cherian Panagiotis Stanitsas Mehrtash Harandi Vassilios Morellas Nikos Papanikolopoulos

Region-Based Correspondence Between 3D Shapes via Spatially Smooth Biclustering.

Matteo Denitto Simone Melzi Manuele Bicego Umberto Castellani Alessandro Farinelli Mário A. T. Figueiredo Yanir Kleiman Maks Ovsjanikov

Deep Free-Form Deformation Network for Object-Mask Registration.

Haoyang Zhang Xuming He

Higher-Order Minimum Cost Lifted Multicuts for Motion Segmentation.

Margret Keuper

PPR-FCN: Weakly Supervised Visual Relation Detection via Parallel Pairwise R-FCN.

Hanwang Zhang Zawlin Kyaw Jinyang Yu Shih-Fu Chang

Learning Discriminative Latent Attributes for Zero-Shot Classification.

Huajie Jiang Ruiping Wang Shiguang Shan Yi Yang Xilin Chen

Aligned Image-Word Representations Improve Inductive Transfer Across Vision-Language Tasks.

Tanmay Gupta Kevin J. Shih Saurabh Singh Derek Hoiem

Learning the Latent "Look": Unsupervised Discovery of a Style-Coherent Embedding from Fashion Images.

Wei-Lin Hsiao Kristen Grauman

Attention-Based Multimodal Fusion for Video Description.

Chiori Hori Takaaki Hori Teng-Yok Lee Ziming Zhang Bret Harsham John R. Hershey Tim K. Marks Kazuhiro Sumi

Learning Visual N-Grams from Web Data.

Ang Li Allan Jabri Armand Joulin Laurens van der Maaten

Situation Recognition with Graph Neural Networks.

Ruiyu Li Makarand Tapaswi Renjie Liao Jiaya Jia Raquel Urtasun Sanja Fidler

BlitzNet: A Real-Time Deep Network for Scene Understanding.

Nikita Dvornik Konstantin Shmelkov Julien Mairal Cordelia Schmid

Drone-Based Object Counting by Spatially Regularized Regional Proposal Network.

Meng-Ru Hsieh Yen-Liang Lin Winston H. Hsu

Speaking the Same Language: Matching Machine to Human Captions by Adversarial Training.

Rakshith Shetty Marcus Rohrbach Lisa Anne Hendricks Mario Fritz Bernt Schiele

CoupleNet: Coupling Global Structure with Local Parts for Object Detection.

Yousong Zhu Chaoyang Zhao Jinqiao Wang Xu Zhao Yi Wu Hanqing Lu

Rotational Subgroup Voting and Pose Clustering for Robust 3D Object Recognition.

Anders Glent Buch Lilita Kiforenko Dirk Kraft

Learning a Recurrent Residual Fusion Network for Multimodal Matching.

Yu Liu Yanming Guo Erwin M. Bakker Michael S. Lew

Deep Binaries: Encoding Semantic-Rich Cues for Efficient Textual-Visual Cross Retrieval.

Yuming Shen Li Liu Ling Shao Jingkuan Song

Spatial Memory for Context Reasoning in Object Detection.

Xinlei Chen Abhinav Gupta

Cross-Modal Deep Variational Hashing.

Venice Erin Liong Jiwen Lu Yap-Peng Tan Jie Zhou

Characterizing and Improving Stability in Neural Style Transfer.

Agrim Gupta Justin Johnson Alexandre Alahi Li Fei-Fei

Fast Multi-image Matching via Density-Based Clustering.

Roberto Tron Xiaowei Zhou Carlos Esteves Kostas Daniilidis

Supervision by Fusion: Towards Unsupervised Learning of Deep Salient Object Detector.

Dingwen Zhang Junwei Han Yu Zhang

Online Video Deblurring via Dynamic Temporal Blending Network.

Tae Hyun Kim Kyoung Mu Lee Bernhard Schölkopf Michael Hirsch

From Square Pieces to Brick Walls: The Next Challenge in Solving Jigsaw Puzzles.

Shir Gur Ohad Ben-Shahar

A Stagewise Refinement Model for Detecting Salient Objects in Images.

Tiantian Wang Ali Borji Lihe Zhang Pingping Zhang Huchuan Lu

Going Unconstrained with Rolling Shutter Deblurring.

Mahesh Mohan M. R. A. N. Rajagopalan

A Joint Intrinsic-Extrinsic Prior Model for Retinex.

Bolun Cai Xianming Xu Kailing Guo Kui Jia Bin Hu Dacheng Tao

Towards Large-Pose Face Frontalization in the Wild.

Xi Yin Xiang Yu Kihyuk Sohn Xiaoming Liu Manmohan Chandraker

Faster than Real-Time Facial Alignment: A 3D Spatial Transformer Network Approach in Unconstrained Poses.

Chandrasekhar Bhagavatula Chenchen Zhu Khoa Luu Marios Savvides

Recognition of Action Units in the Wild with Deep Nets and a New Global-Local Loss.

Carlos Fabian Benitez-Quiroz Yan Wang Aleix M. Martínez

Pose-Driven Deep Convolutional Model for Person Re-identification.

Chi Su Jianing Li Shiliang Zhang Junliang Xing Wen Gao Qi Tian

Deep Facial Action Unit Recognition from Partially Labeled Data.

Shan Wu Shangfei Wang Bowen Pan Qiang Ji

Learning to Fuse 2D and 3D Image Cues for Monocular Body Pose Estimation.

Bugra Tekin Pablo Márquez-Neila Mathieu Salzmann Pascal Fua

Attention-Aware Deep Reinforcement Learning for Video Face Recognition.

Yongming Rao Jiwen Lu Jie Zhou

Benchmarking Single-Image Reflection Removal Algorithms.

Renjie Wan Boxin Shi Ling-Yu Duan Ah-Hwee Tan Alex C. Kot

Space-Time Localization and Mapping.

Minhaeng Lee Charless C. Fowlkes

Stereo DSO: Large-Scale Direct Sparse Visual Odometry with Stereo Cameras.

Rui Wang Martin Schwörer Daniel Cremers

From Point Clouds to Mesh Using Regression.

Lubor Ladicky Olivier Saurer SoHyeon Jeong Fabio Maninchedda Marc Pollefeys

Dense Non-rigid Structure-from-Motion and Shading with Unknown Albedos.

Mathias Gallardo Toby Collins Adrien Bartoli

Low Compute and Fully Parallel Computer Vision with HashMatch.

Sean Ryan Fanello Julien P. C. Valentin Adarsh Kowdle Christoph Rhemann Vladimir Tankovich Carlo Ciliberto Philip L. Davidson Shahram Izadi

Efficient Global Illumination for Morphable Models.

Andreas Schneider Sandro Schönborn Bernhard Egger Lavrenti Frobeen Thomas Vetter

Pose Guided RGBD Feature Learning for 3D Object Pose Estimation.

Vassileios Balntas Andreas Doumanoglou Caner Sahin Juil Sock Rigas Kouskouridas Tae-Kyun Kim

Parameter-Free Lens Distortion Calibration of Central Cameras.

Filippo Bergamasco Luca Cosmo Andrea Gasparetto Andrea Albarelli Andrea Torsello

Modeling Urban Scenes from Pointclouds.

William Nguatem Helmut Mayer

BB8: A Scalable, Accurate, Robust to Partial Occlusion Method for Predicting the 3D Poses of Challenging Objects without Using Depth.

Mahdi Rad Vincent Lepetit

Semantically Informed Multiview Surface Refinement.

Maros Blaha Mathias Rothermel Martin R. Oswald Torsten Sattler Audrey Richard Jan Dirk Wegner Marc Pollefeys Konrad Schindler

Towards More Accurate Iris Recognition Using Deeply Learned Spatially Corresponding Features.

Zijing Zhao Ajay Kumar

SVDNet for Pedestrian Retrieval.

Yifan Sun Liang Zheng Weijian Deng Shengjin Wang

Synergy between Face Alignment and Tracking via Discriminative Global Consensus Optimization.

Muhammad Haris Khan John McDonagh Georgios Tzimiropoulos

Learning Discriminative Aggregation Network for Video-Based Face Recognition.

Yongming Rao Ji Lin Jiwen Lu Jie Zhou

Recursive Spatial Transformer (ReST) for Alignment-Free Face Recognition.

Wanglong Wu Meina Kan Xin Liu Yi Yang Shiguang Shan Xilin Chen

Egocentric Gesture Recognition Using Recurrent 3D Convolutional Neural Networks with Spatiotemporal Transformer Modules.

Congqi Cao Yifan Zhang Yi Wu Hanqing Lu Jian Cheng

Unlabeled Samples Generated by GAN Improve the Person Re-identification Baseline in Vitro.

Zhedong Zheng Liang Zheng Yi Yang

Attribute-Enhanced Face Recognition with Neural Tensor Fusion Networks.

Guosheng Hu Yang Hua Yang Yuan Zhihong Zhang Zheng Lu Sankha S. Mukherjee Timothy M. Hospedales Neil Martin Robertson Yongxin Yang

Temporal Non-volume Preserving Approach to Facial Age-Progression and Age-Invariant Face Recognition.

Chi Nhan Duong Kha Gia Quach Khoa Luu T. Hoang Ngan Le Marios Savvides

RPAN: An End-to-End Recurrent Pose-Attention Network for Action Recognition in Videos.

Wenbin Du Yali Wang Yu Qiao

MoFA: Model-Based Deep Convolutional Face Autoencoder for Unsupervised Monocular Reconstruction.

Ayush Tewari Michael Zollhöfer Hyeongwoo Kim Pablo Garrido Florian Bernard Patrick Pérez Christian Theobalt

Binarized Convolutional Landmark Localizers for Human Pose Estimation and Face Alignment with Limited Resources.

Adrian Bulat Georgios Tzimiropoulos

First-Person Activity Forecasting with Online Inverse Reinforcement Learning.

Nicholas Rhinehart Kris M. Kitani

Towards a Visual Privacy Advisor: Understanding and Predicting Privacy Risks in Images.

Tribhuvanesh Orekondy Bernt Schiele Mario Fritz

Fast Face-Swap Using Convolutional Neural Networks.

Iryna Korshunova Wenzhe Shi Joni Dambre Lucas Theis

FCN-rLSTM: Deep Spatio-Temporal Neural Networks for Vehicle Counting in City Cameras.

Shanghang Zhang Guanhang Wu João Paulo Costeira José M. F. Moura

Weakly Supervised Summarization of Web Videos.

Rameswar Panda Abir Das Ziyan Wu Jan Ernst Amit K. Roy-Chowdhury

Leveraging Weak Semantic Relevance for Complex Video Event Classification.

Heng Tao Shen Chao Li Jiewei Cao Zi Huang Lei Zhu

Online Real-Time Multiple Spatiotemporal Action Localisation and Prediction.

Gurkirt Singh Suman Saha Michael Sapienza Philip H. S. Torr Fabio Cuzzolin

TURN TAP: Temporal Unit Regression Network for Temporal Action Proposals.

Jiyang Gao Zhenheng Yang Chen Sun Kan Chen Ram Nevatia

Joint Detection and Recounting of Abnormal Events by Learning Deep Generic Knowledge.

Ryota Hinami Tao Mei Shin'ichi Satoh

Temporal Superpixels Based on Proximity-Weighted Patch Matching.

Se-Ho Lee Won-Dong Jang Chang-Su Kim

CDTS: Collaborative Detection, Tracking, and Segmentation for Online Multiple Object Segmentation in Videos.

Yeong Jun Koh Chang-Su Kim

Learning in an Uncertain World: Representing Ambiguity Through Multiple Hypotheses.

Christian Rupprecht Iro Laina Robert S. DiPietro Maximilian Baust

PUnDA: Probabilistic Unsupervised Domain Adaptation for Knowledge Transfer Across Visual Categories.

Behnam Gholami Ognjen Rudovic Vladimir Pavlovic

Learning Robust Visual-Semantic Embeddings.

Yao-Hung Hubert Tsai Liang-Kang Huang Ruslan Salakhutdinov

Guided Perturbations: Self-Corrective Behavior in Convolutional Neural Networks.

Swami Sankaranarayanan Arpit Jain Ser-Nam Lim

Predictor Combination at Test Time.

Kwang In Kim James Tompkin Christian Richardt

Curriculum Dropout.

Pietro Morerio Jacopo Cavazza Riccardo Volpi René Vidal Vittorio Murino

Two-Phase Learning for Weakly Supervised Object Localization.

Dahun Kim Donghyeon Cho Donggeun Yoo

Hide-and-Seek: Forcing a Network to be Meticulous for Weakly-Supervised Object and Action Localization.

Krishna Kumar Singh Yong Jae Lee

Aesthetic Critiques Generation for Photos.

Kuang-Yu Chang Kung-Hung Lu Chu-Song Chen

Adaptive Feeding: Achieving Fast and Accurate Detections by Adaptively Combining Object Detectors.

Hong-Yu Zhou Bin-Bin Gao Jianxin Wu

SGN: Sequential Grouping Networks for Instance Segmentation.

Shu Liu Jiaya Jia Sanja Fidler Raquel Urtasun

Multi-label Learning of Part Detectors for Heavily Occluded Pedestrian Detection.

Chunluan Zhou Junsong Yuan

Predicting Visual Exemplars of Unseen Classes for Zero-Shot Learning.

Soravit Changpinyo Wei-Lun Chao Fei Sha

Deep Globally Constrained MRFs for Human Pose Estimation.

Ioannis Marras Petar Palasek Ioannis Patras

Large-Scale Image Retrieval with Attentive Deep Local Features.

Hyeonwoo Noh Andre Araujo Jack Sim Tobias Weyand Bohyung Han

Monocular 3D Human Pose Estimation by Predicting Depth on Joints.

Bruce Xiaohan Nie Ping Wei Song-Chun Zhu

DeepRoadMapper: Extracting Road Topology from Aerial Images.

Gellért Máttyus Wenjie Luo Raquel Urtasun

Interpretable Explanations of Black Boxes by Meaningful Perturbation.

Ruth C. Fong Andrea Vedaldi

Learning to Disambiguate by Asking Discriminative Questions.

Yining Li Chen Huang Xiaoou Tang Chen Change Loy

Generative Adversarial Networks Conditioned by Brain Signals.

Simone Palazzo Concetto Spampinato Isaak Kavasidis Daniela Giordano Mubarak Shah

Incremental Learning of Object Detectors without Catastrophic Forgetting.

Konstantin Shmelkov Cordelia Schmid Karteek Alahari

Single Image Action Recognition Using Semantic Body Part Actions.

Zhichen Zhao Huimin Ma Shaodi You

Weakly Supervised Object Localization Using Things and Stuff Transfer.

Miaojing Shi Holger Caesar Vittorio Ferrari

A Two-Streamed Network for Estimating Fine-Scaled Depth Maps from Single RGB Images.

Jun Li Reinhard Klein Angela Yao

Recurrent Topic-Transition GAN for Visual Paragraph Generation.

Xiaodan Liang Zhiting Hu Hao Zhang Chuang Gan Eric P. Xing

Robust Kronecker-Decomposable Component Analysis for Low-Rank Modeling.

Mehdi Bahri Yannis Panagakis Stefanos Zafeiriou

What will Happen Next? Forecasting Player Moves in Sports Videos.

Panna Felsen Pulkit Agrawal Jitendra Malik

The Pose Knows: Video Forecasting by Generating Pose Futures.

Jacob Walker Kenneth Marino Abhinav Gupta Martial Hebert

Beyond Standard Benchmarks: Parameterizing Performance Evaluation in Visual Object Tracking.

Luka Cehovin Zajc Alan Lukezic Ales Leonardis Matej Kristan

DeepCD: Learning Deep Complementary Descriptors for Patch Representations.

Tsun-Yi Yang Jo-Han Hsu Yen-Yu Lin Yung-Yu Chuang

Low-Rank Tensor Completion: A Pseudo-Bayesian Learning Approach.

Wei Chen Nan Song

Misalignment-Robust Joint Filter for Cross-Modal Image Pairs.

Takashi Shibata Masayuki Tanaka Masatoshi Okutomi

Non-uniform Blind Deblurring by Reblurring.

Yuval Bahat Netalee Efrat Michal Irani

DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks.

Andrey Ignatov Nikolay Kobyshev Radu Timofte Kenneth Vanhoey Luc Van Gool

Learning Visual Attention to Identify People with Autism Spectrum Disorder.

Ming Jiang Qi Zhao

High-Quality Correspondence and Segmentation Estimation for Dual-Lens Smart-Phone Portraits.

Xiaoyong Shen Hongyun Gao Xin Tao Chao Zhou Jiaya Jia

Revisiting Cross-Channel Information Transfer for Chromatic Aberration Correction.

Tiancheng Sun Yifan Peng Wolfgang Heidrich

A Generic Deep Architecture for Single Image Reflection Removal and Image Smoothing.

Qingnan Fan Jiaolong Yang Gang Hua Baoquan Chen David P. Wipf

Semantic Line Detection and Its Applications.

Jun-Tae Lee Han-Ul Kim Chul Lee Chang-Su Kim

Deeply-Learned Part-Aligned Representations for Person Re-identification.

Liming Zhao Xi Li Yueting Zhuang Jingdong Wang

Unsupervised Learning of Object Landmarks by Factorized Spatial Embeddings.

James Thewlis Hakan Bilen Andrea Vedaldi

Pose-Invariant Face Alignment with a Single CNN.

Amin Jourabloo Mao Ye Xiaoming Liu Liu Ren

DeepCoder: Semi-Parametric Variational Autoencoders for Automatic Facial Action Coding.

Dieu Linh Tran Robert Walecki Ognjen Rudovic Stefanos Eleftheriadis Björn W. Schuller Maja Pantic

A Novel Space-Time Representation on the Positive Semidefinite Cone for Facial Expression Recognition.

Anis Kacem Mohamed Daoudi Boulbaba Ben Amor Juan Carlos Álvarez Paiva

Detecting Faces Using Inside Cascaded Contextual CNN.

Kaipeng Zhang Zhanpeng Zhang Hao Wang Zhifeng Li Yu Qiao Wei Liu

A Microfacet-Based Reflectance Model for Photometric Stereo with Highly Specular Surfaces.

Lixiong Chen Yinqiang Zheng Boxin Shi Art Subpa-Asa Imari Sato

Filter Selection for Hyperspectral Estimation.

Boaz Arad Ohad Ben-Shahar

Monocular Free-Head 3D Gaze Tracking with Deep Learning and Geometry Constraints.

Haoping Deng Wangjiang Zhu

Detailed Surface Geometry and Albedo Recovery from RGB-D Video under Natural Illumination.

Xinxin Zuo Sen Wang Jiangbin Zheng Ruigang Yang

Robust Hand Pose Estimation during the Interaction with an Unknown Object.

Chiho Choi Sang Ho Yoon Chin-Ning Chen Karthik Ramani

Intrinsic3D: High-Quality 3D Reconstruction by Joint Appearance and Geometry Optimization with Spatially-Varying Lighting.

Robert Maier Kihwan Kim Daniel Cremers Jan Kautz Matthias Nießner

Learning Hand Articulations by Hallucinating Heat Distribution.

Chiho Choi Sangpil Kim Karthik Ramani

Multi-view Dynamic Shape Refinement Using Local Temporal Integration.

Vincent Leroy Jean-Sébastien Franco Edmond Boyer

A 3D Morphable Model of Craniofacial Shape and Texture Variation.

Hang Dai Nick E. Pears William A. P. Smith Christian Duncan

Probabilistic Structure from Motion with Objects (PSfMO).

Paul Gay Vaibhav Bansal Cosimo Rubino Alessio Del Bue

A Spatiotemporal Oriented Energy Network for Dynamic Texture Recognition.

Isma Hadji Richard P. Wildes

SubUNets: End-to-End Hand Shape and Continuous Sign Language Recognition.

Necati Cihan Camgöz Simon Hadfield Oscar Koller Richard Bowden

Single Shot Text Detector with Regional Attention.

Pan He Weilin Huang Tong He Qile Zhu Yu Qiao Xiaolin Li

Detect to Track and Track to Detect.

Christoph Feichtenhofer Axel Pinz Andrew Zisserman

A Coarse-Fine Network for Keypoint Localization.

Shaoli Huang Mingming Gong Dacheng Tao

Low-Shot Visual Recognition by Shrinking and Hallucinating Features.

Bharath Hariharan Ross B. Girshick

TorontoCity: Seeing the World with a Million Eyes.

Shenlong Wang Min Bai Gellért Máttyus Hang Chu Wenjie Luo Bin Yang Justin Liang Joel Cheverie Sanja Fidler Raquel Urtasun

Visual Forecasting by Imitating Dynamics in Natural Sequences.

Kuo-Hao Zeng William B. Shen De-An Huang Min Sun Juan Carlos Niebles

Inferring and Executing Programs for Visual Reasoning.

Justin Johnson Bharath Hariharan Laurens van der Maaten Judy Hoffman Li Fei-Fei C. Lawrence Zitnick Ross B. Girshick

Focal Loss for Dense Object Detection.

Tsung-Yi Lin Priya Goyal Ross B. Girshick Kaiming He Piotr Dollár

Towards Diverse and Natural Image Descriptions via a Conditional GAN.

Bo Dai Sanja Fidler Raquel Urtasun Dahua Lin

Mask R-CNN.

Kaiming He Georgia Gkioxari Piotr Dollár Ross B. Girshick

Learning Cooperative Visual Dialog Agents with Deep Reinforcement Learning.

Abhishek Das Satwik Kottur José M. F. Moura Stefan Lee Dhruv Batra

Interpretable Learning for Self-Driving Cars by Visualizing Causal Attention.

Jinkyu Kim John F. Canny

Transferring Objects: Joint Inference of Container and Human Pose.

Hanqing Wang Wei Liang Lap-Fai Yu

Jointly Recognizing Object Fluents and Tasks in Egocentric Videos.

Yang Liu Ping Wei Song-Chun Zhu

Temporal Action Detection with Structured Segment Networks.

Yue Zhao Yuanjun Xiong Limin Wang Zhirong Wu Xiaoou Tang Dahua Lin

Chained Multi-stream Networks Exploiting Pose, Motion, and Appearance for Action Classification and Detection.

Mohammadreza Zolfaghari Gabriel L. Oliveira Nima Sedaghat Thomas Brox

Unmasking the Abnormal Events in Video.

Radu Tudor Ionescu Sorina Smeureanu Bogdan Alexe Marius Popescu

Trespassing the Boundaries: Labeling Temporal Bounds for Object Interactions in Egocentric Video.

Davide Moltisanti Michael Wray Walterio W. Mayol-Cuevas Dima Damen

SBGAR: Semantics Based Group Activity Recognition.

Xin Li Mooi Choo Chuah

MarioQA: Answering Questions by Watching Gameplay Videos.

Jonghwan Mun Paul Hongsuck Seo Ilchae Jung Bohyung Han

Learning View-Invariant Features for Person Identification in Temporally Synchronized Videos Taken by Wearable Cameras.

Kang Zheng Xiaochuan Fan Yuewei Lin Hao Guo Hongkai Yu Dazhou Guo Song Wang

DualGAN: Unsupervised Dual Learning for Image-to-Image Translation.

Zili Yi Hao (Richard) Zhang Ping Tan Minglun Gong

Sampling Matters in Deep Embedding Learning.

R. Manmatha Chao-Yuan Wu Alexander J. Smola Philipp Krähenbühl

Temporal Generative Adversarial Nets with Singular Value Clipping.

Masaki Saito Eiichi Matsumoto Shunta Saito

Smart Mining for Deep Metric Learning.

Ben Harwood Vijay Kumar B. G Gustavo Carneiro Ian D. Reid Tom Drummond

Deep Growing Learning.

Guangcong Wang Xiaohua Xie Jianhuang Lai Jiaxuan Zhuo

Centered Weight Normalization in Accelerating Training of Deep Neural Networks.

Lei Huang Xianglong Liu Yang Liu Bo Lang Dacheng Tao

Least Squares Generative Adversarial Networks.

Xudong Mao Qing Li Haoran Xie Raymond Y. K. Lau Zhen Wang Stephen Paul Smolley

Towards a Unified Compositional Model for Visual Pattern Modeling.

Wei Tang Pei Yu Jiahuan Zhou Ying Wu

Introspective Neural Networks for Generative Modeling.

Justin Lazarow Long Jin Zhuowen Tu

Associative Domain Adaptation.

Philip Häusser Thomas Frerix Alexander Mordvintsev Daniel Cremers

Universal Adversarial Perturbations Against Semantic Image Segmentation.

Jan Hendrik Metzen Mummadi Chaithanya Kumar Thomas Brox Volker Fischer

CVAE-GAN: Fine-Grained Image Generation through Asymmetric Training.

Jianmin Bao Dong Chen Fang Wen Houqiang Li Gang Hua

Learning Efficient Convolutional Networks through Network Slimming.

Zhuang Liu Jianguo Li Zhiqiang Shen Gao Huang Shoumeng Yan Changshui Zhang

Regional Interactive Image Segmentation Networks.

Jun Hao Liew Yunchao Wei Wei Xiong Sim Heng Ong Jiashi Feng

Deep Dual Learning for Semantic Image Segmentation.

Ping Luo Guangrun Wang Liang Lin Xiaogang Wang

AMAT: Medial Axis Transform for Natural Images.

Stavros Tsogkas Sven J. Dickinson

Directionally Convolutional Networks for 3D Shape Segmentation.

Haotian Xu Ming Dong Zichun Zhong

A Unified Model for Near and Remote Sensing.

Scott Workman Menghua Zhai David J. Crandall Nathan Jacobs

SceneNet RGB-D: Can 5M Synthetic Images Beat Generic ImageNet Pre-training on Indoor Segmentation?

John McCormac Ankur Handa Stefan Leutenegger Andrew J. Davison

Point Set Registration with Global-Local Correspondence and Transformation Estimation.

Su Zhang Yang Yang Kun Yang Yi Luo Sim Heng Ong

Sketching with Style: Visual Search with Sketches and Aesthetic Context.

John P. Collomosse Tu Bui Michael J. Wilber Chen Fang Hailin Jin

Dual-Glance Model for Deciphering Social Relationships.

Junnan Li Yongkang Wong Qi Zhao Mohan S. Kankanhalli

A Simple Yet Effective Baseline for 3d Human Pose Estimation.

Julieta Martinez Rayat Hossain Javier Romero James J. Little

Scene Parsing with Global Context Embedding.

Wei-Chih Hung Yi-Hsuan Tsai Xiaohui Shen Zhe L. Lin Kalyan Sunkavalli Xin Lu Ming-Hsuan Yang

Revisiting IM2GPS in the Deep Learning Era.

Nam N. Vo Nathan Jacobs James Hays

MUTAN: Multimodal Tucker Fusion for Visual Question Answering.

Hedi Ben-younes Rémi Cadène Matthieu Cord Nicolas Thome

Compositional Human Pose Regression.

Xiao Sun Jiaxiang Shang Shuang Liang Yichen Wei

Deep Metric Learning with Angular Loss.

Jian Wang Feng Zhou Shilei Wen Xiao Liu Yuanqing Lin

Performance Guaranteed Network Acceleration via High-Order Residual Quantization.

Zefan Li Bingbing Ni Wenjun Zhang Xiaokang Yang Wen Gao

Bounding Boxes, Segmentations and Object Coordinates: How Important is Recognition for 3D Scene Flow Estimation in Autonomous Driving Scenarios?

Aseem Behl Omid Hosseini Jafari Siva Karthik Mustikovela Hassan Abu Alhaija Carsten Rother Andreas Geiger

Volumetric Flow Estimation for Incompressible Fluids Using the Stationary Stokes Equations.

Katrin Lasinger Christoph Vogel Konrad Schindler

CREST: Convolutional Residual Learning for Visual Tracking.

Yibing Song Chao Ma Lijun Gong Jiawei Zhang Rynson W. H. Lau Ming-Hsuan Yang

Non-Markovian Globally Consistent Multi-object Tracking.

Andrii Maksai Xinchao Wang François Fleuret Pascal Fua

Low-Dimensionality Calibration through Local Anisotropic Scaling for Robust Hand Model Personalization.

Edoardo Remelli Anastasia Tkach Andrea Tagliasacchi Mark Pauly

Joint Bi-layer Optimization for Single-Image Rain Streak Removal.

Lei Zhu Chi-Wing Fu Dani Lischinski Pheng-Ann Heng

Should We Encode Rain Streaks in Video as Deterministic or Stochastic?

Wei Wei Lixuan Yi Qi Xie Qian Zhao Deyu Meng Zongben Xu

Robust Video Super-Resolution with Learned Temporal Dynamics.

Ding Liu Zhaowen Wang Yuchen Fan Xianming Liu Zhangyang Wang Shiyu Chang Thomas S. Huang

Fast Image Processing with Fully-Convolutional Networks.

Qifeng Chen Jia Xu Vladlen Koltun

Paying Attention to Descriptions Generated by Image Captioning Models.

Hamed R. Tavakoli Rakshith Shetty Ali Borji Jorma Laaksonen

Blind Image Deblurring with Outlier Handling.

Jiangxin Dong Jinshan Pan Zhixun Su Ming-Hsuan Yang

Decoder Network over Lightweight Reconstructed Feature for Fast Semantic Style Transfer.

Ming Lu Hao Zhao Anbang Yao Feng Xu Yurong Chen Li Zhang

Visual Transformation Aided Contrastive Learning for Video-Based Kinship Verification.

Hamdi Dibeklioglu

Group Re-identification via Unsupervised Transfer of Sparse Features Encoding.

Giuseppe Lisanti Niki Martinel Alberto Del Bimbo Gian Luca Foresti

Beyond Face Rotation: Global and Local Perception GAN for Photorealistic and Identity Preserving Frontal View Synthesis.

Rui Huang Shu Zhang Tianyu Li Ran He

Stepwise Metric Promotion for Unsupervised Video Person Re-identification.

Zimo Liu Dong Wang Huchuan Lu

Efficient Online Local Metric Adaptation via Negative Samples for Person Re-identification.

Jiahuan Zhou Pei Yu Wei Tang Ying Wu

Video Reflection Removal Through Spatio-Temporal Optimization.

Ajay Nandoriya Mohamed A. Elgharib Changil Kim Mohamed Hefeeda Wojciech Matusik

Depth and Image Restoration from Light Field in a Scattering Medium.

Jiandong Tian Zak Murez Tong Cui Zhen Zhang David J. Kriegman Ravi Ramamoorthi

Multi-stage Multi-recursive-input Fully Convolutional Networks for Neuronal Boundary Detection.

Wei Shen Bin Wang Yuan Jiang Yan Wang Alan L. Yuille

Multi-view Non-rigid Refinement and Normal Selection for High Quality 3D Reconstruction.

Sk. Mohammadul Haque Venu Madhav Govindu

Efficient Global 2D-3D Matching for Camera Localization in a Large-Scale 3D Map.

Liu Liu Hongdong Li Yuchao Dai

Progressive Large Scale-Invariant Image Matching in Scale Space.

Lei Zhou Siyu Zhu Tianwei Shen Jinglu Wang Tian Fang Long Quan

PolyFit: Polygonal Surface Reconstruction from Point Clouds.

Liangliang Nan Peter Wonka

Online Video Object Detection Using Association LSTM.

Yongyi Lu Cewu Lu Chi-Keung Tang

RMPE: Regional Multi-person Pose Estimation.

Haoshu Fang Shuqin Xie Yu-Wing Tai Cewu Lu

3D Surface Detail Enhancement from a Single Normal Map.

Wuyuan Xie Miaohui Wang Xianbiao Qi Lei Zhang

Making Minimal Solvers for Absolute Pose Estimation Compact and Robust.

Viktor Larsson Zuzana Kukelova Yinqiang Zheng

SurfaceNet: An End-to-End 3D Neural Network for Multiview Stereopsis.

Mengqi Ji Juergen Gall Haitian Zheng Yebin Liu Lu Fang

Shape Inpainting Using 3D Generative Adversarial Network and Recurrent Convolutional Networks.

Weiyue Wang Qiangui Huang Suya You Chao Yang Ulrich Neumann

Polynomial Solvers for Saturated Ideals.

Viktor Larsson Kalle Åström Magnus Oskarsson

Linear Differential Constraints for Photo-Polarimetric Height Estimation.

Silvia Tozza William A. P. Smith Dizhong Zhu Ravi Ramamoorthi Edwin R. Hancock

Turning Corners into Cameras: Principles and Methods.

Katherine L. Bouman Vickie Ye Adam B. Yedidia Frédo Durand Gregory W. Wornell Antonio Torralba William T. Freeman

Material Editing Using a Physically Based Rendering Network.

Guilin Liu Duygu Ceylan Ersin Yumer Jimei Yang Jyh-Ming Lien

Neural EPI-Volume Networks for Shape from Light Field.

Stefan Heber Wei Yu Thomas Pock

Learning to Synthesize a 4D RGBD Light Field from a Single Image.

Pratul P. Srinivasan Tongzhou Wang Ashwin Sreelal Ravi Ramamoorthi Ren Ng

GANs for Biological Image Synthesis.

Anton Osokin Anatole Chessel Rafael Edgardo Carazo-Salas Federico Vaggi

Unpaired Image-to-Image Translation Using Cycle-Consistent Adversarial Networks.

Jun-Yan Zhu Taesung Park Phillip Isola Alexei A. Efros

Playing for Benchmarks.

Stephan R. Richter Zeeshan Hayder Vladlen Koltun

Deep TextSpotter: An End-to-End Trainable Scene Text Localization and Recognition Framework.

Michal Busta Lukas Neumann Jiri Matas

Raster-to-Vector: Revisiting Floorplan Transformation.

Chen Liu Jiajun Wu Pushmeet Kohli Yasutaka Furukawa

Deep Cropping via Attention Box Prediction and Aesthetics Assessment.

Wenguan Wang Jianbing Shen

Am I a Baller? Basketball Performance Assessment from First-Person Videos.

Gedas Bertasius Hyun Soo Park Stella X. Yu Jianbo Shi

Pixel-Level Matching for Video Object Segmentation Using Convolutional Neural Networks.

Jae Shin Yoon François Rameau Junsik Kim Seokju Lee Seunghak Shin In So Kweon

Common Action Discovery and Localization in Unconstrained Videos.

Jiong Yang Junsong Yuan

Lattice Long Short-Term Memory for Human Action Recognition.

Lin Sun Kui Jia Kevin Chen Dit-Yan Yeung Bertram E. Shi Silvio Savarese

What Actions are Needed for Understanding Human Actions in Videos?

Gunnar A. Sigurdsson Olga Russakovsky Abhinav Gupta

Joint Discovery of Object States and Manipulation Actions.

Jean-Baptiste Alayrac Josef Sivic Ivan Laptev Simon Lacoste-Julien

View Adaptive Recurrent Neural Networks for High Performance Human Action Recognition from Skeleton Data.

Pengfei Zhang Cuiling Lan Junliang Xing Wenjun Zeng Jianru Xue Nanning Zheng

Bringing Background into the Foreground: Making All Classes Equal in Weakly-Supervised Video Semantic Segmentation.

Fatemehsadat Saleh Mohammad Sadegh Ali Akbarian Mathieu Salzmann Lars Petersson Jose M. Alvarez

Truncating Wide Networks Using Binary Tree Architectures.

Yan Zhang Mete Ozay Shuohao Li Takayuki Okatani

Octree Generating Networks: Efficient Convolutional Architectures for High-resolution 3D Outputs.

Maxim Tatarchenko Alexey Dosovitskiy Thomas Brox

Factorized Bilinear Models for Image Recognition.

Yanghao Li Naiyan Wang Jiaying Liu Xiaodi Hou

Is Second-Order Information Helpful for Large-Scale Visual Recognition?

Peihua Li Jiangtao Xie Qilong Wang Wangmeng Zuo

A Self-Balanced Min-Cut Algorithm for Image Clustering.

Xiaojun Chen Joshua Zhexue Huang Feiping Nie Renjie Chen Qingyao Wu

Multi-task Self-Supervised Visual Learning.

Carl Doersch Andrew Zisserman

Privacy-Preserving Visual Learning Using Doubly Permuted Homomorphic Encryption.

Ryo Yonetani Vishnu Naresh Boddeti Kris M. Kitani Yoichi Sato

Scale-Adaptive Convolutions for Scene Parsing.

Rui Zhang Sheng Tang Yongdong Zhang Jintao Li Shuicheng Yan

Curriculum Domain Adaptation for Semantic Segmentation of Urban Scenes.

Yang Zhang Philip David Boqing Gong

Learned Watershed: End-to-End Learning of Seeded Segmentation.

Steffen Wolf Lukas Schott Ullrich Köthe Fred A. Hamprecht

Open Vocabulary Scene Parsing.

Hang Zhao Xavier Puig Bolei Zhou Sanja Fidler Antonio Torralba

No More Discrimination: Cross City Adaptation of Road Scene Segmenters.

Yi-Hsin Chen Wei-Yu Chen Yu-Ting Chen Bo-Cheng Tsai Yu-Chiang Frank Wang Min Sun

Joint Learning of Object and Action Detectors.

Vicky Kalogeiton Philippe Weinzaepfel Vittorio Ferrari Cordelia Schmid

A Two Stream Siamese Convolutional Neural Network for Person Re-identification.

Dahjung Chung Khalid Tahboub Edward J. Delp

An Analysis of Visual Question Answering Algorithms.

Kushal Kafle Christopher Kanan

Unsupervised Learning of Important Objects from First-Person Videos.

Gedas Bertasius Hyun Soo Park Stella X. Yu Jianbo Shi

VPGNet: Vanishing Point Guided Network for Lane and Road Marking Detection and Recognition.

Seokju Lee Junsik Kim Jae Shin Yoon Seunghak Shin Oleksandr Bailo Namil Kim Tae-Hee Lee Hyun Seok Hong Seung-Hoon Han In So Kweon

Chained Cascade Network for Object Detection.

Wanli Ouyang Kun Wang Xin Zhu Xiaogang Wang

Phrase Localization and Visual Relationship Detection with Comprehensive Image-Language Cues.

Bryan A. Plummer Arun Mallya Christopher M. Cervantes Julia Hockenmaier Svetlana Lazebnik

DSOD: Learning Deeply Supervised Object Detectors from Scratch.

Zhiqiang Shen Zhuang Liu Jianguo Li Yu-Gang Jiang Yurong Chen Xiangyang Xue

Learning from Noisy Labels with Distillation.

Yuncheng Li Jianchao Yang Yale Song Liangliang Cao Jiebo Luo Li-Jia Li

Learning Deep Neural Networks for Vehicle Re-ID with Visual-spatio-Temporal Path Proposals.

Yantao Shen Tong Xiao Hongsheng Li Shuai Yi Xiaogang Wang

Identity-Aware Textual-Visual Matching with Latent Co-attention.

Shuang Li Tong Xiao Hongsheng Li Wei Yang Xiaogang Wang

Hierarchical Multimodal LSTM for Dense Visual-Semantic Embedding.

Zhenxing Niu Mo Zhou Le Wang Xinbo Gao Gang Hua

See the Glass Half Full: Reasoning About Liquid Containers, Their Volume and Content.

Roozbeh Mottaghi Connor Schenck Dieter Fox Ali Farhadi

Generating High-Quality Crowd Density Maps Using Contextual Pyramid CNNs.

Vishwanath A. Sindagi Vishal M. Patel

Class Rectification Hard Mining for Imbalanced Deep Learning.

Qi Dong Shaogang Gong Xiatian Zhu

Soft Proposal Networks for Weakly Supervised Object Localization.

Yi Zhu Yanzhao Zhou Qixiang Ye Qiang Qiu Jianbin Jiao

SCNet: Learning Semantic Correspondence.

Kai Han Rafael S. Rezende Bumsub Ham Kwan-Yee K. Wong Minsu Cho Cordelia Schmid Jean Ponce

Multi-modal Factorized Bilinear Pooling with Co-attention Learning for Visual Question Answering.

Zhou Yu Jun Yu Jianping Fan Dacheng Tao

VQS: Linking Segmentations to Questions and Answers for Supervised Attention in VQA and Question-Focused Semantic Segmentation.

Chuang Gan Yandong Li Haoxiang Li Chen Sun Boqing Gong

Temporal Dynamic Graph LSTM for Action-Driven Video Object Detection.

Yuan Yuan Xiaodan Liang Xiaolong Wang Dit-Yan Yeung Abhinav Gupta

ScaleNet: Guiding Object Proposal Generation in Supermarkets and Beyond.

Siyuan Qiao Wei Shen Weichao Qiu Chenxi Liu Alan L. Yuille

Learning Proximal Operators: Using Denoising Networks for Regularizing Inverse Imaging Problems.

Tim Meinhardt Michael Möller Caner Hazirbas Daniel Cremers

High Order Tensor Formulation for Convolutional Sparse Coding.

Adel Bibi Bernard Ghanem

Learning Dynamic Siamese Network for Visual Object Tracking.

Qing Guo Wei Feng Ce Zhou Rui Huang Liang Wan Song Wang

Online Robust Image Alignment via Subspace Learning from Gradient Orientations.

Qingqing Zheng Yi Wang Pheng-Ann Heng

Dual Motion GAN for Future-Flow Embedded Video Prediction.

Xiaodan Liang Lisa Lee Wei Dai Eric P. Xing

PanNet: A Deep Network Architecture for Pan-Sharpening.

Junfeng Yang Xueyang Fu Yuwen Hu Yue Huang Xinghao Ding John W. Paisley

Weakly Supervised Manifold Learning for Dense Semantic Object Correspondence.

Utkarsh Gaur B. S. Manjunath

Transformed Low-Rank Model for Line Pattern Noise Removal.

Yi Chang Luxin Yan Sheng Zhong

Modelling the Scene Dependent Imaging in Cameras with a Deep Neural Network.

Seonghyeon Nam Seon Joo Kim

Joint Convolutional Analysis and Synthesis Sparse Representation for Single Image Layer Separation.

Shuhang Gu Deyu Meng Wangmeng Zuo Lei Zhang

Learning Gaze Transitions from Depth to Improve Video Saliency Estimation.

George Leifman Dmitry Rudoy Tristan Swedish Eduardo Bayro-Corrochano Ramesh Raskar

Wavelet-SRNet: A Wavelet-Based CNN for Multi-scale Face Super Resolution.

Huaibo Huang Ran He Zhenan Sun Tieniu Tan

Be Your Own Prada: Fashion Synthesis with Structural Coherence.

Shizhan Zhu Sanja Fidler Raquel Urtasun Dahua Lin Chen Change Loy

Super-Trajectory for Video Segmentation.

Wenguan Wang Jianbing Shen Jianwen Xie Fatih Porikli

Self-Paced Kernel Estimation for Robust Blind Image Deblurring.

Dong Gong Mingkui Tan Yanning Zhang Anton van den Hengel Qinfeng Shi

Infant Footprint Recognition.

Eryun Liu

Anchored Regression Networks Applied to Age Estimation and Super Resolution.

Eirikur Agustsson Radu Timofte Luc Van Gool

Recurrent 3D-2D Dual Learning for Large-Pose Facial Landmark Detection.

Shengtao Xiao Jiashi Feng Luoqi Liu Xuecheng Nie Wei Wang Shuicheng Yan Ashraf A. Kassim

Reconstruction-Based Disentanglement for Pose-Invariant Face Recognition.

Xi Peng Xiang Yu Kihyuk Sohn Dimitris N. Metaxas Manmohan Chandraker

Composite Focus Measure for High Quality Depth Maps.

Parikshit Sakurikar P. J. Narayanan

Unsupervised Adaptation for Deep Stereo.

Alessio Tonioni Matteo Poggi Stefano Mattoccia Luigi di Stefano

Click Here: Human-Localized Keypoints as Guidance for Viewpoint Estimation.

Ryan Szeto Jason J. Corso

Learned Multi-patch Similarity.

Wilfried Hartmann Silvano Galliani Michal Havlena Luc Van Gool Konrad Schindler

Unrestricted Facial Geometry Reconstruction Using Image-to-Image Translation.

Matan Sela Elad Richardson Ron Kimmel

Unsupervised Learning of Stereo Matching.

Chao Zhou Hong Zhang Xiaoyong Shen Jiaya Jia

Surface Normals in the Wild.

Weifeng Chen Donglai Xiang Jia Deng

Toward Perceptually-Consistent Stereo: A Scanline Study.

Jialiang Wang Daniel Glasner Todd E. Zickler

Learning for Active 3D Mapping.

Karel Zimmermann Tomás Petrícek Vojtech Salanský Tomás Svoboda

Unsupervised Creation of Parameterized Avatars.

Lior Wolf Yaniv Taigman Adam Polyak

SSD-6D: Making RGB-Based 3D Detection and 6D Pose Estimation Great Again.

Wadim Kehl Fabian Manhardt Federico Tombari Slobodan Ilic Nassir Navab

Photographic Image Synthesis with Cascaded Refinement Networks.

Qifeng Chen Vladlen Koltun

Arbitrary Style Transfer in Real-Time with Adaptive Instance Normalization.

Xun Huang Serge J. Belongie

WeText: Scene Text Detection under Weak Supervision.

Shangxuan Tian Shijian Lu Chongshou Li

Adversarial Image Perturbation for Privacy Protection A Game Theory Perspective.

Seong Joon Oh Mario Fritz Bernt Schiele

ChromaTag: A Colored Marker and Fast Detection Algorithm.

Joseph DeGol Timothy Bretl Derek Hoiem

Automatic Spatially-Aware Fashion Concept Discovery.

Xintong Han Zuxuan Wu Phoenix X. Huang Xiao Zhang Menglong Zhu Yuan Li Yang Zhao Larry S. Davis

Spatio-Temporal Person Retrieval via Natural Language Queries.

Masataka Yamaguchi Kuniaki Saito Yoshitaka Ushiku Tatsuya Harada

Adaptive RNN Tree for Large-Scale Human Action Recognition.

Wenbo Li Longyin Wen Ming-Ching Chang Ser-Nam Lim Siwei Lyu

Following Gaze in Video.

Adrià Recasens Carl Vondrick Aditya Khosla Antonio Torralba

Attentive Semantic Video Generation Using Captions.

Tanya Marwah Gaurav Mittal Vineeth N. Balasubramanian

Primary Video Object Segmentation via Complementary CNNs and Neighborhood Reversible Flow.

Jia Li Anlin Zheng Xiaowu Chen Bin Zhou

Video Fill In the Blank Using LR/RL LSTMs with Spatial-Temporal Attentions.

Amir Mazaheri Dong Zhang Mubarak Shah

Infinite Latent Feature Selection: A Probabilistic Latent Graph-Based Ranking Approach.

Giorgio Roffo Simone Melzi Umberto Castellani Alessandro Vinciarelli

Channel Pruning for Accelerating Very Deep Neural Networks.

Yihui He Xiangyu Zhang Jian Sun

Genetic CNN.

Lingxi Xie Alan L. Yuille

Adversarial Examples for Semantic Segmentation and Object Detection.

Cihang Xie Jianyu Wang Zhishuai Zhang Yuyin Zhou Lingxi Xie Alan L. Yuille

SORT: Second-Order Response Transform for Visual Recognition.

Yan Wang Lingxi Xie Chenxi Liu Siyuan Qiao Ya Zhang Wenjun Zhang Qi Tian Alan L. Yuille

Fine-Grained Recognition in the Wild: A Multi-task Domain Adaptation Approach.

Timnit Gebru Judy Hoffman Li Fei-Fei

Weakly Supervised Learning of Deep Metrics for Stereo Reconstruction.

Stepan Tulyakov Anton Ivanov François Fleuret

Transitive Invariance for Self-Supervised Visual Representation Learning.

Xiaolong Wang Kaiming He Abhinav Gupta

Encoder Based Lifelong Learning.

Amal Rannen Triki Rahaf Aljundi Matthew B. Blaschko Tinne Tuytelaars

Cascaded Feature Network for Semantic Segmentation of RGB-D Images.

Di Lin Guangyong Chen Daniel Cohen-Or Pheng-Ann Heng Hui Huang

Cut, Paste and Learn: Surprisingly Easy Synthesis for Instance Detection.

Debidatta Dwibedi Ishan Misra Martial Hebert

Structured Attentions for Visual Question Answering.

Chen Zhu Yanpeng Zhao Shuaiyi Huang Kewei Tu Yi Ma

Learning Feature Pyramids for Human Pose Estimation.

Wei Yang Shuang Li Wanli Ouyang Hongsheng Li Xiaogang Wang

Recurrent Multimodal Interaction for Referring Image Segmentation.

Chenxi Liu Zhe Lin Xiaohui Shen Jimei Yang Xin Lu Alan L. Yuille

Scene Graph Generation from Objects, Phrases and Region Captions.

Yikang Li Wanli Ouyang Bolei Zhou Kun Wang Xiaogang Wang

Generative Modeling of Audible Shapes for Object Perception.

Zhoutong Zhang Jiajun Wu Qiujia Li Zhengjia Huang James Traer Josh H. McDermott Joshua B. Tenenbaum William T. Freeman

Areas of Attention for Image Captioning.

Marco Pedersoli Thomas Lucas Cordelia Schmid Jakob Verbeek

Attributes2Classname: A Discriminative Model for Attribute-Based Unsupervised Zero-Shot Learning.

Berkan Demirel Ramazan Gokberk Cinbis Nazli Ikizler-Cinbis

An Empirical Study of Language CNN for Image Captioning.

Jiuxiang Gu Gang Wang Jianfei Cai Tsuhan Chen

Adversarial PoseNet: A Structure-Aware Convolutional Network for Human Pose Estimation.

Yu Chen Chunhua Shen Xiu-Shen Wei Lingqiao Liu Jian Yang

BAM! The Behance Artistic Media Dataset for Recognition Beyond Photography.

Michael J. Wilber Chen Fang Hailin Jin Aaron Hertzmann John P. Collomosse Serge J. Belongie

DeepContext: Context-Encoding Neural Pathways for 3D Holistic Scene Understanding.

Yinda Zhang Mingru Bai Pushmeet Kohli Shahram Izadi Jianxiong Xiao

Sublabel-Accurate Discretization of Nonconvex Free-Discontinuity Problems.

Thomas Möllenhoff Daniel Cremers

ProbFlow: Joint Optical Flow and Uncertainty Estimation.

Anne S. Wannenwetsch Margret Keuper Stefan Roth

Predicting Human Activities Using Stochastic Grammar.

Siyuan Qi Siyuan Huang Ping Wei Song-Chun Zhu

Real-Time Hand Tracking under Occlusion from an Egocentric RGB-D Sensor.

Franziska Mueller Dushyant Mehta Oleksandr Sotnychenko Srinath Sridhar Dan Casas Christian Theobalt

Robust Object Tracking Based on Temporal and Spatial Deep Networks.

Zhu Teng Junliang Xing Qiang Wang Congyan Lang Songhe Feng Yi Jin

Learning Background-Aware Correlation Filters for Visual Tracking.

Hamed Kiani Galoogahi Ashton Fagg Simon Lucey

Need for Speed: A Benchmark for Higher Frame Rate Object Tracking.

Hamed Kiani Galoogahi Ashton Fagg Chen Huang Deva Ramanan Simon Lucey

SHaPE: A Novel Graph Theoretic Algorithm for Making Consensus-Based Decisions in Person Re-identification Systems.

Arko Barman Shishir K. Shah

Coherent Online Video Style Transfer.

Dongdong Chen Jing Liao Lu Yuan Nenghai Yu Gang Hua

Multi-channel Weighted Nuclear Norm Minimization for Real Color Image Denoising.

Jun Xu Lei Zhang David Zhang Xiangchu Feng

On-demand Learning for Deep Image Restoration.

Ruohan Gao Kristen Grauman

Video Deblurring via Semantic Segmentation and Pixel-Wise Non-linear Kernel.

Wenqi Ren Jinshan Pan Xiaochun Cao Ming-Hsuan Yang

Learning Discriminative Data Fitting Functions for Blind Image Deblurring.

Jinshan Pan Jiangxin Dong Yu-Wing Tai Zhixun Su Ming-Hsuan Yang

Visual Relationship Detection with Internal and External Linguistic Knowledge Distillation.

Ruichi Yu Ang Li Vlad I. Morariu Larry S. Davis

Delving into Salient Object Subitizing and Detection.

Shengfeng He Jianbo Jiao Xiaodan Zhang Guoqiang Han Rynson W. H. Lau

Look, Perceive and Segment: Finding the Salient Objects in Images via Two-stream Fixation-Semantic CNNs.

Xiaowu Chen Anlin Zheng Jia Li Feng Lu

RankIQA: Learning from Rankings for No-Reference Image Quality Assessment.

Xialei Liu Joost van de Weijer Andrew D. Bagdanov

Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric CNN Regression.

Aaron S. Jackson Adrian Bulat Vasileios Argyriou Georgios Tzimiropoulos

How Far are We from Solving the 2D & 3D Face Alignment Problem? (and a Dataset of 230, 000 3D Facial Landmarks).

Adrian Bulat Georgios Tzimiropoulos

Ensemble Deep Learning for Skeleton-Based Action Recognition Using Temporal Sliding LSTM Networks.

Inwoong Lee Doyoung Kim Seoungyoon Kang Sanghoon Lee

Real Time Eye Gaze Tracking with 3D Deformable Eye-Face Model.

Kang Wang Qiang Ji

Cross-View Asymmetric Metric Learning for Unsupervised Person Re-Identification.

Hong-Xing Yu Ancong Wu Wei-Shi Zheng

Catadioptric HyperSpectral Light Field Imaging.

Yujia Xue Kang Zhu Qiang Fu Xilin Chen Jingyi Yu

Reconfiguring the Imaging Pipeline for Computer Vision.

Mark Buckler Suren Jayasuriya Adrian Sampson

Focal Track: Depth and Accommodation with Oscillating Lens Deformation.

Qi Guo Emma Alexander Todd E. Zickler

Corner-Based Geometric Calibration of Multi-focus Plenoptic Cameras.

Sotiris Nousias François Chadebecq Jonas Pichat Pearse A. Keane Sébastien Ourselin Christos Bergeles

Rolling-Shutter-Aware Differential SfM and Image Rectification.

Bingbing Zhuang Loong-Fah Cheong Gim Hee Lee

Surface Registration via Foliation.

Xiaopeng Zheng Chengfeng Wen Na Lei Ming Ma Xianfeng Gu

"Maximizing Rigidity" Revisited: A Convex Programming Approach for Generic 3D Shape Reconstruction from Multiple Perspective Views.

Pan Ji Hongdong Li Yuchao Dai Ian D. Reid

Quasiconvex Plane Sweep for Triangulation with Outliers.

Qianggong Zhang Tat-Jun Chin David Suter

BodyFusion: Real-Time Capture of Human Motion and Surface Geometry Using a Single Depth Camera.

Tao Yu Kaiwen Guo Feng Xu Yuan Dong Zhaoqi Su Jianhui Zhao Jianguo Li Qionghai Dai Yebin Liu

3D-PRNN: Generating Shape Primitives with Recurrent Neural Networks.

Chuhang Zou Ersin Yumer Jimei Yang Duygu Ceylan Derek Hoiem

Local-to-Global Point Cloud Registration Using a Dictionary of Viewpoint Descriptors.

David Avidar David Malah Meir Barzohar

Rolling Shutter Correction in Manhattan World.

Pulak Purkait Christopher Zach Ales Leonardis

Improved Image Captioning via Policy Gradient optimization of SPIDEr.

Siqi Liu Zhenhai Zhu Ning Ye Sergio Guadarrama Kevin Murphy

Escape from Cells: Deep Kd-Networks for the Recognition of 3D Point Cloud Models.

Roman Klokov Victor S. Lempitsky

A Generative Model of People in Clothing.

Christoph Lassner Gerard Pons-Moll Peter V. Gehler

Revisiting Unreasonable Effectiveness of Data in Deep Learning Era.

Chen Sun Abhinav Shrivastava Saurabh Singh Abhinav Gupta

SuBiC: A Supervised, Structured Binary Code for Image Search.

Himalaya Jain Joaquin Zepeda Patrick Pérez Rémi Gribonval

Query-Guided Regression Network with Context Policy for Phrase Grounding.

Kan Chen Rama Kovvuri Ram Nevatia

Hard-Aware Deeply Cascaded Embedding.

Yuhui Yuan Kuiyuan Yang Chao Zhang

Learning to Reason: End-to-End Module Networks for Visual Question Answering.

Ronghang Hu Jacob Andreas Marcus Rohrbach Trevor Darrell Kate Saenko

Beyond Planar Symmetry: Modeling Human Perception of Reflection and Rotation Symmetries in the Wild.

Christopher Funk Yanxi Liu

FoveaNet: Perspective-Aware Urban Scene Parsing.

Xin Li Zequn Jie Wei Wang Changsong Liu Jimei Yang Xiaohui Shen Zhe Lin Qiang Chen Shuicheng Yan Jiashi Feng

Ensemble Diffusion for Retrieval.

Song Bai Zhichao Zhou Jingdong Wang Xiang Bai Longin Jan Latecki Qi Tian

Deformable Convolutional Networks.

Jifeng Dai Haozhi Qi Yuwen Xiong Yi Li Guodong Zhang Han Hu Yichen Wei

Open Set Domain Adaptation.

Pau Panareda Busto Juergen Gall

Deep Direct Regression for Multi-oriented Scene Text Detection.

Wenhao He Xu-Yao Zhang Fei Yin Cheng-Lin Liu

Complex Event Detection by Identifying Reliable Shots from Untrimmed Videos.

Hehe Fan Xiaojun Chang De Cheng Yi Yang Dong Xu Alexander G. Hauptmann

Compressive Quantization for Fast Object Instance Search in Videos.

Tan Yu Zhenzhen Wang Junsong Yuan

Learning Long-Term Dependencies for Action Recognition with a Biologically-Inspired Deep Network.

Yemin Shi Yonghong Tian Yaowei Wang Wei Zeng Tiejun Huang

Dense-Captioning Events in Videos.

Ranjay Krishna Kenji Hata Frederic Ren Li Fei-Fei Juan Carlos Niebles

Unsupervised Action Discovery and Localization in Videos.

Khurram Soomro Mubarak Shah

SegFlow: Joint Learning for Video Object Segmentation and Optical Flow.

Jingchun Cheng Yi-Hsuan Tsai Shengjin Wang Ming-Hsuan Yang

A Read-Write Memory Network for Movie Story Understanding.

Seil Na Sangho Lee Jisung Kim Gunhee Kim

Unsupervised Representation Learning by Sorting Sequences.

Hsin-Ying Lee Jia-Bin Huang Maneesh Singh Ming-Hsuan Yang

Coordinating Filters for Faster Deep Neural Networks.

Wei Wen Cong Xu Chunpeng Wu Yandan Wang Yiran Chen Hai Li

Predicting Deeper into the Future of Semantic Segmentation.

Pauline Luc Natalia Neverova Camille Couprie Jakob Verbeek Yann LeCun

Personalized Image Aesthetics.

Jian Ren Xiaohui Shen Zhe L. Lin Radomír Mech David J. Foran

Image-Based Localization Using LSTMs for Structured Feature Correlation.

Florian Walch Caner Hazirbas Laura Leal-Taixé Torsten Sattler Sebastian Hilsenbeck Daniel Cremers

Grad-CAM: Visual Explanations from Deep Networks via Gradient-Based Localization.

Ramprasaath R. Selvaraju Michael Cogswell Abhishek Das Ramakrishna Vedantam Devi Parikh Dhruv Batra

Look, Listen and Learn.

Relja Arandjelovic Andrew Zisserman

When Unsupervised Domain Adaptation Meets Tensor Representations.

Hao Lu Lei Zhang Zhiguo Cao Wei Wei Ke Xian Chunhua Shen Anton van den Hengel

Towards Context-Aware Interaction Recognition for Visual Relationship Detection.

Bohan Zhuang Lingqiao Liu Chunhua Shen Ian D. Reid

Embedding 3D Geometric Features for Rigid Object Part Segmentation.

Yafei Song Xiaowu Chen Jia Li Qinping Zhao

Recurrent Scale Approximation for Object Detection in CNN.

Yu Liu Hongyang Li Junjie Yan Fangyin Wei Xiaogang Wang Xiaoou Tang

Exploiting Multi-grain Ranking Constraints for Precisely Searching Visually-similar Vehicles.

Ke Yan Yonghong Tian Yaowei Wang Wei Zeng Tiejun Huang

Increasing CNN Robustness to Occlusions by Reducing Filter Support.

Elad Osherov Michael Lindenbaum

VegFru: A Domain-Specific Dataset for Fine-Grained Visual Categorization.

Saihui Hou Yushan Feng Zilei Wang

Attribute Recognition by Joint Recurrent Learning of Context and Correlation.

Jingya Wang Xiatian Zhu Shaogang Gong Wei Li

Show, Adapt and Tell: Adversarial Training of Cross-Domain Image Captioner.

Tseng-Hung Chen Yuan-Hong Liao Ching-Yao Chuang Wan Ting Hsu Jianlong Fu Min Sun

Higher-Order Integration of Hierarchical Convolutional Activations for Fine-Grained Visual Categorization.

Sijia Cai Wangmeng Zuo Lei Zhang

DualNet: Learn Complementary Features for Image Recognition.

Saihui Hou Xu Liu Zilei Wang

Neural Person Search Machines.

Hao Liu Jiashi Feng Zequn Jie Jayashree Karlekar Bo Zhao Meibin Qi Jianguo Jiang Shuicheng Yan

Visual Semantic Planning Using Deep Successor Representations.

Yuke Zhu Daniel Gordon Eric Kolve Dieter Fox Li Fei-Fei Abhinav Gupta Roozbeh Mottaghi Ali Farhadi

Deep Determinantal Point Process for Large-Scale Multi-label Classification.

Pengtao Xie Ruslan Salakhutdinov Luntian Mou Eric P. Xing

Multi-label Image Recognition by Recurrently Discovering Attentional Regions.

Zhouxia Wang Tianshui Chen Guanbin Li Ruijia Xu Liang Lin

Recurrent Models for Situation Recognition.

Arun Mallya Svetlana Lazebnik

SafetyNet: Detecting and Rejecting Adversarial Examples Robustly.

Jiajun Lu Theerasit Issaranon David A. Forsyth

MIHash: Online Hashing with Mutual Information.

Fatih Çakir Kun He Sarah Adel Bargal Stan Sclaroff

DeNet: Scalable Real-Time Object Detection with Directed Sparse Sampling.

Lachlan Tychsen-Smith Lars Petersson

Reasoning About Fine-Grained Attribute Phrases Using Reference Games.

Jong-Chyi Su Chenyun Wu Huaizu Jiang Subhransu Maji

Flow-Guided Feature Aggregation for Video Object Detection.

Xizhou Zhu Yujie Wang Jifeng Dai Lu Yuan Yichen Wei

Towards 3D Human Pose Estimation in the Wild: A Weakly-Supervised Approach.

Xingyi Zhou Qixing Huang Xiao Sun Xiangyang Xue Yichen Wei

Fashion Forward: Forecasting Visual Style in Fashion.

Ziad Al-Halah Rainer Stiefelhagen Kristen Grauman

Orientation Invariant Feature Embedding and Spatial Temporal Regularization for Vehicle Re-identification.

Zhongdao Wang Luming Tang Xihui Liu Zhuliang Yao Shuai Yi Jing Shao Junjie Yan Shengjin Wang Hongsheng Li Xiaogang Wang

Benchmarking and Error Diagnosis in Multi-instance Pose Estimation.

Matteo Ruggero Ronchi Pietro Perona

No Fuss Distance Metric Learning Using Proxies.

Yair Movshovitz-Attias Alexander Toshev Thomas K. Leung Sergey Ioffe Saurabh Singh

HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis.

Xihui Liu Haiyu Zhao Maoqing Tian Lu Sheng Jing Shao Shuai Yi Junjie Yan Xiaogang Wang

A Revisit of Sparse Coding Based Anomaly Detection in Stacked RNN Framework.

Weixin Luo Wen Liu Shenghua Gao

Non-convex Rank/Sparsity Regularization and Local Minima.

Carl Olsson Marcus Carlsson Fredrik Andersson Viktor Larsson

Tracking as Online Decision-Making: Learning a Policy from Streaming Videos with Reinforcement Learning.

James Steven Supancic III Deva Ramanan

MirrorFlow: Exploiting Symmetries in Joint Optical Flow and Occlusion Estimation.

Junhwa Hur Stefan Roth

Tracking the Untrackable: Learning to Track Multiple Cues with Long-Term Dependencies.

Amir Sadeghian Alexandre Alahi Silvio Savarese

PathTrack: Fast Trajectory Annotation with Path Supervision.

Santiago Manen Michael Gygli Dengxin Dai Luc Van Gool

Encouraging LSTMs to Anticipate Actions Very Early.

Mohammad Sadegh Ali Akbarian Fatemehsadat Saleh Mathieu Salzmann Basura Fernando Lars Petersson Lars Andersson

Deep Occlusion Reasoning for Multi-camera Multi-target Detection.

Pierre Baqué François Fleuret Pascal Fua

Video Frame Interpolation via Adaptive Separable Convolution.

Simon Niklaus Long Mai Feng Liu

Learning to Super-Resolve Blurry Face and Text Images.

Xiangyu Xu Deqing Sun Jinshan Pan Yujin Zhang Hanspeter Pfister Ming-Hsuan Yang

Joint Adaptive Sparsity and Low-Rankness on the Fly: An Online Tensor Reconstruction Scheme for Video Denoising.

Bihan Wen Yanjun Li Luke Pfister Yoram Bresler

Learning Blind Motion Deblurring.

Patrick Wieschollek Michael Hirsch Bernhard Schölkopf Hendrik P. A. Lensch

Zero-Order Reverse Filtering.

Xin Tao Chao Zhou Xiaoyong Shen Jue Wang Jiaya Jia

Learning Uncertain Convolutional Features for Accurate Saliency Detection.

Pingping Zhang Dong Wang Huchuan Lu Hongyu Wang Baocai Yin

Amulet: Aggregating Multi-level Convolutional Features for Salient Object Detection.

Pingping Zhang Dong Wang Huchuan Lu Hongyu Wang Xiang Ruan

S^3FD: Single Shot Scale-Invariant Face Detector.

Shifeng Zhang Xiangyu Zhu Zhen Lei Hailin Shi Xiaobo Wang Stan Z. Li

An Optimal Transportation Based Univariate Neuroimaging Index.

Liang Mi Wen Zhang Junwei Zhang Yonghui Fan Dhruman Goradia Kewei Chen Eric M. Reiman Xianfeng Gu Yalin Wang

A Geometric Framework for Statistical Analysis of Trajectories with Distinct Temporal Spans.

Rudrasis Chakraborty Vikas Singh Nagesh Adluru Baba C. Vemuri

Joint Layout Estimation and Global Multi-view Registration for Indoor Reconstruction.

Jeong-Kyun Lee Jae-Won Yea Min-Gyu Park Kuk-Jin Yoon

Learning Compact Geometric Features.

Marc Khoury Qian-Yi Zhou Vladlen Koltun

Colored Point Cloud Registration Revisited.

Jaesik Park Qian-Yi Zhou Vladlen Koltun

CAD Priors for Accurate and Flexible Instance Reconstruction.

Tolga Birdal Slobodan Ilic

Real-Time Monocular Pose Estimation of 3D Objects Using Temporally Consistent Local Color Histograms.

Henning Tjaden Ulrich Schwanecke Elmar Schömer

Temporal Shape Super-Resolution by Intra-frame Motion Encoding Using High-fps Structured Light.

Yuki Shiba Satoshi Ono Ryo Furukawa Shinsaku Hiura Hiroshi Kawasaki

Learning Policies for Adaptive Tracking with Deep Feature Cascades.

Chen Huang Simon Lucey Deva Ramanan

Temporal Tessellation: A Unified Approach for Video Analysis.

Dotan Kaufman Gil Levi Tal Hassner Lior Wolf

High-Resolution Shape Completion Using Deep Neural Networks for Global Structure and Local Geometry Inference.

Xiaoguang Han Zhen Li Haibin Huang Evangelos Kalogerakis Yizhou Yu

Using Sparse Elimination for Solving Minimal Problems in Computer Vision.

Janne Heikkilä

End-to-End Learning of Geometry and Context for Deep Stereo Regression.

Alex Kendall Hayk Martirosyan Saumitro Dasgupta Peter Henry

Rethinking Reprojection: Closing the Loop for Pose-Aware Shape Reconstruction from a Single Image.

Rui Zhu Hamed Kiani Galoogahi Chaoyang Wang Simon Lucey

Anticipating Daily Intention Using On-wrist Motion Triggered Sensing.

Tz-Ying Wu Ting-An Chien Cheng-Sheng Chan Chan-Wei Hu Min Sun

Practical Projective Structure from Motion (P2SfM).

Ludovic Magerand Alessio Del Bue

Distributed Very Large Scale Bundle Adjustment by Global Camera Consensus.

Runze Zhang Siyu Zhu Tian Fang Long Quan

A Lightweight Approach for On-the-Fly Reflectance Estimation.

Kihwan Kim Jinwei Gu Stephen Tyree Pavlo Molchanov Matthias Nießner Jan Kautz

Robust Pseudo Random Fields for Light-Field Stereo Matching.

Chao-Tsung Huang

Globally-Optimal Inlier Set Maximisation for Simultaneous Camera Pose and Feature Correspondence.

Dylan Campbell Lars Petersson Laurent Kneip Hongdong Li