ICML 2018论文列表 - Proceedings of the 35th International Conference on Machine Learning, ICML 2018, Stockholmsmässan, Stockholm, Sweden, July 10-15, 2018.| 数据学习 (DataLearner)

icml 2018 论文列表

Proceedings of the 35th International Conference on Machine Learning, ICML 2018, Stockholmsmässan, Stockholm, Sweden, July 10-15, 2018.

Hierarchical Long-term Video Prediction without Supervision.

Nevan Wichers Ruben Villegas Dumitru Erhan Honglak Lee

Stochastic Variance-Reduced Hamilton Monte Carlo Methods.

Difan Zou Pan Xu Quanquan Gu

Message Passing Stein Variational Gradient Descent.

Jingwei Zhuo Chang Liu Jiaxin Shi Jun Zhu Ning Chen Bo Zhang

Distributed Nonparametric Regression under Communication Constraints.

Yuancheng Zhu John Lafferty

Racing Thompson: an Efficient Algorithm for Thompson Sampling with Non-conjugate Priors.

Yichi Zhou Jun Zhu Jingwei Zhuo

Stochastic Variance-Reduced Cubic Regularized Newton Method.

Dongruo Zhou Pan Xu Quanquan Gu

A Simple Stochastic Variance Reduced Algorithm with Fast Convergence Rates.

Kaiwen Zhou Fanhua Shang James Cheng

Distributed Asynchronous Optimization with Unbounded Delays: How Slow Can You Go?

Zhengyuan Zhou Panayotis Mertikopoulos Nicholas Bambos Peter W. Glynn Yinyu Ye Li-Jia Li Li Fei-Fei

Understanding Generalization and Optimization Performance of Deep CNNs.

Pan Zhou Jiashi Feng

Revealing Common Statistical Behaviors in Heterogeneous Populations.

Andrey Zhitnikov Rotem Mulayoff Tomer Michaeli

A Robust Approach to Sequential Information Theoretic Planning.

Sue Zheng Jason Pacheco John W. Fisher III

Lightweight Stochastic Optimization for Minimizing Finite Sums with Infinite Data.

Shuai Zheng James Tin-Yau Kwok

Composite Marginal Likelihood Methods for Random Utility Models.

Zhibing Zhao Lirong Xia

MSplit LBI: Realizing Feature Selection and Dense Estimation Simultaneously in Few-shot and Zero-shot Learning.

Bo Zhao Xinwei Sun Yanwei Fu Yuan Yao Yizhou Wang

Adversarially Regularized Autoencoders.

Junbo Jake Zhao Yoon Kim Kelly Zhang Alexander M. Rush Yann LeCun

Inter and Intra Topic Structure Learning with Word Embeddings.

He Zhao Lan Du Wray L. Buntine Mingyuan Zhou

Dynamic Regret of Strongly Adaptive Methods.

Lijun Zhang Tianbao Yang Rong Jin Zhi-Hua Zhou

Fully Decentralized Multi-Agent Reinforcement Learning with Networked Agents.

Kaiqing Zhang Zhuoran Yang Han Liu Tong Zhang Tamer Basar

A Primal-Dual Analysis of Global Optimality in Nonconvex Low-Rank Matrix Recovery.

Xiao Zhang Lingxiao Wang Yaodong Yu Quanquan Gu

Noisy Natural Gradient as Variational Inference.

Guodong Zhang Shengyang Sun David Duvenaud Roger B. Grosse

Composable Planning with Attributes.

Amy Zhang Sainbayar Sukhbaatar Adam Lerer Arthur Szlam Rob Fergus

Deep Bayesian Nonparametric Tracking.

Aonan Zhang John W. Paisley

Tropical Geometry of Deep Neural Networks.

Liwen Zhang Gregory Naitzat Lek-Heng Lim

Learning Long Term Dependencies via Fourier Recurrent Units.

Jiong Zhang Yibo Lin Zhao Song Inderjit S. Dhillon

Stabilizing Gradients for Deep Neural Networks via Efficient SVD Parameterization.

Jiong Zhang Qi Lei Inderjit S. Dhillon

Improving the Privacy and Accuracy of ADMM-Based Distributed Algorithms.

Xueru Zhang Mohammad Mahdi Khalili Mingyan Liu

Safe Element Screening for Submodular Function Minimization.

Weizhong Zhang Bin Hong Lin Ma Wei Liu Tong Zhang

High Performance Zero-Memory Overhead Direct Convolutions.

Jiyuan Zhang Franz Franchetti Tze Meng Low

Large-Scale Sparse Inverse Covariance Estimation via Thresholding and Max-Det Matrix Completion.

Richard Y. Zhang Salar Fattahi Somayeh Sojoudi

Fast and Sample Efficient Inductive Matrix Completion via Multi-Phase Procrustes Flow.

Xiao Zhang Simon S. Du Quanquan Gu

Policy Optimization as Wasserstein Gradient Flows.

Ruiyi Zhang Changyou Chen Chunyuan Li Lawrence Carin

Problem Dependent Reinforcement Learning Bounds Which Can Identify Bandit Structure in MDPs.

Andrea Zanette Emma Brunskill

Orthogonal Machine Learning: Power and Limitations.

Ilias Zadik Lester W. Mackey Vasilis Syrgkanis

A Conditional Gradient Framework for Composite Convex Minimization with Applications to Semidefinite Programming.

Alp Yurtsever Olivier Fercoq Francesco Locatello Volkan Cevher

An Efficient Semismooth Newton Based Algorithm for Convex Clustering.

Yancheng Yuan Defeng Sun Kim-Chuan Toh

GraphRNN: Generating Realistic Graphs with Deep Auto-regressive Models.

Jiaxuan You Rex Ying Xiang Ren William L. Hamilton Jure Leskovec

RadialGAN: Leveraging multiple datasets to improve target-specific predictive models using Generative Adversarial Networks.

Jinsung Yoon James Jordon Mihaela van der Schaar

GAIN: Missing Data Imputation using Generative Adversarial Nets.

Jinsung Yoon James Jordon Mihaela van der Schaar

Probably Approximately Metric-Fair Learning.

Gal Yona Guy N. Rothblum

Disentangled Sequential Autoencoder.

Yingzhen Li Stephan Mandt

Semi-Implicit Variational Inference.

Mingzhang Yin Mingyuan Zhou

Byzantine-Robust Distributed Learning: Towards Optimal Statistical Rates.

Dong Yin Yudong Chen Kannan Ramchandran Peter L. Bartlett

Loss Decomposition for Fast Learning in Large Output Spaces.

Ian En-Hsu Yen Satyen Kale Felix X. Yu Daniel Niels Holtmann-Rice Sanjiv Kumar Pradeep Ravikumar

Variable Selection via Penalized Neural Network: a Drop-Out-One Loss Approach.

Mao Ye Yan Sun

Communication-Computation Efficient Gradient Coding.

Min Ye Emmanuel Abbe

Massively Parallel Algorithms and Hardness for Single-Linkage Clustering under ?p Distances.

Grigory Yaroslavtsev Adithya Vadapalli

Hierarchical Text Generation and Planning for Strategic Dialogue.

Denis Yarats Mike Lewis

Yes, but Did It Work?: Evaluating Variational Inference.

Yuling Yao Aki Vehtari Daniel Simpson Andrew Gelman

Mean Field Multi-Agent Reinforcement Learning.

Yaodong Yang Rui Luo Minne Li Ming Zhou Weinan Zhang Jun Wang

Goodness-of-fit Testing for Discrete Distributions via Stein Discrepancy.

Jiasen Yang Qiang Liu Vinayak A. Rao Jennifer Neville

Dependent Relational Gamma Process Models for Longitudinal Networks.

Sikun Yang Heinz Koeppl

Characterizing and Learning Equivalence Classes of Causal DAGs under Interventions.

Karren D. Yang Abigail Katoff Caroline Uhler

Binary Classification with Karmic, Threshold-Quasi-Concave Metrics.

Bowei Yan Oluwasanmi Koyejo Kai Zhong Pradeep Ravikumar

Active Learning with Logged Data.

Songbai Yan Kamalika Chaudhuri Tara Javidi

Causal Bandits with Propagating Inference.

Akihiro Yabe Daisuke Hatano Hanna Sumita Shinji Ito Naonori Kakimura Takuro Fukunaga Ken-ichi Kawarabayashi

A Semantic Loss Function for Deep Learning with Symbolic Knowledge.

Jingyi Xu Zilu Zhang Tal Friedman Yitao Liang Guy Van den Broeck

Continuous and Discrete-time Accelerated Stochastic Mirror Descent for Strongly Convex Functions.

Pan Xu Tianhao Wang Quanquan Gu

Optimal Tuning for Divide-and-conquer Kernel Ridge Regression with Massive Data.

Ganggang Xu Zuofeng Shang Guang Cheng

Nonparametric Regression with Comparisons: Escaping the Curse of Dimensionality with Ordinal Information.

Yichong Xu Hariank Muthakana Sivaraman Balakrishnan Aarti Singh Artur Dubrawski

Learning to Explore via Meta-Policy Gradient.

Tianbing Xu Qiang Liu Liang Zhao Jian Peng

Representation Learning on Graphs with Jumping Knowledge Networks.

Keyulu Xu Chengtao Li Yonglong Tian Tomohiro Sonobe Ken-ichi Kawarabayashi Stefanie Jegelka

Learning Registered Point Processes from Idiosyncratic Observations.

Hongteng Xu Lawrence Carin Hongyuan Zha

Rates of Convergence of Spectral Methods for Graphon Estimation.

Jiaming Xu

Learning Semantic Representations for Unsupervised Domain Adaptation.

Shaoan Xie Zibin Zheng Liang Chen Chuan Chen

Nonoverlap-Promoting Variable Selection.

Pengtao Xie Hongbao Zhang Yichen Zhu Eric P. Xing

Orthogonality-Promoting Distance Metric Learning: Convex Relaxation and Theoretical Analysis.

Pengtao Xie Wei Wu Yichen Zhu Eric P. Xing

Dynamical Isometry and a Mean Field Theory of CNNs: How to Train 10, 000-Layer Vanilla Convolutional Neural Networks.

Lechao Xiao Yasaman Bahri Jascha Sohl-Dickstein Samuel S. Schoenholz Jeffrey Pennington

Model-Level Dual Learning.

Yingce Xia Xu Tan Fei Tian Tao Qin Nenghai Yu Tie-Yan Liu

Bayesian Quadrature for Multiple Related Integrals.

Xiaoyue Xi François-Xavier Briol Mark A. Girolami

Deep k-Means: Re-Training and Parameter Sharing with Harder Cluster Assignments for Compressing Deep Convolutions.

Junru Wu Yue Wang Zhenyu Wu Zhangyang Wang Ashok Veeraraghavan Yingyan Lin

Variance Regularized Counterfactual Risk Minimization via Variational Divergence Minimization.

Hang Wu May D. Wang

Discrete-Continuous Mixtures in Probabilistic Programming: Generalized Semantics and Inference Algorithms.

Yi Wu Siddharth Srivastava Nicholas Hay Simon S. Du Stuart J. Russell

Reinforcing Adversarial Robustness using Model Confidence Induced by Adversarial Training.

Xi Wu Uyeong Jang Jiefeng Chen Lingjiao Chen Somesh Jha

Error Compensated Quantized SGD and its Applications to Large-scale Distributed Optimization.

Jiaxiang Wu Weidong Huang Junzhou Huang Tong Zhang

SQL-Rank: A Listwise Approach to Collaborative Ranking.

Liwei Wu Cho-Jui Hsieh James Sharpnack

Adaptive Exploration-Exploitation Tradeoff for Opportunistic Bandits.

Huasen Wu Xueying Guo Xin Liu

Local Density Estimation in High Dimensions.

Xian Wu Moses Charikar Vishnu Natchu

Provable Defenses against Adversarial Examples via the Convex Outer Adversarial Polytope.

Eric Wong J. Zico Kolter

Towards Fast Computation of Certified Robustness for ReLU Networks.

Tsui-Wei Weng Huan Zhang Hongge Chen Zhao Song Cho-Jui Hsieh Luca Daniel Duane S. Boning Inderjit S. Dhillon

Deep Predictive Coding Network for Object Recognition.

Haiguang Wen Kuan Han Junxing Shi Yizhen Zhang Eugenio Culurciello Zhongming Liu

LEAPSANDBOUNDS: A Method for Approximately Optimal Algorithm Configuration.

Gellért Weisz András György Csaba Szepesvári

Extracting Automata from Recurrent Neural Networks Using Queries and Counterexamples.

Gail Weiss Yoav Goldberg Eran Yahav

Curriculum Learning by Transfer Learning: Theory and Experiments with Deep Networks.

Daphna Weinshall Gad Cohen Dan Amir

Hierarchical Multi-Label Classification Networks.

Jonatas Wehrmann Ricardo Cerri Rodrigo C. Barros

Approximate Leave-One-Out for Fast Parameter Tuning in High Dimensions.

Shuaiwen Wang Wenda Zhou Haihao Lu Arian Maleki Vahab S. Mirrokni

Stein Variational Message Passing for Continuous Graphical Models.

Dilin Wang Zhe Zeng Qiang Liu

Online Convolutional Sparse Coding with Sample-Dependent Dictionary.

Yaqing Wang Quanming Yao James Tin-Yau Kwok Lionel M. Ni

Minimax Concave Penalized Multi-Armed Bandit Model with High-Dimensional Convariates.

Xue Wang Mike Mingcheng Wei Tao Yao

Adversarial Distillation of Bayesian Neural Network Posteriors.

Kuan-Chieh Wang Paul Vicol James Lucas Li Gu Roger B. Grosse Richard S. Zemel

Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-to-End Speech Synthesis.

Yuxuan Wang Daisy Stanton Yu Zhang R. J. Skerry-Ryan Eric Battenberg Joel Shor Ying Xiao Ye Jia Fei Ren Rif A. Saurous

Provable Variable Selection for Streaming Features.

Jing Wang Jie Shen Ping Li

A Fast and Scalable Joint Estimator for Integrating Additional Knowledge in Learning Multiple Related Sparse Gaussian Graphical Models.

Beilun Wang Arshdeep Sekhon Yanjun Qi

Coded Sparse Matrix Multiplication.

Sinong Wang Jiashang Liu Ness B. Shroff

Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations.

Xingyu Wang Diego Klabjan

Analyzing the Robustness of Nearest Neighbors to Adversarial Examples.

Yizhen Wang Somesh Jha Kamalika Chaudhuri

PredRNN++: Towards A Resolution of the Deep-in-Time Dilemma in Spatiotemporal Predictive Learning.

Yunbo Wang Zhifeng Gao Mingsheng Long Jianmin Wang Philip S. Yu

Thompson Sampling for Combinatorial Semi-Bandits.

Siwei Wang Wei Chen

Neural Dynamic Programming for Musical Self Similarity.

Christian J. Walder Dongwoo Kim

Semi-Supervised Learning on Data Streams via Temporal Label Propagation.

Tal Wagner Sudipto Guha Shiva Prasad Kasiviswanathan Nina Mishra

Transfer Learning via Learning to Transfer.

Ying Wei Yu Zhang Junzhou Huang Qiang Yang

A Probabilistic Theory of Supervised Similarity Learning for Pointwise ROC Curve Optimization.

Robin Vogel Aurélien Bellet Stéphan Clémençon

Programmatically Interpretable Reinforcement Learning.

Abhinav Verma Vijayaraghavan Murali Rishabh Singh Pushmeet Kohli Swarat Chaudhuri

DVAE++: Discrete Variational Autoencoders with Overlapping Transformations.

Arash Vahdat William G. Macready Zhengbing Bian Amir Khoshaman Evgeny Andriyash

Adversarial Risk and the Dangers of Evaluating Against Weak Attacks.

Jonathan Uesato Brendan O'Donoghue Pushmeet Kohli Aäron van den Oord

The Mirage of Action-Dependent Baselines in Reinforcement Learning.

George Tucker Surya Bhupatiraju Shixiang Gu Richard E. Turner Zoubin Ghahramani Sergey Levine

Least-Squares Temporal Difference Learning for the Linear Quadratic Regulator.

Stephen Tu Benjamin Recht

Invariance of Weight Distributions in Rectified MLPs.

Russell Tsuchida Farbod Roosta-Khorasani Marcus Gallagher

StrassenNets: Deep Learning with a Multiplication Budget.

Michael Tschannen Aran Khanna Animashree Anandkumar

Theoretical Analysis of Sparse Subspace Clustering with Missing Entries.

Manolis C. Tsakiris René Vidal

Learning Longer-term Dependencies in RNNs with Auxiliary Losses.

Trieu H. Trinh Andrew M. Dai Thang Luong Quoc V. Le

Convergent TREE BACKUP and RETRACE with Function Approximation.

Ahmed Touati Pierre-Luc Bacon Doina Precup Pascal Vincent

Adversarial Regression with Multiple Learners.

Liang Tong Sixie Yu Scott Alfeld Yevgeniy Vorobeychik

Importance Weighted Transfer of Samples in Reinforcement Learning.

Andrea Tirinzoni Andrea Sessa Matteo Pirotta Marcello Restelli

CoVeR: Learning Covariate-Specific Vector Representations with Tensor Decompositions.

Kevin Tian Teng Zhang James Zou

Decoupling Gradient-Like Learning Rules from Representations.

Philip S. Thomas Christoph Dann Emma Brunskill

Bayesian Uncertainty Estimation for Batch Normalized Deep Networks.

Mattias Teye Hossein Azizpour Kevin Smith

Lyapunov Functions for First-Order Methods: Tight Automated Convergence Guarantees.

Adrien Taylor Bryan Van Scoy Laurent Lessard

Chi-square Generative Adversarial Network.

Chenyang Tao Liqun Chen Ricardo Henao Jianfeng Feng Lawrence Carin

Best Arm Identification in Linear Bandits with Linear Dimension Dependency.

Chao Tao Saúl A. Blanco Yuan Zhou

Black Box FDR.

Wesley Tansey Yixin Wang David M. Blei Raul Rabadan

Neural Inverse Rendering for General Reflectance Photometric Stereo.

Tatsunori Taniai Takanori Maehara

D2: Decentralized Training over Decentralized Data.

Hanlin Tang Xiangru Lian Ming Yan Ce Zhang Ji Liu

Learning the Reward Function for a Misspecified Model.

Erik Talvitie

Differentiable Compositional Kernel Learning for Gaussian Processes.

Shengyang Sun Guodong Zhang Chaoqi Wang Wenyuan Zeng Jiaman Li Roger B. Grosse

Convolutional Imputation of Matrix Networks.

Qingyun Sun Mengyuan Yan David L. Donoho Stephen P. Boyd

Graphical Nonconvex Optimization via an Adaptive Convex Relaxation.

Qiang Sun Kean Ming Tan Han Liu Tong Zhang

Scalable Approximate Bayesian Inference for Particle Tracking Data.

Ruoxi Sun Liam Paninski

Neural Program Synthesis from Diverse Demonstration Videos.

Shao-Hua Sun Hyeonwoo Noh Sriram Somasundaram Joseph J. Lim

Stagewise Safe Bayesian Optimization with Gaussian Processes.

Yanan Sui Vincent Zhuang Joel W. Burdick Yisong Yue

Exploiting the Potential of Standard Convolutional Autoencoders for Image Restoration by Evolutionary Search.

Masanori Suganuma Mete Ozay Takayuki Okatani

Learning Low-Dimensional Temporal Representations.

Bing Su Ying Wu

Approximation Algorithms for Cascading Prediction Models.

Matthew Streeter

Structured Control Nets for Deep Reinforcement Learning.

Mario Srouji Jian Zhang Ruslan Salakhutdinov

Universal Planning Networks: Learning Generalizable Representations for Visuomotor Control.

Aravind Srinivas Allan Jabri Pieter Abbeel Sergey Levine Chelsea Finn

Knowledge Transfer with Jacobian Matching.

Suraj Srinivas François Fleuret

Accelerating Natural Gradient with Higher-Order Invariance.

Yang Song Jiaming Song Stefano Ermon

An Inference-Based Policy Gradient Method for Learning Options.

Matthew J. A. Smith Herke van Hoof Joelle Pineau

Towards End-to-End Prosody Transfer for Expressive Speech Synthesis with Tacotron.

R. J. Skerry-Ryan Eric Battenberg Ying Xiao Yuxuan Wang Daisy Stanton Joel Shor Ron J. Weiss Rob Clark Rif A. Saurous

K-means clustering using random matrix sparsification.

Kaushik Sinha

Asynchronous Stochastic Quasi-Newton MCMC for Non-Convex Optimization.

Umut Simsekli Çagatay Yildiz Thanh Huy Nguyen A. Taylan Cemgil Gaël Richard

CRAFTML, an Efficient Clustering-based Random Forest for Extreme Multi-label Learning.

Wissam Siblini Frank Meyer Pascale Kuntz

TACO: Learning Task Decomposition via Temporal Alignment for Control.

Kyriacos Shiarlis Markus Wulfmeier Sasha Salter Shimon Whiteson Ingmar Posner

A Spectral Approach to Gradient Estimation for Implicit Distributions.

Jiaxin Shi Shengyang Sun Jun Zhu

An Algorithmic Framework of Variable Metric Over-Relaxed Hybrid Proximal Extra-Gradient Method.

Li Shen Peng Sun Yitong Wang Wei Liu Tong Zhang

Towards More Efficient Stochastic Decentralized Learning: Faster Convergence and Sparse Communication.

Zebang Shen Aryan Mokhtari Tengfei Zhou Peilin Zhao Hui Qian

Learning in Integer Latent Variable Models with Nested Automatic Differentiation.

Daniel Sheldon Kevin Winner Debora Sujono

Locally Private Hypothesis Testing.

Or Sheffet

Adafactor: Adaptive Learning Rates with Sublinear Memory Cost.

Noam Shazeer Mitchell Stern

Solving Partial Assignment Problems using Random Clique Complexes.

Charu Sharma Deepak Nathani Manohar Kaul

Finding Influential Training Samples for Gradient Boosted Decision Trees.

Boris Sharchilev Yury Ustinovskiy Pavel Serdyukov Maarten de Rijke

First Order Generative Adversarial Networks.

Calvin Seward Thomas Unterthiner Urs Bergmann Nikolay Jetchev Sepp Hochreiter

Bounding and Counting Linear Regions of Deep Neural Networks.

Thiago Serra Christian Tjandraatmadja Srikumar Ramalingam

Overcoming Catastrophic Forgetting with Hard Attention to the Task.

Joan Serrà Didac Suris Marius Miron Alexandros Karatzoglou

Multi-Fidelity Black-Box Optimization with Hierarchical Partitions.

Rajat Sen Kirthevasan Kandasamy Sanjay Shakkottai

Progress & Compress: A scalable framework for continual learning.

Jonathan Schwarz Wojciech Czarnecki Jelena Luketina Agnieszka Grabska-Barwinska Yee Whye Teh Razvan Pascanu Raia Hadsell

Not to Cry Wolf: Distantly Supervised Multitask Learning in Critical Care.

Patrick Schwab Emanuela Keller Carl Muroi David J. Mack Christian Strässle Walter Karlen

Learning with Abandonment.

Sven Schmit Ramesh Johari

Tight Regret Bounds for Bayesian Optimization in One Dimension.

Jonathan Scarlett

TAPAS: Tricks to Accelerate (encrypted) Prediction As a Service.

Amartya Sanyal Matt J. Kusner Adrià Gascón Varun Kanade

A Classification-Based Study of Covariate Shift in GAN Distributions.

Shibani Santurkar Ludwig Schmidt Aleksander Madry

Measuring abstract reasoning in neural networks.

Adam Santoro Felix Hill David G. T. Barrett Ari S. Morcos Timothy P. Lillicrap

Graph Networks as Learnable Physics Engines for Inference and Control.

Alvaro Sanchez-Gonzalez Nicolas Heess Jost Tobias Springenberg Josh Merel Martin A. Riedmiller Raia Hadsell Peter W. Battaglia

Representation Tradeoffs for Hyperbolic Embeddings.

Frederic Sala Christopher De Sa Albert Gu Christopher Ré

Tempered Adversarial Networks.

Mehdi S. M. Sajjadi Giambattista Parascandolo Arash Mehrjou Bernhard Schölkopf

Learning Equations for Extrapolation and Control.

Subham S. Sahoo Christoph H. Lampert Georg Martius

Spurious Local Minima are Common in Two-Layer ReLU Neural Networks.

Itay Safran Ohad Shamir

Black-Box Variational Inference for Stochastic Differential Equations.

Thomas Ryder Andrew Golightly A. Stephen McGough Dennis Prangle

Probabilistic Boolean Tensor Decomposition.

Tammo Rukat Christopher C. Holmes Christopher Yau

Augment and Reduce: Stochastic Inference for Large Categorical Distributions.

Francisco J. R. Ruiz Michalis K. Titsias Adji B. Dieng David M. Blei

Deep One-Class Classification.

Lukas Ruff Nico Görnitz Lucas Deecke Shoaib Ahmed Siddiqui Robert A. Vandermeulen Alexander Binder Emmanuel Müller Marius Kloft

Fast Information-theoretic Bayesian Optimisation.

Bin Xin Ru Mark McLeod Diego Granziol Michael A. Osborne

Learning to Optimize Combinatorial Functions.

Nir Rosenfeld Eric Balkanski Amir Globerson Yaron Singer

A Hierarchical Latent Vector Model for Learning Long-Term Structure in Music.

Adam Roberts Jesse H. Engel Colin Raffel Curtis Hawthorne Douglas Eck

Been There, Done That: Meta-Learning with Episodic Recall.

Samuel Ritter Jane X. Wang Zeb Kurth-Nelson Siddhant M. Jayakumar Charles Blundell Razvan Pascanu Matthew Botvinick

Learning by Playing Solving Sparse Reward Tasks from Scratch.

Martin A. Riedmiller Roland Hafner Thomas Lampe Michael Neunert Jonas Degrave Tom Van de Wiele Vlad Mnih Nicolas Heess Jost Tobias Springenberg

Learning to Reweight Examples for Robust Deep Learning.

Mengye Ren Wenyuan Zeng Bin Yang Raquel Urtasun

Weightless: Lossy weight encoding for deep neural network compression.

Brandon Reagen Udit Gupta Bob Adolf Michael Mitzenmacher Alexander M. Rush Gu-Yeon Wei David Brooks

Learning Implicit Generative Models with the Method of Learned Moments.

Suman V. Ravuri Shakir Mohamed Mihaela Rosca Oriol Vinyals

Gradient Coding from Cyclic MDS Codes and Expander Graphs.

Netanel Raviv Rashish Tandon Alex Dimakis Itzhak Tamo

QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning.

Tabish Rashid Mikayel Samvelyan Christian Schröder de Witt Gregory Farquhar Jakob N. Foerster Shimon Whiteson

SAFFRON: an Adaptive Algorithm for Online Control of the False Discovery Rate.

Aaditya Ramdas Tijana Zrnic Martin J. Wainwright Michael I. Jordan

Tighter Variational Bounds are Not Necessarily Better.

Tom Rainforth Adam R. Kosiorek Tuan Anh Le Chris J. Maddison Maximilian Igl Frank Wood Yee Whye Teh

On Nesting Monte Carlo Estimators.

Tom Rainforth Robert Cornish Hongseok Yang Andrew Warrington

Modeling Others using Oneself in Multi-Agent Reinforcement Learning.

Roberta Raileanu Emily Denton Arthur Szlam Rob Fergus

Cut-Pursuit Algorithm for Regularizing Nonsmooth Functionals with Graph Total Variation.

Hugo Raguet Loïc Landrieu

Can Deep Reinforcement Learning Solve Erdos-Selfridge-Spencer Games?

Maithra Raghu Alex Irpan Jacob Andreas Robert Kleinberg Quoc V. Le Jon M. Kleinberg

Fast Parametric Learning with Activation Memorization.

Jack W. Rae Chris Dyer Peter Dayan Timothy P. Lillicrap

Machine Theory of Mind.

Neil C. Rabinowitz Frank Perbet H. Francis Song Chiyuan Zhang S. M. Ali Eslami Matthew Botvinick

Non-convex Conditional Gradient Sliding.

Chao Qu Yan Li Huan Xu

DCFNet: Deep Neural Network with Decomposed Convolutional Filters.

Qiang Qiu Xiuyuan Cheng A. Robert Calderbank Guillermo Sapiro

Gradually Updated Neural Networks for Large-Scale Image Recognition.

Siyuan Qiao Zhishuai Zhang Wei Shen Bo Wang Alan L. Yuille

Do Outliers Ruin Collaboration?

Mingda Qiao

Generalized Earley Parser: Bridging Symbolic Grammars and Sequence Data for Future Prediction.

Siyuan Qi Baoxiong Jia Song-Chun Zhu

Selecting Representative Examples for Program Synthesis.

Yewen Pu Zachery Miranda Armando Solar-Lezama Leslie Pack Kaelbling

JointGAN: Multi-Domain Joint Distribution Learning with Generative Adversarial Nets.

Yunchen Pu Shuyang Dai Zhe Gan Weiyao Wang Guoyin Wang Yizhe Zhang Ricardo Henao Lawrence Carin

Learning Dynamics of Linear Denoising Autoencoders.

Arnu Pretorius Steve Kroon Herman Kamper

Equivalence of Multicategory SVM and Simplex Cone SVM: Fast Computations and Statistical Theory.

Guillaume Pouliot

Local Convergence Properties of SAGA/Prox-SVRG and Acceleration.

Clarice Poon Jingwei Liang Carola-Bibiane Schoenlieb

Constant-Time Predictive Distributions for Gaussian Processes.

Geoff Pleiss Jacob R. Gardner Kilian Q. Weinberger Andrew Gordon Wilson

Bandits with Delayed, Aggregated Anonymous Feedback.

Ciara Pike-Burke Shipra Agrawal Csaba Szepesvári Steffen Grünewälder

Efficient Neural Architecture Search via Parameter Sharing.

Hieu Pham Melody Y. Guan Barret Zoph Quoc V. Le Jeff Dean

Adaptive Three Operator Splitting.

Fabian Pedregosa Gauthier Gidel

High-Quality Prediction Intervals for Deep Learning: A Distribution-Free, Ensembled Approach.

Tim Pearce Alexandra Brintrup Mohamed Zaki Andy Neely

PIPPS: Flexible Model-Based Policy Search Robust to the Curse of Chaos.

Paavo Parmas Carl Edward Rasmussen Jan Peters Kenji Doya

Image Transformer.

Niki Parmar Ashish Vaswani Jakob Uszkoreit Lukasz Kaiser Noam Shazeer Alexander Ku Dustin Tran

Time Limits in Reinforcement Learning.

Fabio Pardo Arash Tavakoli Vitaly Levdik Petar Kormushev

Learning Independent Causal Mechanisms.

Giambattista Parascandolo Niki Kilbertus Mateo Rojas-Carulla Bernhard Schölkopf

Stochastic Variance-Reduced Policy Gradient.

Matteo Papini Damiano Binaghi Giuseppe Canonaco Matteo Pirotta Marcello Restelli

Max-Mahalanobis Linear Discriminant Analysis Networks.

Tianyu Pang Chao Du Jun Zhu

Theoretical Analysis of Image-to-Image Translation with Adversarial Learning.

Xudong Pan Mi Zhang Daizong Ding

Learning to Speed Up Structured Output Prediction.

Xingyuan Pan Vivek Srikumar

Reinforcement Learning with Function-Valued Action Spaces for Partial Differential Equation Control.

Yangchen Pan Amir-massoud Farahmand Martha White Saleh Nabi Piyush Grover Daniel Nikovski

Tree Edit Distance Learning via Adaptive Symbol Embeddings.

Benjamin Paaßen Claudio Gallicchio Alessio Micheli Barbara Hammer

Learning Compact Neural Networks with Regularization.

Samet Oymak

Analyzing Uncertainty in Neural Machine Translation.

Myle Ott Michael Auli David Grangier Marc'Aurelio Ranzato

Efficient First-Order Algorithms for Adaptive Signal Denoising.

Dmitrii Ostrovskii Zaïd Harchaoui

Autoregressive Quantile Networks for Generative Modeling.

Georg Ostrovski Will Dabney Rémi Munos

Learning Localized Spatio-Temporal Models From Streaming Data.

Muhammad Osama Dave Zachariah Thomas B. Schön

Parallel WaveNet: Fast High-Fidelity Speech Synthesis.

Aäron van den Oord Yazhe Li Igor Babuschkin Karen Simonyan Oriol Vinyals Koray Kavukcuoglu George van den Driessche Edward Lockhart Luis C. Cobo Florian Stimberg Norman Casagrande Dominik Grewe Seb Noury Sander Dieleman Erich Elsen Nal Kalchbrenner Heiga Zen Alex Graves Helen King Tom Walters Dan Belov Demis Hassabis

Design of Experiments for Model Discrimination Hybridising Analytical and Data-Driven Approaches.

Simon Olofsson Marc Peter Deisenroth Ruth Misener

Transformation Autoregressive Networks.

Junier B. Oliva Avinava Dubey Manzil Zaheer Barnabás Póczos Ruslan Salakhutdinov Eric P. Xing Jeff Schneider

A probabilistic framework for multi-view feature learning with many-to-many associations via neural networks.

Akifumi Okuno Tetsuya Hada Hidetoshi Shimodaira

Self-Imitation Learning.

Junhyuk Oh Yijie Guo Satinder Singh Honglak Lee

BOCK : Bayesian Optimization with Cylindrical Kernels.

ChangYong Oh Efstratios Gavves Max Welling

Learning in Reproducing Kernel Krein Spaces.

Dino Oglic Thomas Gärtner

Is Generator Conditioning Causally Related to GAN Performance?

Augustus Odena Jacob Buckman Catherine Olsson Tom B. Brown Christopher Olah Colin Raffel Ian J. Goodfellow

The Uncertainty Bellman Equation and Exploration.

Brendan O'Donoghue Ian Osband Rémi Munos Volodymyr Mnih

Beyond 1/2-Approximation for Submodular Maximization on Massive Data Streams.

Ashkan Norouzi-Fard Jakub Tarnawski Slobodan Mitrovic Amir Zandieh Aidasadat Mousavifar Ola Svensson

Functional Gradient Boosting based on Residual Network Perception.

Atsushi Nitanda Taiji Suzuki

A Theoretical Explanation for Perplexing Behaviors of Backpropagation-based Visualizations.

Weili Nie Yang Zhang Ankit Patel

SparseMAP: Differentiable Sparse Structured Inference.

Vlad Niculae André F. T. Martins Mathieu Blondel Claire Cardie

State Space Gaussian Processes with Non-Gaussian Likelihood.

Hannes Nickisch Arno Solin Alexander Grigorevskiy

Learning Continuous Hierarchies in the Lorentz Model of Hyperbolic Geometry.

Maximilian Nickel Douwe Kiela

On Learning Sparsely Used Dictionaries from Incomplete Samples.

Thanh V. Nguyen Akshay Soni Chinmay Hegde

Active Testing: An Efficient and Robust Framework for Estimating Accuracy.

Phuc Xuan Nguyen Deva Ramanan Charless C. Fowlkes

SGD and Hogwild! Convergence Without the Bounded Gradients Assumption.

Lam M. Nguyen Phuong Ha Nguyen Marten van Dijk Peter Richtárik Katya Scheinberg Martin Takác

Neural Networks Should Be Wide Enough to Learn Disconnected Decision Regions.

Quynh Nguyen Mahesh Chandra Mukkamala Matthias Hein

Optimization Landscape and Expressivity of Deep CNNs.

Quynh Nguyen Matthias Hein

Mitigating Bias in Adaptive Data Gathering via Differential Privacy.

Seth Neel Aaron Roth

Stochastic Proximal Algorithms for AUC Maximization.

Michael Natole Yiming Ying Siwei Lyu

Nearly Optimal Robust Subspace Tracking.

Praneeth Narayanamurthy Namrata Vaswani

Smoothed Action Value Functions for Learning Gaussian Policies.

Ofir Nachum Mohammad Norouzi George Tucker Dale Schuurmans

Fitting New Speakers Based on a Short Untranscribed Sample.

Eliya Nachmani Adam Polyak Yaniv Taigman Lior Wolf

On the Relationship between Data Efficiency and Error for Uncertainty Sampling.

Stephen Mussmann Percy Liang

Rapid Adaptation with Conditionally Shifted Neurons.

Tsendsuren Munkhdalai Xingdi Yuan Soroush Mehri Adam Trischler

Kernelized Synaptic Weight Matrices.

Lorenz K. Müller Julien N. P. Martel Giacomo Indiveri

Dropout Training, Data-dependent Regularization, and Generalization Bounds.

Wenlong Mou Yuchen Zhou Jun Gao Liwei Wang

WHInter: A Working set algorithm for High-dimensional sparse second order Interaction models.

Marine Le Morvan Jean-Philippe Vert

DICOD: Distributed Convolutional Coordinate Descent for Convolutional Sparse Coding.

Thomas Moreau Laurent Oudre Nicolas Vayatis

Decentralized Submodular Maximization: Bridging Discrete and Continuous Settings.

Aryan Mokhtari Hamed Hassani Amin Karbasi

The Hierarchical Adaptive Forgetting Variational Filter.

Vincent Moens

Data Summarization at Scale: A Two-Stage Submodular Approach.

Marko Mitrovic Ehsan Kazemi Morteza Zadimoghaddam Amin Karbasi

A Delay-tolerant Proximal-Gradient Algorithm for Distributed Learning.

Konstantin Mishchenko Franck Iutzeler Jérôme Malick Massih-Reza Amini

Differentiable Abstract Interpretation for Provably Robust Neural Networks.

Matthew Mirman Timon Gehr Martin T. Vechev

Training Neural Machines with Trace-Based Supervision.

Matthew Mirman Dimitar K. Dimitrov Pavle Djordjevic Timon Gehr Martin T. Vechev

Differentiable plasticity: training plastic neural networks with backpropagation.

Thomas Miconi Kenneth O. Stanley Jeff Clune

One-Shot Segmentation in Clutter.

Claudio Michaelis Matthias Bethge Alexander S. Ecker

On the Implicit Bias of Dropout.

Poorya Mianjy Raman Arora René Vidal

Stochastic PCA with ?2 and ?1 Regularization.

Poorya Mianjy Raman Arora

The Hidden Vulnerability of Distributed Learning in Byzantium.

El Mahdi El Mhamdi Rachid Guerraoui Sébastien Rouault

Pseudo-task Augmentation: From Deep Multitask Learning to Intratask Sharing-and Back.

Elliot Meyerson Risto Miikkulainen

prDeep: Robust Phase Retrieval with a Flexible Deep Network.

Christopher A. Metzler Philip Schniter Ashok Veeraraghavan Richard G. Baraniuk

Configurable Markov Decision Processes.

Alberto Maria Metelli Mirco Mutti Marcello Restelli

Which Training Methods for GANs do actually Converge?

Lars M. Mescheder Andreas Geiger Sebastian Nowozin

Ranking Distributions based on Noisy Sorting.

Adil El Mesaoudi-Paul Eyke Hüllermeier Róbert Busa-Fekete

Differentiable Dynamic Programming for Structured Prediction and Attention.

Arthur Mensch Mathieu Blondel

Bounds on the Approximation Power of Feedforward Neural Networks.

Mohammad Mehrabi Aslan Tchamkerten Mansoor I. Yousefi

Optimization, Fast and Slow: Optimally Switching between Local and Bayesian Optimization.

Mark McLeod Stephen J. Roberts Michael A. Osborne

Bayesian Model Selection for Change Point Detection and Clustering.

Othmane Mazhar Cristian R. Rojas Carlo Fischione Mohammad Reza Hesamzadeh

Fast Approximate Spectral Clustering for Dynamic Networks.

Lionel Martin Andreas Loukas Pierre Vandergheynst

Streaming Principal Component Analysis in Noisy Settings.

Teodor Vanislavov Marinov Poorya Mianjy Raman Arora

Iterative Amortized Inference.

Joseph Marino Yisong Yue Stephan Mandt

An Efficient, Generalized Bellman Update For Cooperative Inverse Reinforcement Learning.

Dhruv Malik Malayandi Palaniappan Jaime F. Fisac Dylan Hadfield-Menell Stuart J. Russell Anca D. Dragan

Learning Adversarially Fair and Transferable Representations.

David Madras Elliot Creager Toniann Pitassi Richard S. Zemel

Approximate message passing for amplitude based optimization.

Junjie Ma Ji Xu Arian Maleki

Dimensionality-Driven Learning with Noisy Labels.

Xingjun Ma Yisen Wang Michael E. Houle Shuo Zhou Sarah M. Erfani Shu-Tao Xia Sudanthi N. R. Wijewickrema James Bailey

Implicit Regularization in Nonconvex Statistical Estimation: Gradient Descent Converges Linearly for Phase Retrieval and Matrix Completion.

Cong Ma Kaizheng Wang Yuejie Chi Yuxin Chen

Gradient Descent for Sparse Rank-One Matrix Completion for Crowd-Sourced Aggregation of Sparsely Interacting Workers.

Yao Ma Alexander Olshevsky Csaba Szepesvári Venkatesh Saligrama

The Power of Interpolation: Understanding the Effectiveness of SGD in Modern Over-parametrized Learning.

Siyuan Ma Raef Bassily Mikhail Belkin

Celer: a Fast Solver for the Lasso with Dual Extrapolation.

Mathurin Massias Joseph Salmon Alexandre Gramfort

Batch Bayesian Optimization via Multi-objective Acquisition Ensemble for Automated Analog Circuit Design.

Wenlong Lyu Fan Yang Changhao Yan Dian Zhou Xuan Zeng

Competitive Caching with Machine Learned Advice.

Thodoris Lykouris Sergei Vassilvitskii

End-to-end Active Object Tracking via Reinforcement Learning.

Wenhan Luo Peng Sun Fangwei Zhong Wei Liu Tong Zhang Yizhou Wang

Beyond Finite Layer Neural Networks: Bridging Deep Architectures and Numerical Differential Equations.

Yiping Lu Aoxiao Zhong Quanzheng Li Bin Dong

Structured Variationally Auto-encoded Optimization.

Xiaoyu Lu Javier Gonzalez Zhenwen Dai Neil D. Lawrence

Accelerating Greedy Coordinate Descent Methods.

Haihao Lu Robert M. Freund Vahab S. Mirrokni

The Edge Density Barrier: Computational-Statistical Tradeoffs in Combinatorial Inference.

Hao Lu Yuan Cao Junwei Lu Han Liu Zhaoran Wang

Spectrally Approximating Large Graphs with Smaller Graphs.

Andreas Loukas Pierre Vandergheynst

Constraining the Dynamics of Deep Probabilistic Models.

Marco Lorenzi Maurizio Filippone

Error Estimation for Randomized Least-Squares Algorithms via the Bootstrap.

Miles E. Lopes Shusen Wang Michael W. Mahoney

PDE-Net: Learning PDEs from Data.

Zichao Long Yiping Lu Xianzhong Ma Bin Dong

On Matching Pursuit and Coordinate Descent.

Francesco Locatello Anant Raj Sai Praneeth Karimireddy Gunnar Rätsch Bernhard Schölkopf Sebastian U. Stich Martin Jaggi

Fast Stochastic AUC Maximization with O(1/n)-Convergence Rate.

Mingrui Liu Xiaoxuan Zhang Zaiyi Chen Xiaoyu Wang Tianbao Yang

Fast Variance Reduction Method with Stochastic Batch Size.

Xuanqing Liu Cho-Jui Hsieh

Open Category Detection with PAC Guarantees.

Si Liu Risheek Garrepalli Thomas G. Dietterich Alan Fern Dan Hendrycks

A Two-Step Computation of the Exact GAN Wasserstein Distance.

Huidong Liu Xianfeng Gu Dimitris Samaras

Delayed Impact of Fair Machine Learning.

Lydia T. Liu Sarah Dean Esther Rolf Max Simchowitz Moritz Hardt

Towards Black-box Iterative Machine Teaching.

Weiyang Liu Bo Dai Xingguo Li Zhen Liu James M. Rehg Le Song

Generalized Robust Bayesian Committee Machine for Large-scale Gaussian Process Regression.

Haitao Liu Jianfei Cai Yi Wang Yew-Soon Ong

Detecting and Correcting for Label Shift with Black Box Predictors.

Zachary C. Lipton Yu-Xiang Wang Alexander J. Smola

Level-Set Methods for Finite-Sum Constrained Convex Optimization.

Qihang Lin Runchao Ma Tianbao Yang

Optimal Rates of Sketched-regularized Algorithms for Least-Squares Regression over Hilbert Spaces.

Junhong Lin Volkan Cevher

Optimal Distributed Learning with Multi-pass Stochastic Gradient Methods.

Junhong Lin Volkan Cevher

Reviving and Improving Recurrent Back-Propagation.

Renjie Liao Yuwen Xiong Ethan Fetaya Lisa Zhang KiJung Yoon Xaq Pitkow Raquel Urtasun Richard S. Zemel

The Dynamics of Learning: A Random Matrix Approach.

Zhenyu Liao Romain Couillet

On the Spectrum of Random Features Maps of High Dimensional Data.

Zhenyu Liao Romain Couillet

RLlib: Abstractions for Distributed Reinforcement Learning.

Eric Liang Richard Liaw Robert Nishihara Philipp Moritz Roy Fox Ken Goldberg Joseph Gonzalez Michael I. Jordan Ion Stoica

Asynchronous Decentralized Parallel Stochastic Gradient Descent.

Xiangru Lian Wei Zhang Ce Zhang Ji Liu

Estimation of Markov Chain via Rank-constrained Likelihood.

Xudong Li Mengdi Wang Anru Zhang

The Well-Tempered Lasso.

Yuanzhi Li Yoram Singer

Submodular Hypergraphs: p-Laplacians, Cheeger Inequalities and Spectral Clustering.

Pan Li Olgica Milenkovic

On the Limitations of First-Order Approximation in GAN Dynamics.

Jerry Li Aleksander Madry John Peebles Ludwig Schmidt

Towards Binary-Valued Gates for Robust LSTM Training.

Zhuohan Li Di He Fei Tian Wei Chen Tao Qin Liwei Wang Tie-Yan Liu

An Optimal Control Approach to Deep Learning and Applications to Discrete-Weight Neural Networks.

Qianxiao Li Shuji Hao

Out-of-sample extension of graph adjacency spectral embedding.

Keith D. Levin Farbod Roosta-Khorasani Michael W. Mahoney Carey E. Priebe

Noise2Noise: Learning Image Restoration without Clean Data.

Jaakko Lehtinen Jacob Munkberg Jon Hasselgren Samuli Laine Tero Karras Miika Aittala Timo Aila

Deep Asymmetric Multi-task Feature Learning.

Haebeom Lee Eunho Yang Sung Ju Hwang

Gated Path Planning Networks.

Lisa Lee Emilio Parisotto Devendra Singh Chaplot Eric P. Xing Ruslan Salakhutdinov

Deep Reinforcement Learning in Continuous Action Spaces: a Case Study in the Game of Simulated Curling.

Kyowoon Lee Sol-A. Kim Jaesik Choi Seong-Whan Lee

Gradient-Based Meta-Learning with Learned Layerwise Metric and Subspace.

Yoonho Lee Seungjin Choi

Hierarchical Imitation and Reinforcement Learning.

Hoang Minh Le Nan Jiang Alekh Agarwal Miroslav Dudík Yisong Yue Hal Daumé III

The Multilinear Structure of ReLU Networks.

Thomas Laurent James von Brecht

Deep Linear Networks with Arbitrary Loss: All Local Minima Are Global.

Thomas Laurent James von Brecht

Partial Optimality and Fast Lower Bounds for Weighted Correlation Clustering.

Jan-Hendrik Lange Andreas Karrenbauer Bjoern Andres

An Estimation and Analysis Framework for the Rasch Model.

Andrew S. Lan Mung Chiang Christoph Studer

Generalization without Systematicity: On the Compositional Skills of Sequence-to-Sequence Recurrent Networks.

Brenden M. Lake Marco Baroni

Canonical Tensor Decomposition for Knowledge Base Completion.

Timothée Lacroix Nicolas Usunier Guillaume Obozinski

Binary Partitions with Approximate Minimum Impurity.

Eduardo Sany Laber Marco Molinaro Felipe de A. Mello Pereira

Mixed batches and symmetric discriminators for GAN training.

Thomas Lucas Corentin Tallec Yann Ollivier Jakob Verbeek

Understanding the Loss Surface of Neural Networks for Binary Classification.

Shiyu Liang Ruoyu Sun Yixuan Li Rayadurgam Srikant

Explicit Inductive Bias for Transfer Learning with Convolutional Networks.

Xuhong Li Yves Grandvalet Franck Davoine

Data-Dependent Stability of Stochastic Gradient Descent.

Ilja Kuzborskij Christoph H. Lampert

Trainable Calibration Measures For Neural Networks From Kernel Mean Embeddings.

Aviral Kumar Sunita Sarawagi Ujjwal Jain

Accurate Uncertainties for Deep Learning Using Calibrated Regression.

Volodymyr Kuleshov Nathan Fenner Stefano Ermon

Fast Maximization of Non-Submodular, Monotonic Functions on the Integer Lattice.

Alan Kuhnle J. David Smith Victoria G. Crawford My T. Thai

Semiparametric Contextual Bandits.

Akshay Krishnamurthy Zhiwei Steven Wu Vasilis Syrgkanis

Dynamic Evaluation of Neural Sequence Models.

Ben Krause Emmanuel Kahembwe Iain Murray Steve Renals

Compiling Combinatorial Prediction Games.

Frédéric Koriche

On the Generalization of Equivariance and Convolution in Neural Networks to the Action of Compact Groups.

Risi Kondor Shubhendu Trivedi

Nonconvex Optimization for Regression with Fairness Constraints.

Junpei Komiyama Akiko Takeda Junya Honda Hajime Shimao

Fast Gradient-Based Methods with Exponential Rate: A Hybrid Control Framework.

Arman Sharifi Kolarijani Peyman Mohajerin Esfahani Tamás Keviczky

Spatio-temporal Bayesian On-line Changepoint Detection with Model Selection.

Jeremias Knoblauch Theodoros Damoulas

Crowdsourcing with Arbitrary Adversaries.

Matthäus Kleindessner Pranjal Awasthi

An Alternative View: When Does SGD Escape Local Minima?

Robert Kleinberg Yuanzhi Li Yang Yuan

Neural Relational Inference for Interacting Systems.

Thomas N. Kipf Ethan Fetaya Kuan-Chieh Wang Max Welling Richard S. Zemel

Semi-Amortized Variational Autoencoders.

Yoon Kim Sam Wiseman Andrew C. Miller David A. Sontag Alexander M. Rush

Interpretability Beyond Feature Attribution: Quantitative Testing with Concept Activation Vectors (TCAV).

Been Kim Martin Wattenberg Justin Gilmer Carrie J. Cai James Wexler Fernanda B. Viégas Rory Sayres

Self-Bounded Prediction Suffix Tree via Approximate String Matching.

Dongwoo Kim Christian J. Walder

Disentangling by Factorising.

Hyunjik Kim Andriy Mnih

Markov Modulated Gaussian Cox Processes for Semi-Stationary Intensity Modeling of Events Data.

Minyoung Kim

Blind Justice: Fairness with Encrypted Sensitive Attributes.

Niki Kilbertus Adrià Gascón Matt J. Kusner Michael Veale Krishna P. Gummadi Adrian Weller

Geometry Score: A Method For Comparing Generative Adversarial Networks.

Valentin Khrulkov Ivan V. Oseledets

Fast and Scalable Bayesian Deep Learning by Weight-Perturbation in Adam.

Mohammad Emtiyaz Khan Didrik Nielsen Voot Tangkaratt Wu Lin Yarin Gal Akash Srivastava

Convergence guarantees for a class of non-convex and non-smooth optimization problems.

Koulik Khamaru Martin J. Wainwright

Frank-Wolfe with Subsampling Oracle.

Thomas Kerdreux Fabian Pedregosa Alexandre d'Aspremont

ContextNet: Deep learning for Star Galaxy Classification.

Noble Kennamer David Kirkby Alexander T. Ihler Francisco Javier Sanchez-Lopez

Improved nearest neighbor search using auxiliary information and priority functions.

Omid Keivani Kaushik Sinha

Preventing Fairness Gerrymandering: Auditing and Learning for Subgroup Fairness.

Michael J. Kearns Seth Neel Aaron Roth Zhiwei Steven Wu

Focused Hierarchical RNNs for Conditional Sequence Processing.

Nan Rosemary Ke Konrad Zolna Alessandro Sordoni Zhouhan Lin Adam Trischler Yoshua Bengio Joelle Pineau Laurent Charlin Christopher J. Pal

Scalable Deletion-Robust Submodular Maximization: Data Summarization with Privacy and Fairness Constraints.

Ehsan Kazemi Morteza Zadimoghaddam Amin Karbasi

Feasible Arm Identification.

Julian Katz-Samuels Clayton Scott

Not All Samples Are Created Equal: Deep Learning with Importance Sampling.

Angelos Katharopoulos François Fleuret

Riemannian Stochastic Recursive Gradient Algorithm with Retraction and Vector Transport and Its Convergence Analysis.

Hiroyuki Kasai Hiroyuki Sato Bamdev Mishra

LaVAN: Localized and Visible Adversarial Noise.

Danny Karmon Daniel Zoran Yoav Goldberg

Continual Reinforcement Learning with Complex Synapses.

Christos Kaplanis Murray Shanahan Claudia Clopath

Let's be Honest: An Optimal No-Regret Framework for Zero-Sum Games.

Ehsan Asadi Kangarshahi Ya-Ping Hsieh Mehmet Fatih Sahin Volkan Cevher

Improving Sign Random Projections With Additional Information.

Keegan Kang Wong Wei Pin

Policy Optimization with Demonstrations.

Bingyi Kang Zequn Jie Jiashi Feng

Semi-Supervised Learning via Compact Latent Space Clustering.

Konstantinos Kamnitsas Daniel Coelho de Castro Loïc Le Folgoc Ian Walker Ryutaro Tanno Daniel Rueckert Ben Glocker Antonio Criminisi Aditya V. Nori

Learn from Your Neighbor: Learning Multi-modal Mappings from Sparse Annotations.

Ashwin Kalyan Stefan Lee Anitha Kannan Dhruv Batra

Residual Unfairness in Fair Machine Learning from Prejudiced Data.

Nathan Kallus Angela Zhou

Signal and Noise Statistics Oblivious Orthogonal Matching Pursuit.

Sreejith Kallummil Sheetal Kalyani

Learning Diffusion using Hyperparameters.

Dimitris Kalimeris Yaron Singer Karthik Subbian Udi Weinsberg

Efficient Neural Audio Synthesis.

Nal Kalchbrenner Erich Elsen Karen Simonyan Seb Noury Norman Casagrande Edward Lockhart Florian Stimberg Aäron van den Oord Sander Dieleman Koray Kavukcuoglu

Kernel Recursive ABC: Point Estimation with Intractable Likelihood.

Takafumi Kajihara Motonobu Kanagawa Keisuke Yamazaki Kenji Fukumizu

Fast Decoding in Sequence Models Using Discrete Latent Variables.

Lukasz Kaiser Samy Bengio Aurko Roy Ashish Vaswani Niki Parmar Jakob Uszkoreit Noam Shazeer

Kronecker Recurrent Units.

Cijo Jose Moustapha Cissé François Fleuret

Composite Functional Gradient Learning of Generative Adversarial Models.

Rie Johnson Tong Zhang

Large-Scale Cox Process Inference using Variational Fourier Features.

S. T. John James Hensman

WSNet: Compact and Efficient Networks Through Weight Sampling.

Xiaojie Jin Yingzhen Yang Ning Xu Jianchao Yang Nebojsa Jojic Jiashi Feng Shuicheng Yan

Regret Minimization for Partially Observable Deep Reinforcement Learning.

Peter H. Jin Kurt Keutzer Sergey Levine

Network Global Testing by Counting Graphlets.

Jiashun Jin Zheng Tracy Ke Shengming Luo

Junction Tree Variational Autoencoder for Molecular Graph Generation.

Wengong Jin Regina Barzilay Tommi S. Jaakkola

The Weighted Kendall and High-order Kernels for Permutations.

Yunlong Jiao Jean-Philippe Vert

MentorNet: Learning Data-Driven Curriculum for Very Deep Neural Networks on Corrupted Labels.

Lu Jiang Zhengyuan Zhou Thomas Leung Li-Jia Li Li Fei-Fei

Quickshift++: Provably Good Initializations for Sample-Based Mean Shift.

Heinrich Jiang Jennifer Jang Samory Kpotufe

Feedback-Based Tree Search for Reinforcement Learning.

Daniel R. Jiang Emmanuel Ekwedike Han Liu

Exploring Hidden Dimensions in Parallelizing Convolutional Neural Networks.

Zhihao Jia Sina Lin Charles R. Qi Alex Aiken

Efficient end-to-end learning for quantizable representations.

Yeonwoo Jeong Hyun Oh Song

A Unified Framework for Structured Low-rank Matrix Learning.

Pratik Jawanpuria Bamdev Mishra

Detecting non-causal artifacts in multivariate linear regression models.

Dominik Janzing Bernhard Schölkopf

Pathwise Derivatives Beyond the Reparameterization Trick.

Martin Jankowiak Fritz Obermeyer

Video Prediction with Appearance and Motion Conditions.

Yunseok Jang Gunhee Kim Yale Song

Differentially Private Matrix Completion Revisited.

Prateek Jain Om Dipakbhai Thakkar Abhradeep Thakurta

Firing Bandits: Optimizing Crowdfunding.

Lalit Jain Kevin G. Jamieson

Learning Binary Latent Variable Models: A Tensor Eigenpair Approach.

Ariel Jaffe Roi Weiss Shai Carmi Yuval Kluger Boaz Nadler

Anonymous Walk Embeddings.

Sergey Ivanov Evgeny Burnaev

Unbiased Objective Estimation in Predictive Optimization.

Shinji Ito Akihiro Yabe Ryohei Fujimaki

Deep Density Destructors.

David I. Inouye Pradeep Ravikumar

Improving Regression Performance with Distributional Losses.

Ehsan Imani Martha White

Analysis of Minimax Error Rate for Crowdsourcing and Its Application to Worker Clustering Model.

Hideaki Imamura Issei Sato Masashi Sugiyama

Black-box Adversarial Attacks with Limited Queries and Information.

Andrew Ilyas Logan Engstrom Anish Athalye Jessy Lin

Attention-based Deep Multiple Instance Learning.

Maximilian Ilse Jakub M. Tomczak Max Welling

Deep Variational Reinforcement Learning for POMDPs.

Maximilian Igl Luisa M. Zintgraf Tuan Anh Le Frank Wood Shimon Whiteson

Using Reward Machines for High-Level Task Specification and Decomposition in Reinforcement Learning.

Rodrigo Toro Icarte Toryn Q. Klassen Richard Anthony Valenzano Sheila A. McIlraith

Decoupled Parallel Backpropagation with Convergence Guarantee.

Zhouyuan Huo Bin Gu Qian Yang Heng Huang

Topological Mixture Estimation.

Steve Huntsman

Neural Autoregressive Flows.

Chin-Wei Huang David Krueger Alexandre Lacoste Aaron C. Courville

Learning Hidden Markov Models from Pairwise Co-occurrences with Application to Topic Modeling.

Kejun Huang Xiao Fu Nicholas D. Sidiropoulos

Learning Deep ResNet Blocks Sequentially using Boosting Theory.

Furong Huang Jordan T. Ash John Langford Robert E. Schapire

Near Optimal Frequent Directions for Sketching Dense and Sparse Matrices.

Zengfeng Huang

Dissipativity Theory for Accelerating Stochastic Variance Reduction: A Unified Analysis of SVRG and Katyusha Using Semidefinite Programs.

Bin Hu Stephen J. Wright Laurent Lessard

Does Distributionally Robust Supervised Learning Give Robust Classifiers?

Weihua Hu Gang Niu Issei Sato Masashi Sugiyama

Variational Bayesian dropout: pitfalls and fixes.

Jiri Hron Alexander G. de G. Matthews Zoubin Ghahramani

Gradient Primal-Dual Algorithm Converges to Second-Order Stationary Solution for Nonconvex Distributed Optimization Over Networks.

Mingyi Hong Meisam Razaviyayn Jason D. Lee

Sound Abstraction and Decomposition of Probabilistic Programs.

Steven Holtzen Guy Van den Broeck Todd D. Millstein

CyCADA: Cycle-Consistent Adversarial Domain Adaptation.

Judy Hoffman Eric Tzeng Taesung Park Jun-Yan Zhu Phillip Isola Kate Saenko Alexei A. Efros Trevor Darrell

Fast Bellman Updates for Robust MDPs.

Chin Pang Ho Marek Petrik Wolfram Wiesemann

Orthogonal Recurrent Neural Networks with Scaled Cayley Transform.

Kyle Helfrich Devin Willmott Qiang Ye

Learning unknown ODE models with Gaussian processes.

Markus Heinonen Çagatay Yildiz Henrik Mannerström Jukka Intosalmi Harri Lähdesmäki

Recurrent Predictive State Policy Networks.

Ahmed Hefny Zita Marinho Wen Sun Siddhartha S. Srinivasa Geoffrey J. Gordon

Multicalibration: Calibration for the (Computationally-Identifiable) Masses.

Úrsula Hébert-Johnson Michael P. Kim Omer Reingold Guy N. Rothblum

Fairness Without Demographics in Repeated Loss Minimization.

Tatsunori B. Hashimoto Megha Srivastava Hongseok Namkoong Percy Liang

Learning Memory Access Patterns.

Milad Hashemi Kevin Swersky Jamie A. Smith Grant Ayers Heiner Litz Jichuan Chang Christos Kozyrakis Parthasarathy Ranganathan

Deep Models of Interactions Across Sets.

Jason S. Hartford Devon R. Graham Kevin Leyton-Brown Siamak Ravanbakhsh

Rectify Heterogeneous Models with Semantic Mapping.

Han-Jia Ye De-Chuan Zhan Yuan Jiang Zhi-Hua Zhou

Stein Variational Gradient Descent Without Gradient.

Jun Han Qiang Liu

Candidates vs. Noises Estimation for Large Multi-Class Classification Problem.

Lei Han Yiheng Huang Tong Zhang

K-Beam Minimax: Efficient Optimization for Deep Adversarial Learning.

Jihun Hamm Yung-Kyun Noh

Comparison-Based Random Forests.

Siavash Haghiri Damien Garreau Ulrike von Luxburg

Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor.

Tuomas Haarnoja Aurick Zhou Pieter Abbeel Sergey Levine

Latent Space Policies for Hierarchical Reinforcement Learning.

Tuomas Haarnoja Kristian Hartikainen Pieter Abbeel Sergey Levine

Shampoo: Preconditioned Stochastic Tensor Optimization.

Vineet Gupta Tomer Koren Yoram Singer

Characterizing Implicit Bias in Terms of Optimization Geometry.

Suriya Gunasekar Jason D. Lee Daniel Soudry Nathan Srebro

Learning to Search with MCTSnets.

Arthur Guez Theophane Weber Ioannis Antonoglou Karen Simonyan Oriol Vinyals Daan Wierstra Rémi Munos David Silver

Faster Derivative-Free Stochastic Algorithm for Shared Memory Machines.

Bin Gu Zhouyuan Huo Cheng Deng Heng Huang

Learning Policy Representations in Multiagent Systems.

Aditya Grover Maruan Al-Shedivat Jayesh K. Gupta Yuri Burda Harrison Edwards

Visualizing and Understanding Atari Agents.

Samuel Greydanus Anurag Koul Jonathan Dodge Alan Fern

Learning One Convolutional Layer with Overlapping Patches.

Surbhi Goel Adam R. Klivans Raghu Meka

Non-Linear Motor Control by Local Learning in Spiking Neural Networks.

Aditya Gilra Wulfram Gerstner

Robust and Scalable Models of Microbiome Dynamics.

Travis E. Gibson Georg K. Gerber

Learning Maximum-A-Posteriori Perturbation Models for Structured Prediction in Polynomial Time.

Asish Ghoshal Jean Honorio

Structured Variational Learning of Bayesian Neural Networks with Horseshoe Priors.

Soumya Ghosh Jiayu Yao Finale Doshi-Velez

Linear Spectral Estimators and an Application to Phase Retrieval.

Ramina Ghods Andrew S. Lan Tom Goldstein Christoph Studer

Budgeted Experiment Design for Causal Structure Learning.

AmirEmad Ghassami Saber Salehkaleybar Negar Kiyavash Elias Bareinboim

The Generalization Error of Dictionary Learning with Moreau Envelopes.

Alexandros Georgogiannis

Temporal Poisson Square Root Graphical Models.

Sinong Geng Zhaobin Kuang Peggy L. Peissig David Page

Conditional Neural Processes.

Marta Garnelo Dan Rosenbaum Christopher Maddison Tiago Ramalho David Saxton Murray Shanahan Yee Whye Teh Danilo Jimenez Rezende S. M. Ali Eslami

Structured Output Learning with Abstention: Application to Accurate Opinion Prediction.

Alexandre Garcia Chloé Clavel Slim Essid Florence d'Alché-Buc

Parallel Bayesian Network Structure Learning.

Tian Gao Dennis Wei

Spotlight: Optimizing Device Placement for Training Deep Neural Networks.

Yuanxiang Gao Li Chen Baochun Li

Synthesizing Programs for Images using Reinforced Adversarial Learning.

Yaroslav Ganin Tejas Kulkarni Igor Babuschkin S. M. Ali Eslami Oriol Vinyals

Parameterized Algorithms for the Matrix Completion Problem.

Robert Ganian Iyad A. Kanj Sebastian Ordyniak Stefan Szeider

Hyperbolic Entailment Cones for Learning Hierarchical Embeddings.

Octavian-Eugen Ganea Gary Bécigneul Thomas Hofmann

Inductive Two-layer Modeling with Parametric Bregman Transfer.

Vignesh Ganapathiraman Zhan Shi Xinhua Zhang Yaoliang Yu

Local Private Hypothesis Testing: Chi-Square Tests.

Marco Gaboardi Ryan Rogers

Born-Again Neural Networks.

Tommaso Furlanello Zachary Chase Lipton Michael Tschannen Laurent Itti Anima Anandkumar

Clipped Action Policy Gradient.

Yasuhiro Fujita Shin-ichi Maeda

Addressing Function Approximation Error in Actor-Critic Methods.

Scott Fujimoto Herke van Hoof David Meger

Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning.

Ronan Fruit Matteo Pirotta Alessandro Lazaric Ronald Ortner

Bilevel Programming for Hyperparameter Optimization and Meta-Learning.

Luca Franceschi Paolo Frasconi Saverio Salzo Riccardo Grazzi Massimiliano Pontil

ADMM and Accelerated ADMM as Continuous Dynamical Systems.

Guilherme França Daniel P. Robinson René Vidal

Generative Temporal Models with Spatial Memory for Partially Observed Environments.

Marco Fraccaro Danilo Jimenez Rezende Yori Zwols Alexander Pritzel S. M. Ali Eslami Fabio Viola

Practical Contextual Bandits with Regression Oracles.

Dylan J. Foster Alekh Agarwal Miroslav Dudík Haipeng Luo Robert E. Schapire

DiCE: The Infinitely Differentiable Monte Carlo Estimator.

Jakob N. Foerster Gregory Farquhar Maruan Al-Shedivat Tim Rocktäschel Eric P. Xing Shimon Whiteson

Automatic Goal Generation for Reinforcement Learning Agents.

Carlos Florensa David Held Xinyang Geng Pieter Abbeel

Closed-form Marginal Likelihood in Gamma-Poisson Matrix Factorization.

Louis Filstroff Alberto Lumbreras Cédric Févotte

Nonparametric variable importance using an augmented neural network with multi-task learning.

Jean Feng Brian D. Williamson Marco Carone Noah Simon

Fourier Policy Gradients.

Matthew Fellows Kamil Ciosek Shimon Whiteson

CRVI: Convex Relaxation for Variational Inference.

Ghazal Fazelnia John W. Paisley

Global Convergence of Policy Gradient Methods for the Linear Quadratic Regulator.

Maryam Fazel Rong Ge Sham M. Kakade Mehran Mesbahi

Efficient and Consistent Adversarial Bipartite Matching.

Rizal Fathony Sima Behpour Xinhua Zhang Brian D. Ziebart

More Robust Doubly Robust Off-policy Evaluation.

Mehrdad Farajtabar Yinlam Chow Mohammad Ghavamzadeh

BOHB: Robust and Efficient Hyperparameter Optimization at Scale.

Stefan Falkner Aaron Klein Frank Hutter

The Limits of Maxing, Ranking, and Preference Learning.

Moein Falahatgar Ayush Jain Alon Orlitsky Venkatadheeraj Pichapati Vaishakh Ravindrakumar

Scalable Gaussian Processes with Grid-Structured Eigenfunctions (GP-GRIEF).

Trefor W. Evans Prasanth B. Nair

IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures.

Lasse Espeholt Hubert Soyer Rémi Munos Karen Simonyan Volodymyr Mnih Tom Ward Yotam Doron Vlad Firoiu Tim Harley Iain Dunning Shane Legg Koray Kavukcuoglu

Parallel and Streaming Algorithms for K-Core Decomposition.

Hossein Esfandiari Silvio Lattanzi Vahab S. Mirrokni

Beyond the One-Step Greedy Approach in Reinforcement Learning.

Yonathan Efroni Gal Dalal Bruno Scherrer Shie Mannor

Entropy-SGD optimizes the prior of a PAC-Bayes bound: Generalization properties of Entropy-SGD and data-dependent priors.

Gintare Karolina Dziugaite Daniel M. Roy

Computational Optimal Transport: Complexity by Accelerated Gradient Descent Is Better Than by Sinkhorn's Algorithm.

Pavel E. Dvurechensky Alexander V. Gasnikov Alexey Kroshnin

A Distributed Second-Order Algorithm You Can Trust.

Celestine Dünner Aurélien Lucchi Matilde Gargiani An Bian Thomas Hofmann Martin Jaggi

Investigating Human Priors for Playing Video Games.

Rachit Dubey Pulkit Agrawal Deepak Pathak Tom Griffiths Alexei A. Efros

Gradient Descent Learns One-hidden-layer CNN: Don't be Afraid of Spurious Local Minima.

Simon S. Du Jason D. Lee Yuandong Tian Aarti Singh Barnabás Póczos

On the Power of Over-parametrization in Neural Networks with Quadratic Activation.

Simon S. Du Jason D. Lee

Weakly Consistent Optimal Pricing Algorithms in Repeated Posted-Price Auctions with Strategic Buyer.

Alexey Drutsa

Essentially No Barriers in Neural Network Energy Landscape.

Felix Draxler Kambis Veschgini Manfred Salmhofer Fred A. Hamprecht

Low-Rank Riemannian Optimization on Positive Semidefinite Stochastic Matrices with Applications to Graph Clustering.

Ahmed Douik Babak Hassibi

Randomized Block Cubic Newton Method.

Nikita Doikov Peter Richtárik

Probabilistic Recurrent State-Space Models.

Andreas Doerr Christian Daniel Martin Schiegg Duy Nguyen-Tuong Stefan Schaal Marc Toussaint Sebastian Trimpe

Coordinated Exploration in Concurrent Reinforcement Learning.

Maria Dimakopoulou Benjamin Van Roy

Discovering and Removing Exogenous State Variables and Rewards for Reinforcement Learning.

Thomas G. Dietterich George Trimponias Zhitang Chen

Noisin: Unbiased Regularization for Recurrent Neural Networks.

Adji Bousso Dieng Rajesh Ranganath Jaan Altosaar David M. Blei

Learning to Act in Decentralized Partially Observable MDPs.

Jilles Steeve Dibangoye Olivier Buffet

Alternating Randomized Block Coordinate Descent.

Jelena Diakonikolas Lorenzo Orecchia

Modeling Sparse Deviations for Compressed Sensing using Generative Models.

Manik Dhar Aditya Grover Stefano Ermon

Variational Network Inference: Strong and Stable with Concrete Support.

Amir Dezfouli Edwin V. Bonilla Richard Nock

Accurate Inference for Adaptive Linear Models.

Yash Deshpande Lester W. Mackey Vasilis Syrgkanis Matt Taddy

Decomposition of Uncertainty in Bayesian Deep Learning for Efficient and Risk-sensitive Learning.

Stefan Depeweg José Miguel Hernández-Lobato Finale Doshi-Velez Steffen Udluft

Stochastic Video Generation with a Learned Prior.

Emily Denton Rob Fergus

Minibatch Gibbs Sampling on Large Graphical Models.

Christopher De Sa Vincent Chen Wing Wong

Escaping Saddles with Stochastic Gradients.

Hadi Daneshmand Jonas Moritz Kohler Aurélien Lucchi Thomas Hofmann

Asynchronous Byzantine Machine Learning (the case of SGD).

Georgios Damaskinos El Mahdi El Mhamdi Rachid Guerraoui Rhicheek Patra Mahsa Taziki

Compressing Neural Networks using the Variational Information Bottleneck.

Bin Dai Chen Zhu Baining Guo David P. Wipf

SBEED: Convergent Reinforcement Learning with Nonlinear Function Approximation.

Bo Dai Albert Shaw Lihong Li Lin Xiao Niao He Zhen Liu Jianshu Chen Le Song

Adversarial Attack on Graph Structured Data.

Hanjun Dai Hui Li Tian Tian Xin Huang Lin Wang Jun Zhu Le Song

Learning Steady-States of Iterative Algorithms over Graphs.

Hanjun Dai Zornitsa Kozareva Bo Dai Alexander J. Smola Le Song

Implicit Quantile Networks for Distributional Reinforcement Learning.

Will Dabney Georg Ostrovski David Silver Rémi Munos

Mix & Match Agent Curricula for Reinforcement Learning.

Wojciech Marian Czarnecki Siddhant M. Jayakumar Max Jaderberg Leonard Hasenclever Yee Whye Teh Nicolas Heess Simon Osindero Razvan Pascanu

Inference Suboptimality in Variational Autoencoders.

Chris Cremer Xuechen Li David Duvenaud

Constrained Interacting Submodular Groupings.

Andrew Cotter Mahdi Milani Fard Seungil You Maya R. Gupta Jeff A. Bilmes

Online Learning with Abstention.

Corinna Cortes Giulia DeSalvo Claudio Gentile Mehryar Mohri Scott Yang

Efficient ModelBased Deep Reinforcement Learning with Variational State Tabulation.

Dane S. Corneil Wulfram Gerstner Johanni Brea

Leveraging Well-Conditioned Bases: Streaming and Distributed Summaries in Minkowski p-Norms.

Graham Cormode Charlie Dickens David P. Woodruff

GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms.

Cédric Colas Olivier Sigaud Pierre-Yves Oudeyer

Online Linear Quadratic Control.

Alon Cohen Avinatan Hassidim Tomer Koren Nevena Lazic Yishay Mansour Kunal Talwar

On Acceleration with Noise-Corrupted Gradients.

Michael Cohen Jelena Diakonikolas Lorenzo Orecchia

Self-Consistent Trajectory Autoencoder: Hierarchical Reinforcement Learning with Trajectory Embeddings.

John D. Co-Reyes Yuxuan Liu Abhishek Gupta Benjamin Eysenbach Pieter Abbeel Sergey Levine

Stochastic Wasserstein Barycenters.

Sebastian Claici Edward Chien Justin Solomon

An Iterative, Sketching-based Framework for Ridge Regression.

Agniva Chowdhury Jiasen Yang Petros Drineas

Path Consistency Learning in Tsallis Entropy Regularized MDPs.

Yinlam Chow Ofir Nachum Mohammad Ghavamzadeh

Structured Evolution with Compact Architectures for Scalable Policy Optimization.

Krzysztof Choromanski Mark Rowland Vikas Sindhwani Richard E. Turner Adrian Weller

Learning a Mixture of Two Multinomial Logits.

Flavio Chierichetti Ravi Kumar Andrew Tomkins

Extreme Learning to Rank via Low Rank Assumption.

Minhao Cheng Ian Davidson Cho-Jui Hsieh

Stochastic Training of Graph Convolutional Networks with Variance Reduction.

Jianfei Chen Jun Zhu Le Song

End-to-End Learning for the Deep Multivariate Probit Model.

Di Chen Yexiang Xue Carla P. Gomes

Covariate Adjusted Precision Matrix Estimation via Nonconvex Optimization.

Jinghui Chen Pan Xu Lingxiao Wang Jian Ma Quanquan Gu

SADAGRAD: Strongly Adaptive Stochastic Gradient Methods.

Zaiyi Chen Yi Xu Enhong Chen Tianbao Yang

DRACO: Byzantine-resilient Distributed Training via Redundant Gradients.

Lingjiao Chen Hongyi Wang Zachary B. Charles Dimitris S. Papailiopoulos

Variational Inference and Model Selection with Generalized Evidence Bounds.

Liqun Chen Chenyang Tao Ruiyi Zhang Ricardo Henao Lawrence Carin

Learning to Explain: An Information-Theoretic Perspective on Model Interpretation.

Jianbo Chen Le Song Martin J. Wainwright Michael I. Jordan

Dynamical Isometry and a Mean Field Theory of RNNs: Gating Enables Signal Propagation in Recurrent Neural Networks.

Minmin Chen Jeffrey Pennington Samuel S. Schoenholz

PixelSNAIL: An Improved Autoregressive Generative Model.

Xi Chen Nikhil Mishra Mostafa Rohaninejad Pieter Abbeel

Learning K-way D-dimensional Discrete Codes for Compact Embedding Representations.

Ting Chen Martin Renqiang Min Yizhou Sun

Stein Points.

Wilson Ye Chen Lester W. Mackey Jackson Gorham François-Xavier Briol Chris J. Oates

Scalable Bilinear Learning Using State and Action Features.

Yichen Chen Lihong Li Mengdi Wang

Continuous-Time Flows for Efficient Inference and Density Estimation.

Changyou Chen Chunyuan Li Liquan Chen Wenlin Wang Yunchen Pu Lawrence Carin

Projection-Free Online Optimization with Stochastic Gradient: From Convexity to Submodularity.

Lin Chen Christopher Harshaw Hamed Hassani Amin Karbasi

Weakly Submodular Maximization Beyond Cardinality Constraints: Does Randomization Help Greedy?

Lin Chen Moran Feldman Amin Karbasi

GradNorm: Gradient Normalization for Adaptive Loss Balancing in Deep Multitask Networks.

Zhao Chen Vijay Badrinarayanan Chen-Yu Lee Andrew Rabinovich

Hierarchical Deep Generative Models for Multi-Rate Multivariate Time Series.

Zhengping Che Sanjay Purushotham Max Guangyu Li Bo Jiang Yan Liu

Hierarchical Clustering with Structural Constraints.

Vaggos Chatziafratis Rad Niazadeh Moses Charikar

On the Theory of Variance Reduction for Stochastic Gradient Monte Carlo.

Niladri S. Chatterji Nicolas Flammarion Yi-An Ma Peter L. Bartlett Michael I. Jordan

Learning and Memorization.

Satrajit Chatterjee

Stability and Generalization of Learning Algorithms that Converge to Global Optima.

Zachary B. Charles Dimitris S. Papailiopoulos

Adversarial Time-to-Event Modeling.

Paidamoyo Chapfuwa Chenyang Tao Chunyuan Li Courtney Page Benjamin Alan Goldstein Lawrence Carin Ricardo Henao

Conditional Noise-Contrastive Estimation of Unnormalised Models.

Ciwan Ceylan Michael U. Gutmann

Fair and Diverse DPP-Based Data Summarization.

L. Elisa Celis Vijay Keswani Damian Straszak Amit Deshpande Tarun Kathuria Nisheeth K. Vishnoi

Adversarial Learning with Local Coordinate Coding.

Jiezhang Cao Yong Guo Qingyao Wu Chunhua Shen Junzhou Huang Mingkui Tan

Bayesian Coreset Construction via Greedy Iterative Geodesic Ascent.

Trevor Campbell Tamara Broderick

Improved Large-Scale Graph Learning through Ridge Spectral Sparsification.

Daniele Calandriello Ioannis Koutis Alessandro Lazaric Michal Valko

Path-Level Network Transformation for Efficient Architecture Search.

Han Cai Jiacheng Yang Weinan Zhang Song Han Yong Yu

Quasi-Monte Carlo Variational Inference.

Alexander Buchholz Florian Wenzel Stephan Mandt

Predict and Constrain: Modeling Cardinality in Deep Structured Prediction.

Nataly Brukhim Amir Globerson

Matrix Norms in Data Streams: Faster, Multi-Pass and Row-Order.

Vladimir Braverman Stephen R. Chestnut Robert Krauthgamer Yi Li David P. Woodruff Lin F. Yang

QuantTree: Histograms for Change Detection in Multivariate Data Streams.

Giacomo Boracchi Diego Carrera Cristiano Cervellera Danilo Macciò

Prediction Rule Reshaping.

Matt Bonakdarpour Sabyasachi Chatterjee Rina Foygel Barber John Lafferty

A Progressive Batching L-BFGS Method for Machine Learning.

Raghu Bollapragada Dheevatsa Mudigere Jorge Nocedal Hao-Jun Michael Shi Ping Tak Peter Tang

NetGAN: Generating Graphs via Random Walks.

Aleksandar Bojchevski Oleksandr Shchur Daniel Zügner Stephan Günnemann

Optimizing the Latent Space of Generative Networks.

Piotr Bojanowski Armand Joulin David Lopez-Paz Arthur Szlam

Adaptive Sampled Softmax with Kernel Based Sampling.

Guy Blanc Steffen Rendle

Autoregressive Convolutional Neural Networks for Asynchronous Time Series.

Mikolaj Binkowski Gautier Marti Philippe Donnat

Distributed Clustering via LSH Based Data Partitioning.

Aditya Bhaskara Maheshakya Wijewardena

SIGNSGD: Compressed Optimisation for Non-Convex Problems.

Jeremy Bernstein Yu-Xiang Wang Kamyar Azizzadenesheli Animashree Anandkumar

Understanding and Simplifying One-Shot Architecture Search.

Gabriel Bender Pieter-Jan Kindermans Barret Zoph Vijay Vasudevan Quoc V. Le

To Understand Deep Learning We Need to Understand Kernel Learning.

Mikhail Belkin Siyuan Ma Soumik Mandal

Mutual Information Neural Estimation.

Mohamed Ishmael Belghazi Aristide Baratin Sai Rajeswar Sherjil Ozair Yoshua Bengio R. Devon Hjelm Aaron C. Courville

Gradient descent with identity initialization efficiently learns positive definite linear transformations.

Peter L. Bartlett David P. Helmbold Philip M. Long

Transfer in Deep Reinforcement Learning Using Successor Features and Generalised Policy Improvement.

André Barreto Diana Borsa John Quan Tom Schaul David Silver Matteo Hessel Daniel J. Mankowitz Augustin Zídek Rémi Munos

Testing Sparsity over Known and Unknown Bases.

Siddharth Barman Arnab Bhattacharyya Suprovat Ghoshal

Learning to Coordinate with Coordination Graphs in Repeated Single-Stage Multi-Agent Decision Problems.

Eugenio Bargiacchi Timothy Verstraeten Diederik M. Roijers Ann Nowé Hado van Hasselt

Geodesic Convolutional Shape Optimization.

Pierre Baqué Edoardo Remelli François Fleuret Pascal Fua

Bayesian Optimization of Combinatorial Structures.

Ricardo Baptista Matthias Poloczek

Classification from Pairwise Similarity and Unlabeled Data.

Han Bao Gang Niu Masashi Sugiyama

Using Inherent Structures to design Lean 2-layer RBMs.

Abhishek Bansal Abhinav Anand Chiranjib Bhattacharyya

Improved Training of Generative Adversarial Networks using Representative Features.

Duhyeon Bang Hyunjung Shim

Improving Optimization in Models With Continuous Symmetry Breaking.

Robert Bamler Stephan Mandt

Differentially Private Database Release via Kernel Mean Embeddings.

Matej Balog Ilya O. Tolstikhin Bernhard Schölkopf

Dissecting Adam: The Sign, Magnitude and Variance of Stochastic Gradients.

Lukas Balles Philipp Hennig

Improving the Gaussian Mechanism for Differential Privacy: Analytical Calibration and Optimal Denoising.

Borja Balle Yu-Xiang Wang

Approximation Guarantees for Adaptive Sampling.

Eric Balkanski Yaron Singer

A Spline Theory of Deep Networks.

Randall Balestriero Richard G. Baraniuk

Spline Filters For End-to-End Deep Learning.

Randall Balestriero Romain Cosentino Hervé Glotin Richard G. Baraniuk

The Mechanics of n-Player Differentiable Games.

David Balduzzi Sébastien Racanière James Martens Jakob N. Foerster Karl Tuyls Thore Graepel

Learning to Branch.

Maria-Florina Balcan Travis Dick Tuomas Sandholm Ellen Vitercik

A Boo(n) for Evaluating Architecture Performance.

Ondrej Bajgar Rudolf Kadlec Jan Kleindienst

SMAC: Simultaneous Mapping and Clustering Using Spectral Decompositions.

Chandrajit Bajaj Tingran Gao Zihang He Qixing Huang Zhenxiao Liang

Comparing Dynamics: Deep Neural Networks versus Glassy Systems.

Marco Baity-Jesi Levent Sagun Mario Geiger Stefano Spigler Gérard Ben Arous Chiara Cammarota Yann LeCun Matthieu Wyart Giulio Biroli

Greed is Still Good: Maximizing Monotone Submodular+Supermodular (BP) Functions.

Wenruo Bai Jeffrey A. Bilmes

Contextual Graph Markov Model: A Deep and Generative Approach to Graph Processing.

Davide Bacciu Federico Errica Alessio Micheli

Clustering Semi-Random Mixtures of Gaussians.

Pranjal Awasthi Aravindan Vijayaraghavan

Synthesizing Robust Adversarial Examples.

Anish Athalye Logan Engstrom Andrew Ilyas Kevin Kwok

Obfuscated Gradients Give a False Sense of Security: Circumventing Defenses to Adversarial Examples.

Anish Athalye Nicholas Carlini David A. Wagner

Lipschitz Continuity in Model-based Reinforcement Learning.

Kavosh Asadi Dipendra Misra Michael L. Littman

Stronger Generalization Bounds for Deep Nets via a Compression Approach.

Sanjeev Arora Rong Ge Behnam Neyshabur Yi Zhang

On the Optimization of Deep Networks: Implicit Acceleration by Overparameterization.

Sanjeev Arora Nadav Cohen Elad Hazan

Efficient Gradient-Free Variational Inference using Policy Search.

Oleg Arenz Mingjun Zhong Gerhard Neumann

Subspace Embedding and Linear Regression with Orlicz Norm.

Alexandr Andoni Chengyu Lin Ying Sheng Peilin Zhong Ruiqi Zhong

MAGAN: Aligning Biological Manifolds.

Matthew Amodio Smita Krishnaswamy

Meta-Learning by Adjusting Priors Based on Extended PAC-Bayes Theory.

Ron Amit Ron Meir

Augmented CycleGAN: Learning Many-to-Many Mappings from Unpaired Data.

Amjad Almahairi Sai Rajeswar Alessandro Sordoni Philip Bachman Aaron C. Courville

Make the Minority Great Again: First-Order Regret Bound for Contextual Bandits.

Zeyuan Allen-Zhu Sébastien Bubeck Yuanzhi Li

Katyusha X: Practical Momentum Method for Stochastic Sum-of-Nonconvex Optimization.

Zeyuan Allen-Zhu

Differentially Private Identity and Equivalence Testing of Discrete Distributions.

Maryam Aliakbarpour Ilias Diakonikolas Ronitt Rubinfeld

Fixing a Broken ELBO.

Alexander A. Alemi Ben Poole Ian Fischer Joshua V. Dillon Rif A. Saurous Kevin Murphy

Information Theoretic Guarantees for Empirical Risk Minimization with Applications to Model Selection and Large-Scale Optimization.

Ibrahim M. Alabdulmohsin

AutoPrognosis: Automated Clinical Prognostic Modeling via Bayesian Optimization with Structured Kernel Learning.

Ahmed M. Alaa Mihaela van der Schaar

Limits of Estimating Heterogeneous Treatment Effects: Guidelines for Practical Algorithm Design.

Ahmed M. Alaa Mihaela van der Schaar

oi-VAE: Output Interpretable VAEs for Nonlinear Group Factor Analysis.

Samuel K. Ainsworth Nicholas J. Foti Adrian K. C. Lee Emily B. Fox

Bucket Renormalization for Approximate Inference.

Sungsoo Ahn Michael Chertkov Adrian Weller Jinwoo Shin

Proportional Allocation: Simple, Distributed, and Diverse Matching with High Entropy.

Shipra Agrawal Morteza Zadimoghaddam Vahab S. Mirrokni

Minimal I-MAP MCMC for Scalable Structure Discovery in Causal DAG Models.

Raj Agrawal Caroline Uhler Tamara Broderick

MISSION: Ultra Large-Scale Feature Selection using Count-Sketches.

Amirali Aghazadeh Ryan Spring Daniel LeJeune Gautam Dasarathy Anshumali Shrivastava Richard G. Baraniuk

Accelerated Spectral Ranking.

Arpit Agarwal Prathamesh Patil Shivani Agarwal

A Reductions Approach to Fair Classification.

Alekh Agarwal Alina Beygelzimer Miroslav Dudík John Langford Hanna M. Wallach

Discovering Interpretable Representations for Both Deep Generative and Discriminative Models.

Tameem Adel Zoubin Ghahramani Adrian Weller

Learning Representations and Generative Models for 3D Point Clouds.

Panos Achlioptas Olga Diamanti Ioannis Mitliagkas Leonidas J. Guibas

INSPECTRE: Privately Estimating the Unseen.

Jayadev Acharya Gautam Kamath Ziteng Sun Huanyu Zhang

Policy and Value Transfer in Lifelong Reinforcement Learning.

David Abel Yuu Jinnai Sophie Yue Guo George Dimitri Konidaris Michael L. Littman

State Abstractions for Lifelong Reinforcement Learning.

David Abel Dilip Arumugam Lucas Lehnert Michael L. Littman

Improved Regret Bounds for Thompson Sampling in Linear Quadratic Control Problems.

Marc Abeille Alessandro Lazaric