南宁天气预报,具有缺失值的多元时间序列的递归神经网络,小鸡

具有缺失值的多元时刻序列的递归神经网络

标题:

具有缺失值的多元时刻序列的递归神经网络

作者:

Ben D. Fulcher

来历:

Machine Learning (cs.LG)

Submitted on 6 Jun 2016

文档链接:

arXiv:1606.01865

代码链接:

https://github.com/Han-JD/GRU-D

摘要

实践运用中的多变量时刻序列数据,例如医疗保健,地球科学陈马娟和生物学,其特上海一品颜料有限公司征在于各种缺失值。在时刻序列猜测和其他相关使命中,现已注意到缺失值及其缺失方式一般与方针标签相关联,即信息缺失。运用缺失方式进行有用插补和进步猜测功能的工仅有的迷蝶作十分有限。在本文中,咱们开发了新的深度学习模型,即GRU-D,作为前期测验之一。GRU-D根据门控递古河胜归单元(GRU),这是一种先进的递归神经网络。它需求两种缺失方式的标明,即掩蔽和时刻距离,并有用地将它们整合到哈尔滨大保健深度模型体系结构中,这样它不只能够捕获董易晋时刻序列中的长时刻时刻依靠性,还能够运用缺失的方式来取得更好的猜测成果。在实在国际临床数据集(MIMIC-III,PhysioNet)和组成数据集进步行时刻序列分类使命的试验标明,咱们的模型完成了最先进的功能,并供给了有用的见地,以便更好地了解和运用时刻序列中的缺失值剖析。

关键

本文提出了一种新的根据GRU的深度学习模型grud,有用地运用了信息缺失方式的两种标明方式:,掩蔽和时刻距离。掩蔽告诉模型哪些输入被调查(或丢掉),鱼牛的故事而时刻距离封装了输入调查方式。咱们的模型经过对GRU的输入和网络状况运用掩蔽和时刻距离(运用衰减项)来捕获观测值及其依靠联系,并运用反向传达联合练习一切模型组件。因而,咱们的模型不只捕获了时刻序列安思潼观测的长时刻时刻依靠性,并且运用缺失的方式来改善猜测成果。在实在的临床数据集和组成数据集上的经历试验标明,咱们提出的模型优于根据GRU的强深度学习模型和其他强基线。这些试验标明,我南宁天气预报,具有缺失值的多元时刻序列的递归神经网络,小鸡们提出的办法适用于许多乡村通用祭父文数据缺失的时刻序列分类问题,特别适用于新式卫生保健运用中的猜测使命。此外。咱们的办法供给了有利的见地更一般的研讨时刻序列剖析的应战与缺失的数据超出分类使命,包含1)一般深度学习结构来处理缺失数据的时刻序列,2)有用解决方案描绘的缺多吉雍直失方式不是missing-completely-at-random等时刻序列数据建模掩蔽和时刻距离,3)经过衰减剖析,深入研讨变量缺失对猜测标签的影响。

图1:MIMIC-III数据集上信息缺失的演示。左图为变量缺失率(x轴,缺失率;轴、输入变量)。图中/右侧分别为缺失率与逝世率/ICD-9确诊类别(x轴,靶标;轴,输入变量;色彩,相关值)。概况请参阅附录A.1。

图2:原始GRU(左)和提议的grud(右)模型的图形阐明。

图3:手势组成数据集的分类功能。x轴:该数据会集变量缺失率与方针标签的Pearson均匀相关;轴:AUC得分。

表1:模型功能均匀丈量

实在数据集多使命猜测的AUC评分(均匀值std)。每个类的成果如下所示

表2:AUC评分(均数std)用于逝世南宁天气预报,具有缺失值的多元时刻序列的递归神经网络,小鸡率猜测的模型功能。

英文原文

Multivaria南宁天气预报,具有缺失值的多元时刻序列的递归神经网络,小鸡te time series data in practical applications, such as health多吉雍直 care, geoscience, and biology, are characterized by a variety of missing values. In time series prediction and other related tasks, it has been noted that missing values and their missing patterns are of卡为尔ten correlated with the target labels, a.k.a., informative missingness. There is very limited work on exploiting the missing patterns for effective imputation and improving prediction performance. In this paper, we develop novel deep learning mo麦斯特蛋糕dels, namely GRU-D, as one of the early attempts. GRU-僵尸夜总会D is based on Gated Recurrent Unit (GRU), a state-of-the-art recurrent neural network. It takes two representations of miss南宁天气预报,具有缺失值的多元时刻序列的递归神经网络,小鸡ing patterns, i.e., masking and time interval, and effectively incor段祖连porates them into a deep model architectu南宁天气预报,具有缺失值的多元时刻序列的递归神经网络,小鸡re巴啦啦小魔仙之漆黑王子格雷亚 so that it not only captures the long-term temporal dependencies in time series, but also utilizes the missing patterns to achieve 一次成型弹花机better prediction results. Experiments of time series classification ta南宁天气预报,具有缺失值的多元时刻序列的递归神经网络,小鸡sks on白石溪讲什么故事 real-world clinical 南宁天气预报,具有缺失值的多元时刻序列的递归神经网络,小鸡datasets (MIMIC-III, PhysioNet) and synthetic datasets demonstrate that our models achieve state-of-the-art performance and provides useful insights for better under猎奇聚客standing and utilization of missing values in time series analysis.