DOI: https://doi.org/10.26089/NumMet.v20r320

Параллельный алгоритм поиска диссонансов временного ряда для многоядерных ускорителей

Авторы

  • М.Л. Цымблер

Ключевые слова:

временной ряд
поиск диссонансов
параллельный алгоритм
векторизация вычислений
OpenMP
OpenAcc
Intel Xeon Phi
NVIDIA GPU

Аннотация

Диссонанс является уточнением понятия аномальной подпоследовательности (существенно непохожей на остальные подпоследовательности) временного ряда. Задача поиска диссонанса встречается в широком спектре предметных областей, связанных с временными рядами: медицина, экономика, моделирование климата и др. В работе предложен новый параллельный алгоритм поиска диссонанса во временном ряде на платформе многоядерного ускорителя для случая, когда входные данные могут быть размещены в оперативной памяти. Алгоритм использует возможность независимого вычисления евклидовых расстояний между подпоследовательностями ряда. Алгоритм состоит из двух этапов: подготовка данных и поиск. На этапе подготовки выполняется построение вспомогательных матричных структур данных, обеспечивающих распараллеливание и векторизацию вычислений. На стадии поиска осуществляется нахождение диссонанса с помощью построенных структур данных. Выполнена реализация алгоритма для ускорителей архитектур Intel MIC (Many Integrated Core) и NVIDIA GPU, распараллеливание выполнено с помощью технологий программирования OpenMP и OpenAcc соответственно. Представлены результаты вычислительных экспериментов, подтверждающих масштабируемость разработанного алгоритма.


Загрузки

Опубликован

25.06.2019

Выпуск

Раздел

Раздел 1. Вычислительные методы и приложения

Об авторе

М.Л. Цымблер


Библиографические ссылки

  1. V. V. Voevodin and Vl. V. Voevodin, The Parallel Computing (BHV-Petersburg, St. Petersburg, 2002) [in Russian].
  2. Hardware Specifications of the Siberian Supercomputing Center.
    http://www.sscc.icmmg.nsc.ru/hardware.html . Cited June 5, 2019.
  3. J. Ameen and R. Basha, “Mining Time Series for Identifying Unusual Sub-sequences with Applications,” in Proc. 1st Int. Conf. on Innovative Computing, Information and Control (ICICIC 2006), Beijing, China, August 30-September 1, 2006 (IEEE Press, New York, 2006). 574-577.
  4. D. F. Bacon, S. L. Graham, and O. J. Sharp, “Compiler Transformations for High-Performance Computing,” ACM Comput. Surv. 26 (4), 345-420 (1994).
  5. M. C. Chuah and F. Fu, “ECG Anomaly Detection via Time Series Analysis,” in Lecture Notes in Computer Science (Springer, Berlin, 2007), Vol. 4743, pp. 123-135.
  6. J. Dean and S. Ghemawat, “MapReduce: Simplified Data Processing on Large Clusters,” Commun. ACM 51 (1), 107-113 (2008).
  7. A. Duran and M. Klemm, “The Intel Many Integrated Core Architecture,” in Proc. 2012 Int. Conf. on High Performance Computing and Simulation, Madrid, Spain, July 2-6, 2012 (IEEE Press, New York, 2012), pp. 365-366.
  8. E. Fredkin, “Trie Memory,” Commun. ACM 3 (9), 490-499 (1960).
  9. A.W.-C. Fu, O.T.-W. Leung, E. Keogh, and J. Lin, “Finding Time Series Discords Based on Haar Transform,” in Lecture Notes in Computer Science (Springer, Berlin, 2006), Vol. 4093, pp. 31-41.
  10. O. Goldreich, Computational Complexity: A Conceptual Perspective (Cambridge Univ. Press, New York, 2008).
  11. T. Huang, Y. Zhu, Y. Mao, et al., “Parallel Discord Discovery,” in Lecture Notes in Computer Science (Springer, Cham, 2016), Vol. 9652, pp. 233-244.
  12. E. Keogh, J. Lin, and A. Fu, “HOT SAX: Efficiently Finding the Most Unusual Time Series Subsequence,” in Proc. 5th IEEE Int. Conf. on Data Mining, Houston, USA, November 27-30, 2005 (IEEE Press, New York, 2005), pp. 226-233.
  13. E. Keogh, S. Lonardi, and C. A. Ratanamahatana, “Towards Parameter-Free Data Mining,” in Proc. 10th ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, Seattle, USA, August 22-25, 2004 (ACM Press, New York, 2004), pp. 206-215.
  14. D. E. Knuth, The Art of Computer Programming , Vol. 4: Fascicle 3: Generating All Combinations and Partitions (Addison-Wesley, Reading, 2005).
  15. G. Li, O. Br854ysy, L. Jiang, et al., “Finding Time Series Discord Based on Bit Representation Clustering,” Knowl. Based Syst. 54, 243-254 (2013).
  16. J. Lin, E. Keogh, S. Lonardi, and B. Chiu, “A Symbolic Representation of Time Series, with Implications for Streaming Algorithms,” in Proc. 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery, San Diego, USA, June 13, 2003 (ACM Press, New York, 2004), pp. 2-11.
  17. T. Mattson, “Introduction to OpenMP,” in Proc. 2006 ACM/IEEE Conf. on Supercomputing, Tampa, USA, November 11-17, 2006 (ACM Press, New York, 2006),
    doi 10.1145/1188455.1188673
  18. J. Owens, “GPU Architecture Overview,” in Proc. Int. Conf. on Computer Graphics and Interactive Techniques, San Diego, USA, August 5-9, 2007 (ACM Press, New York, 2007),
    doi 10.1145/1281500.1281643
  19. R. Reyes, I. López, J. J. Fumero, and F. de Sande, “A Preliminary Evaluation of OpenACC Implementations,” J. Supercomput. 65 (3), 1063-1075 (2013).
  20. H. T. T. Thuy, D. T. Anh, and V. T. N. Chau, “An Effective and Efficient Hash-Based Algorithm for Time Series Discord Discovery,” in Proc. 3rd National Foundation for Science and Technology Development Conf. on Information and Computer Science, Danang, Vietnam, September 14-16, 2016 (IEEE Press, New York, 2016), pp. 85-90.
  21. Y. Wu, Y. Zhu, T. Huang, et al., “Distributed Discord Discovery: Spark Based Anomaly Detection in Time Series,” in Proc. 17th IEEE Int. Conf. on High Performance Computing and Communications, New York, USA, August 24-26, 2015 (IEEE Press, New York, 2015), pp. 154-159.
  22. D. Yankov, E. Keogh, and U. Rebbapragada, “Disk Aware Discord Discovery: Finding Unusual Time Series in Terabyte Sized Datasets,” in Proc. 7th IEEE Int. Conf. on Data Mining, Omaha, October 28-31, 2007 (IEEE Press, New York, 2007), pp. 381-390.
  23. D. Yankov, E. Keogh, and U. Rebbapragada, “Disk Aware Discord Discovery: Finding Unusual Time Series in Terabyte Sized Datasets,” Knowl. Inf. Syst. 17 (2), 241-262 (2008).
  24. M. Zaharia, M. Chowdhury, M. J. Franklin, et al., “Spark: Cluster Computing with Working sets,” in Proc. 2nd USENIX Workshop on Hot Topics in Cloud Computing, Boston, USA, June 22-25, 2010 (USENIX Association, Berkeley, 2010),
    |
    https://www.usenix.org/legacy/event/hotcloud10/tech/full_papers/Zaharia.pdf|. Cited June 5, 2019.