Хранение больших данных – область знания, которая включает в себя: основные принципы и концепции в организации структурированных и полуструктурированных данных, а также в управлении ими; теорию и технологии баз данных и хранилищ больших данных; аспекты безопасности, интеграции, качества данных.

Авторы курса: к.ф.‑м.н., доцент Шапошников Д. Е., ассистент Свистунов А. Н.

Цель данного курса состоит в формировании необходимой теоретической и практической базы в области современного состояния баз данных для дальнейшего развития знаний в области работы с большими данными (Big Data). Курс предусматривает формирование концептуальных представления об основных принципах построения баз данных и систем управления базами данных; о математических моделях, описывающих базу данных; о принципах проектирования баз данных; а также анализе основных технологий реализации баз данных.

Автор и лектор курса -- д.т.н., профессор Кузнецов Сергей Дмитриевич

В первой части курса обсуждаются базовые модельно-языковые аспекты современной технологии баз данных. Наиболее подробно излагаются теоретические основы реляционной и SQL-ориентированной моделей данных. Вторая часть курса посвящена структурам данных, методам и алгоритмам, применяемым в современных SQL-ориентированных СУБД. Обсуждаются применяемые архитектурные решения, методы хранения данных во внешней памяти, методы индексации, методы управления транзакциями и восстановления баз данных после сбоев.

Авторы и лекторы курса: Герасимов Сергей Валерьевич, Казачук Мария Андреевна

Аналитика больших данных является одной из важных составляющих успеха таких титанов IT-индустрии, как Facebook, Amazon, Google, IBM, Microsoft. Данный курс посвящен изучению современных технологий анализа больших данных. Рассматриваются технологии и парадигмы OLAP, MapReduce, Hadoop, HDFS, YARN и пр. Курс предполагает проведение теоретических и практических занятий, формой отчетности является экзамен.