Хранение
больших данных – область знания, которая включает в себя:
основные принципы и концепции в организации структурированных и
полуструктурированных данных, а также в управлении
ими; теорию и технологии баз данных и хранилищ больших данных; аспекты безопасности,
интеграции, качества данных.
Авторы курса: к.ф.‑м.н., доцент Шапошников Д. Е., ассистент Свистунов А. Н.
Цель данного курса состоит в формировании необходимой теоретической и практической базы в области современного состояния баз данных для дальнейшего развития знаний в области работы с большими данными (Big Data). Курс предусматривает формирование концептуальных представления об основных принципах построения баз данных и систем управления базами данных; о математических моделях, описывающих базу данных; о принципах проектирования баз данных; а также анализе основных технологий реализации баз данных.
Автор и лектор курса -- д.т.н., профессор Кузнецов Сергей Дмитриевич
В первой части курса обсуждаются базовые модельно-языковые аспекты современной технологии баз данных. Наиболее подробно излагаются теоретические основы реляционной и SQL-ориентированной моделей данных. Вторая часть курса посвящена структурам данных, методам и алгоритмам, применяемым в современных SQL-ориентированных СУБД. Обсуждаются применяемые архитектурные решения, методы хранения данных во внешней памяти, методы индексации, методы управления транзакциями и восстановления баз данных после сбоев.
Авторы и лекторы курса: Герасимов Сергей Валерьевич, Казачук Мария Андреевна
Аналитика больших данных является одной из важных составляющих успеха таких титанов IT-индустрии, как Facebook, Amazon, Google, IBM, Microsoft. Данный курс посвящен изучению современных технологий анализа больших данных. Рассматриваются технологии и парадигмы OLAP, MapReduce, Hadoop, HDFS, YARN и пр. Курс предполагает проведение теоретических и практических занятий, формой отчетности является экзамен.