Предметно-ориентированные
знания – это связующее звено между технологиями хранения и анализа
больших данных и решением прикладных задач в различных предметных областях:
обработке изображений и компьютерном зрении; обработке текстов
на естественных языках; информационном поиске; приложениях в естественных
науках и т. д.
Автор и лектор курса -- д.т.н., в.н.с. Лукашевич Наталья Валентиновна
В курсе будут рассмотрены различные методы работы с большими текстовыми данными включая:
• модели представления текстов в информационно-поисковых системах
• методы классификации, кластеризации и аннотирования текстов
• методы сокращения размерности при работе с текстами
• методы учета поведения пользователей в информационно-поисковых системах и др.
Автор и лектор курса -- к. б. н., в. н. с. Голозубов Олег Модестович
В курсе рассматриваются понятия и технологии Big Data, правило 4-х «V», постановки задач и их решений применительно к задачам почвенного мониторинга и оценки земельных ресурсов на распределенной сети почвенных дата-центров.
Автор и лектор курса -- д. б. н., профессор Алябина Ирина Олеговна
Освоение дисциплины «Географические информационные системы для анализа данных в почвоведении и экологии почв» формирует у студентов теоретические знания о геоинформационных системах, возможностях их использования для анализа данных (в том числе, Больших Данных -– Big Data) в почвоведении и экологии почв. В рамках курса студент должен приобрести практические навыки работы с пространственно-распределёнными данными в специализированных программах, освоить основные алгоритмы.
Авторы курса: к.ф.-м.н. Ватолин Дмитрий Сергеевич, к.ф.-м.н. Ерофеев Михаил Викторович
Видеоданные составляют большую часть от объема всех данных, передаваемых через сеть Интернет в наши дни. В течение всего одного дня на популярные платформы для обмена видео загружается видео, общая продолжительность которого превышает продолжительность человеческой жизни. Сотни тысяч камер видеонаблюдения по всей Москве непрерывно производят потоки видеоданных. Для хранения и анализа таких гигантских объемов видеоданных требуется знакомство как с общими методами обработки и хранения больших данных, так и со специфичными для видеоданных алгоритмами.
Авторы курса: к.ф.-м.н. Кузнецов С. Л., профессор, д.ф.-м.н. Пентус М. Т., к.ф.-м.н. Сорокин А. А.
Современное
языкознание немыслимо без использования точных, прежде всего математических,
методов. Эти методы применяются для исследования больших массивов
лингвистических данных (корпусов), в том числе так называемых корпусов с
древовидными структурами (tree banks). Одну из важных групп таких методов
образуют алгебро-логические подходы к формализации структуры языка и
синтаксическому анализу. В курсе рассказывается об этой группе методов на
примере категориальных грамматик — семейства основанных на логических
исчислениях формализмов, используемых для описания синтаксиса и семантики
(«смысла») предложений на естественных языках.
Автор и лектор курса: д.т.н., профессор Местецкий Леонид Моисеевич
В курсе будут рассмотрены ключевые понятия и
задачи распознавания изображений, а также основные современные методы их
решения. Будут рассмотрены методы классификация изображений, выделение
объектов, поиск изображений по содержанию, преобразование изображений, отслеживание
объектов и распознавание событий в видео, трёхмерная реконструкция, локализация
и построение карт.
Авторы курса: к.ф.-м.н. Конушин Антон Сергеевич, Шахуро Владислав Игоревич
Курс посвящен изучению математических методов распознавания образов, используемых для анализа и классификации изображений в системах компьютерного зрения.
Автор и лектор курса: д.ф.-м.н., профессор Дьяконов Александр Геннадьевич
Курс введён в учебную программу факультета ВМК МГУ в связи с популярностью и востребованностью технологий хранения и анализа больших данных. Курс посвящён, в основном, главным этапам анализа данных: подготовке, селекции и использованию массивов информации, отдельно представлены кейсы – примеры решений нетривиальных прикладных задач, рассматриваются задачи анализа текстов.
Автор и лектор курса -- д.ф.-м.н., профессор Шестаков Олег Владимирович.
В рамках курса рассматриваются различные задачи анализа и обработки сигналов и изображений большой размерности. Основное внимание уделяется статистическим методам анализа временных выборок, методам спектрального Фурье-анализа, методам вейвлет-анализа при неограниченном возрастании объема массивов, описывающих сигналы и/или изображения. Излагается теория линейной фильтрации. Обсуждаются методы подавления шума, обнаружения сингулярностей (особенностей) и сжатия данных большого объема. Отдельное внимание уделяется методам решения обратных задач обработки и анализа сигналов/изображений. Излагаются элементы теории преобразования Радона и методы реконструкции томографических изображений.
Автор и лектор курса -- к.ф.-м.н., доцент Хохлов Юрий Евгеньевич
В рамках изучения дисциплины студенты знакомятся с основными понятиями и принципами влияния цифровых технологий на процессы социально-экономического развития, возможностями их применения в прикладных исследованиях; учатся понимать и правильно использовать терминологию современных теорий информационного общества, прежде всего, самостоятельно оценивать и анализировать различные точки зрения на особенности экономики информационного общества на современном этапе, связанном с развитием цифровой экономики.