Дополнительная профессиональная программа «Технологии понимания естественного языка в анализе финансовых новостей и цифровых гуманитарных исследованиях» даёт базовые знания и навыки, необходимые для применения методов искусственного интеллекта, машинного обучения, обработки естественного языка в практических задачах анализа текстов. Для выполнения индивидуальной научно-исследовательской работы (НИР) студентам будут предложены две практические задачи, связанные с анализом новостных потоков, на данных, предоставленных партнёрами программы. Первая задача (НИР-1) — оценка влияния новостей и обсуждений на форумах и в мессенджерах на цену финансовых инструментов. Вторая задача (НИР-2) — обнаружение фейковых новостей и приёмов манипулирования общественным мнением в текстовых сообщениях средств массовой информации. Решение обеих задач предполагает междисциплинарные исследования на стыке компьютерной лингвистики с экономикой в первой задаче и с журналистикой во второй.
В течение модуля предполагается провести студенческую научную конференцию, на которой студенты расскажут о собственных исследованиях, связанных с тематикой модуля. Участие в конференции с докладом не является обязательным.
Цель программы: сформировать у слушателей базовые знания и навыки, необходимые для решения современных трудных задач автоматической обработки и понимания текстов естественного языка на примере анализа новостных потоков.
Задачи программы:
1. Познакомить студентов с технологиями обработки и понимания естественного языка, включая глубокие нейронные сети, выделение именованных сущностей, синтаксический парсинг, определение семантических ролей слов, извлечение фактов, анализ тональности, обнаружение и прослеживание тем, кластеризацию текстов и вероятностное тематическое моделирование.
2. Познакомить студентов с задачами и методами выявления фейковых новостей, обнаружения поляризованных мнений, разногласий и противоречий, выявления приёмов манипулятивного воздействия в текстах естественного языка средствами NLP.
3. Познакомить студентов с технологиями краудсорсинга для разметки текстовых данных.
4. Дать студентам навыки работы с инструментальными средствами компьютерного анализа текстов.
Д.ф.-м.н., профессор РАН, зав. лабораторией Машинного интеллекта МФТИ
На дополнительную образовательную программу приглашаются студенты бакалавриата, магистратуры и аспирантуры.
Для освоения содержания дополнительной образовательной программы обучающиеся/слушатели должны владеть методами анализа текстов, машинного обучения и языком Python на базовом уровне бакалавриата.
Форма организации отбора слушателей
Индивидуальный отбор обучающихся будет происходить на основании резюме и либо мотивационного письма, либо тезисов доклада для студенческой научной конференции.
Задания для проведения отбора слушателей
Резюме должно содержать следующую информацию:
- ФИО, дата рождения, место учебы (вуз, факультет, курс);
- направление подготовки, тематика дипломной или научно-квалификационной работы;
- опыт участия в исследовательских проектах (гранты, проекты, договорные работы, экспедиции и проч.);
- перечень научных публикаций;
- перечень научных конференций и школ, интенсивов или тренингов, в которых студент принимал участие;
- награды и поощрения;
- научные интересы;
- уровень владения английским языком.
- академические оценки кандидатов
Мотивационное письмо: претендент должен в произвольной форме указать свои образовательные и научные интересы и постараться объяснить, почему он решил принять участие в школе, привести иные сведения, не вошедшие в резюме. Объём мотивационного письма от 1 до 3 страниц.
Тезисы. Объём тезисов доклада для студенческой научной конференции — 3 страницы в предоставляемом шаблоне. Тезисы доклада должны давать представление о собственных научных результатах претендента.
Справка об обучении.
Всем, кто прошел конкурсный отбор и был приглашен на программу, необходимо привезти с собой один из следующих документов:
1. Справка о получении второго компонента вакцины или однокомпонентной вакцины от COVID-19, либо сертификат профилактической прививки от COVID-19, в том числе с портала Госуслуг – в электронном или бумажном виде;
2. Медицинский документ или сертификат с портала Госуслуг о перенесенном заболевании COVID-19 (с выздоровления не более 6 месяцев до заезда) – в электронном или бумажном виде;
3. Справка о медицинском отводе и отрицательный результат ПЦР-теста на коронавирус, полученный не ранее, чем за 72 часа до заезда в Университет.
А также:
Справка с места учебы, взятая не ранее, чем за 3 месяца до начала образовательной программы.
По приезде в Университет участникам образовательного модуля следует предоставить оригиналы указанных документов во время регистрации участников.
АНО ВО «Университет «Сириус» обеспечивает проживание, проезд / перелет по территории РФ и питание для участников программы.
Плата за обучение на программе не взимается.
К участию в программе допускаются только граждане РФ.
Университет «Сириус» – это пространство, где студенты, ведущие ученые и представители российских технологических компаний объединяются, чтобы разрабатывать новые технологии и внедрять их в привычную жизнь. У каждого студента нашей страны есть возможность стать частью команды, которая меняет мир вокруг.
Специально для этого в «Сириусе» были созданы краткосрочные интенсивные программы, участниками которых могут стать студенты из всех регионов страны. Все программы созданы в партнерстве с ведущими компаниями и посвящены актуальным вопросам и направлениям в науке.