Data Ёлка 2018

Предновогодняя встреча Open Data Science Siberia.
25 декабря «2ГИС», Сан Сити, Новосибирск
Скрыть карту

«2ГИС», Сан Сити

пл. К. Маркса, 7 Новосибирск, «2ГИС», Сан Сити,
22 этаж
25 декабря приглашаем на рождественскую Data Ёлку в 2ГИС подвести итоги года. В программе четыре доклада от активных участников сообщества Open Data Science Siberia и неформальное общение.

Программа

16:00 — 16:10 Приветственное слово
16:10 — 16:50 Машинное обучение в ЦФТ: чему научились за год // Иван Комаров В докладе кратко подведу итоги года, а год выдался обильным на ДС события: 1. Началось с обучения бизнесу — есть ли толк? 2. Далее учились сами — неужели что-то не знали? 3. Пришли новые люди — а ушли ли старые? 4. Начали ДатаФест — зачем это нужно? 5. Провели конкурс — готовим следующий?
16:50 — 17:30 Поиск дубликатов товаров в 2ГИС // Александр Радионов В докладе рассказывается как при помощи NLP и ML была решена проблема поиска одинаковых описаний товаров среди миллионов товарных предложений разных магазинов. Как правильно подготовить Dataset? Возможно ли использовать синтетические данные и насколько они эффективны? Как выйти в продакшн — проблемы масштабирования (50+ серверов)
17:30 — 18:00 Кофебрейк
18:00 — 18:40 ELMo — умные эмбеддинги для понимания текстов // Иван Бондаренко 1. Краткое введение — что такое эмбеддинги и зачем они нужны в Natural Language Processing/Understanding 2. Языковые модели на нейронных сетях. Казалось бы, причём здесь эмбеддинги? 3. ELMo — умные эмбеддинги из рекуррентных нейросетевых языковых моделей, умеющие в контекст («коса», «коса» и «коса» — теперь между ними есть разница!). 4. А какая нам с этого польза? (ELMo для русского языка и результаты экспериментов с NER на очень маленьком датасете)
18:40 — 19:20 Развитие CS центра. Запуск ML-тренировок в НГУ // Александр Авдюшенко Подведу некоторые итоги пятилетки развития ШАД в Новосибирске и немного расскажу о дальнейших планах. 1. Что привнёс CS центр в наш филиал ШАД 2. Как мы пытаемся влиять на IT образование в НГУ 3. ML-тренировки: успехи и неудачи 4. Помечтаем о будущем образования: обучение через проекты, дистанционное обучение, эффективное обучение лично тебе =)
19:20 — 22:00 Свободное общение

Спикеры

  • Иван Бондаренко
    Специалист по компьютерной лингвистике и анализу текстов на естественных языках

    7 лет преподавал в университете, некоторое время работал C/C++-разработчиком в аутсорсе, четыре года занимался исследованиями в области машинного обучения в 2ГИС. Сейчас работает в МФТИ в проекте iPavlov, а также в компании Data Monsters как специалист по компьютерной лингвистике и анализу текстов на естественных языках. Интересы: распознавание образов, машинное обучение, компьютерная лингвистика.

    МФТИ
  • Александр Авдюшенко
    Куратор Computer Science центра и академических программ

    В 2013 запустил филиал Школы анализа данных в Новосибирске, в 2014 защитил кандидатскую в ИВТ СО РАН, в 2016 выпустился из ШАД, три года работал в Яндексе аналитиком Справочника организаций. В 2017 вместе с JetBrains расширили ШАД до CS центра и продолжаем его активно развивать. Люблю машинное обучение и обучение людей.

    ШАД
  • Иван Комаров
    Руководитель группы «Машинное отделение»

    Заводит МЛ в ЦФТ, используя любовь к анализу данных, опыт работы в ИТ и образование в области эмпирической микроэкономики.

    ЦФТ
  • Александр Радионов
    Руководитель сервисов Поиска и ML

    В компании работает 8 лет. Последние 5 лет руководил разработкой офлайн-поиска и занимался NLP. Последние 2 года руководил разработкой ML-сервисов: 2gis crawler и модерация контента, автораспознавание дорожных знаков.

    2ГИС