«ВКонтакте» создала нейросеть для генерации новостных заголовков
Разработчики «ВКонтакте» создали нейросеть, которая генерирует новостные заголовки на русском и английском языках. Информация опубликована в блоге компании.
О нейросети команда прикладных исследований «ВКонтакте» рассказала на Европейской конференции по информационному поиску (European Conference On Information Retrieval 2019) в Кельне. Группа разработчиков занимается исследованиями методов машинного обучения и искусственного интеллекта в разных сферах, начиная от классификации видео до машинного перевода.
Как это работает?
Нейросеть создает заголовок на основе текста новости. Система анализирует текст и выделяет главное по отдельным фрагментам слов. Это позволяет ей правильно употреблять падежи и склонения, чтобы в качестве заголовка получить связанное предложение. Пока работу системы тестировали на материалах агентства «РИА Новости» и издания The New York Times.
Чтобы проверить качество работы нейросети, разработчики провели отдельное исследование, в котором показывали добровольцам новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% – лучше.
Листайте:
Зачем это надо?
«Исследование с добровольцами показало, что заголовки, созданные нейросетью, пока не всегда получаются такими же качественными, как написанные человеком», – говорит Даниил Гаврилов, разработчик-исследователь «ВКонтакте».
По его словам, нейросеть помогает выделить главную мысль в длинных текстах. «ВКонтакте», например, может использовать ее для сокращения постов в ленте пользователя или для создания новостных дайджестов.
Зачем нужны нейросети?
Нейросети чаще всего используется для решения трех основных задач, рассказывает Михаил Горкунов, руководитель отдела Data Science «АДВ Лаб»:
- классификация – отнесение объекта к тому или иному классу на основании его характеристик (простейший пример – мужчины/женщины);
- регрессия – определение значения того или иного параметра объекта на основе имеющихся данных (прогнозирование спроса на определенный товар, роста или падения цен);
- кластеризация – поиск независимых групп (кластеров) и их характеристик во всем множестве анализируемых данных (например, разделение писем в электронной почте по тематикам: «работа», «учеба», «личное», «спам» и так далее).