«ВКонтакте» создала нейросеть для генерации новостных заголовков

Разработчики «ВКонтакте» создали нейросеть, которая генерирует новостные заголовки на русском и английском языках. Информация опубликована в блоге компании.

О нейросети команда прикладных исследований «ВКонтакте» рассказала на Европейской конференции по информационному поиску (European Conference On Information Retrieval 2019) в Кельне. Группа разработчиков занимается исследованиями методов машинного обучения и искусственного интеллекта в разных сферах, начиная от классификации видео до машинного перевода.


Как это работает?

Нейросеть создает заголовок на основе текста новости. Система анализирует текст и выделяет главное по отдельным фрагментам слов. Это позволяет ей правильно употреблять падежи и склонения, чтобы в качестве заголовка получить связанное предложение. Пока работу системы тестировали на материалах агентства «РИА Новости» и издания The New York Times.

Чтобы проверить качество работы нейросети, разработчики провели отдельное исследование, в котором показывали добровольцам новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% – лучше.

Листайте:


Зачем это надо?

«Исследование с добровольцами показало, что заголовки, созданные нейросетью, пока не всегда получаются такими же качественными, как написанные человеком», – говорит Даниил Гаврилов, разработчик-исследователь «ВКонтакте».

По его словам, нейросеть помогает выделить главную мысль в длинных текстах. «ВКонтакте», например, может использовать ее для сокращения постов в ленте пользователя или для создания новостных дайджестов.


Зачем нужны нейросети?

Нейросети чаще всего используется для решения трех основных задач, рассказывает Михаил Горкунов, руководитель отдела Data Science «АДВ Лаб»:

  • классификация – отнесение объекта к тому или иному классу на основании его характеристик (простейший пример – мужчины/женщины);
  • регрессия – определение значения того или иного параметра объекта на основе имеющихся данных (прогнозирование спроса на определенный товар, роста или падения цен);
  • кластеризация – поиск независимых групп (кластеров) и их характеристик во всем множестве анализируемых данных (например, разделение писем в электронной почте по тематикам: «работа», «учеба», «личное», «спам» и так далее).

Другие хорошие статьи