Имперский колледж Лондона и Оксфордский университет решают вопросы, стоящие перед новостной индустрией

Студенческие задачи — в Labs способ пообщаться с первыми талантливыми новаторами в университетах. Мы страемся приблизить научную работу студентов к реальным проблемам в новостной индустрии. Для нас это одновременно серьезная совместная работа и в некотором роде развлечение.

Лаббер Лей Хе, Эллисон Шультес и Коноро Моламби возглавили последнее соревнование с аспирантами Имперского колледжа и Оксфордского университета в Центре докторантуры EPSRC (CDT) по математике случайных систем: анализ, моделирование и симуляция.

ЗАДАЧА, КОТОРУЮ МЫ ПОСТАВИЛИ СТУДЕНТАМ

Лей Хэ Старший инженер-программист,
Конор Моламби Старший журналист

Для вдохновления студентов мы им поручили создать инновационные решения, которые помогут нам обслуживать аудиторию BBC: Для вдохновения студентов мы им поручили им следующие задачи:

  • • Как мы можем персонализировать взаимодействие с пользователем, выполняя обязанности BBC по обслуживанию населения?
  • Как мы можем повысить доверие к BBC ?
  • Как мы можем продемонстрировать нашу приверженность беспристрастности?
  • Как мы можем дать нашим журналистам информацию о том, как думает наша аудитория?

Эти вопросы лежат в основе проблем, которые мы пытаемся решить в News Labs. Мы дали студентам обзор наших недавних прототипов, которые решают некоторые из этих проблем, и рассказали им, как мы формируем решения для экспериментов.

Затем дело было за двумя командами студентов. У них было две недели, чтобы сформировать идеи и прототипировать свои решения. Вот что придумала каждая команда…

ОДИН ИЗ МНОГИХ

Вдохновленная проектом «Графическое повествование» News Labs, первая команда попыталась решить проблему беспристрастности в новостях, создав единое визуальное представление новости.

Можно ли использовать это как краткое визуальное изложение истории для той части аудитории, которая предпочитает изображения тексту? Возможно ли автоматизировать создание этого нового изображения из двух или более изображений для истории, изначально выбранных журналистом?

Чтобы воплотить эту идею в жизнь, студенты черпали вдохновение в своих исследованиях теории оптимального переноса вероятностных мер для слияния нескольких изображений.

Их цель — интерполировать между распределениями вероятностей оптимальным образом: непрерывно и по кратчайшему пути, а также включать алгоритм переноса цвета для применения мотива одного изображения к объектам другого. 

СДЕЛАЕМ ИСТОРИИ ВВС БОЛЕЕ ДОСТУПНЫМИ, ДЛЯ НЕ ЯВЛЯЮЩИХСЯ НОСИТЕЛЯМИ АНГЛИЙСКОГО ЯЗЫКА

Вдохновленная проектом BeX от News Labs, вторая команда решила понять и найти решение проблеме для повышения удобочитаемости местных новостей для тех, для кого английский язык не является родным. 

7% населения Великобритании не являются носителями языка (перепись 2011 г.). Еженедельно BBC охватывает 468,2 миллиона человек по всему миру, предлагая 42 языковых службы и выходной материал на английском языке.

Команда нашла путь решения к этой проблеме, предложив журналистам и редакторам идеи в надежде, что их решение поможет сделать выбор в пользу редактирования. Это было основано на системе оценки удобочитаемости по мере написания истории, которая аналогична проекту BeX и другим решениям для удобочитаемости.

Уникальный скачок команды состоял в выявлении гипотезы о том, что оценка читабельности для носителей языка отличается от оценки для не носителей языка. Это было основано на их анализе характеристик проблемы понимания языка для не носителей языка, в том числе:

• Неоднозначность слов — например, «председатель комитета сидел в центральном кресле».

• Длина слова – есть ли более подходящие меры сложности? Например, заимствованное слово, такое как «двойник», длинное, но понятное говорящему по-немецки.

Оценка рассчитывается с использованием обратного перевода. Это включает в себя автоматический перевод исходного текста на другой язык, а затем повторный перевод результата обратно на исходный язык. Сравнивая исходный текст и результаты этого процесса, команда подсчитала балл, который является оценкой удобочитаемости текста для не носителей языка.

Решение предполагает, что понимание носителя языка моделируется первым машинным переводом в этом процессе. Большое количество различий было рассмотрено в исходном тексте и выходном тексте указывает на двусмысленность, которая затрудняет понимание истории для тех, для кого английский язык не является родным. 

Команда использовала свои навыки работы с данными для тестирования трех различных алгоритмов, которые могли бы рассчитать сходство между каждым входным и выходным материалом в процессе работы. 

Команда использовала открытый набор данных англоязычных историй из газеты с Guardine, а также рассчитала средний балл сходства для всего набора данных, когда они были переведены на несколько языков. 

И ПОБЕДИТЕЛЕМ СТАНОВИТСЯ…

«Математики в Imperial широко и активно взаимодействуют с обществом и промышленностью. Работая с BBC над этим проектом, наши студенты CDT получили ценный опыт, который поможет им самим стать зрелыми, заинтересованными исследователями», — сказал д-р Томас Касс, содиректор. CDT по математике случайных систем в Имперском колледже Лондона.

Под членами команды News Labs стояла незавидная задача выбрать выигрышную идею из вышеперечисленного. В типичной для Labs манере мы разбили эту задачу на части, установив критерии:

1. Насколько инновационной является идея?

2. Подход к решению поставленной проблемы, включая креативность и оригинальность решения

3. Потенциальная применимость решения для BBC и более широкой отрасли.

В целом, мы были очень впечатлены работой обеих команд и думали, что их мало что разделяет, но в итоге победа досталась команде 2 с решением обратного перевода.

Мы были особенно восхищены креативностью, проявленной обеими командами. 

ЧТО ДАЛЬШЕ?

Частью миссии News Labs является установление партнерских отношений с академическими, некоммерческими и коммерческими организациями по всему миру для сотрудничества в области инноваций.

В следующем году мы планируем провести еще один университетский конкурс с целью объединить студентов, изучающих информатику и журналистику, и предложить им инновационные идеи для решения реальных проблем в новостных СМИ.


Источник: https://bbcnewslabs.co.uk/
Перевод: Айрапетян Сатеник