Журналистика должна стремиться к объективному отражению действительности, но далеко не всегда это получается на деле. В эпоху феномена fake-news, искусственного создания инфоповодов, всевозможных средств и технологий подмены информации (например – технология deepfake), data-журналистика выступает в роли борца за справедливость, честность, открытость и доступность информации.
Современные люди испытывают потребность в настоящей и ценной информации, исследовании актуальных проблем и конечно же – в правде. Именно поэтому будущее за data-журналистикой: сравнительно молодой отраслью, объединяющей в себе расследовательскую и аналитическую составляющие.
Истоки
Считается, что первый дата-материал был опубликован в британской газете The Guardian в 1821 году. В статье приводились таблицы стоимости обучения в вузах Британии. Отмечалось, что это первый случай, когда в журналистском материале «столь открыто представлены все данные для читательской аудитории».
Тогда материалы не отличались глубокой аналитикой, но задали тенденцию показывать читателю не просто выводы автора на основе каких-либо данных, но и сами данные, чтобы читатель мог сделать выводы самостоятельно.
Современная data-журналистика
Широкое распространение data-журналистика начала получать с появлением компьютеров, программ по обработке данных, технологии Big Data и искусственного интеллекта.
Понятие Big Data включает в себя огромный набор IT-инструментов, позволяющих обработать любые типы и объемы электронных данных (начиная от текстовых файлов и заканчивая записями с камер наблюдения и историями браузера). К этим инструментам можно отнести машинное обучение, применение нейросетей, различные виды электронного анализа массивов данных, распознавание образов и скрытых элементов в данных, их визуализацию и моделирование.
Материал журналистики данных представляет собой статьи-лонгриды, инфографику, интерактивные карты или видеоматериалы, в основе которых лежит анализ большого объема данных, выполненный благодаря инструментам Big Data.
Если всё вышесказанное не помогло разобраться в том, что такое data-журналистика, рассмотрим примеры ярких материалов этого направления.
Значимые журналистские data-проекты
В 2017 году было выпущено резонансное журналистское расследование, объектом которого стали международные бизнес-проекты Дональда Трампа. В результате журналисты сделали следующие выводы: 15 из 27 проектов Трампа в области недвижимости столкнулись с уголовными исками (коррупция, мошенничество, незаконный оборот наркотиков).
В 2018 году в журнале New York Times вышел проект «Фабрика фейков»: проанализировав миллионы аккаунтов в соцсетях, журналисты показали, как корпорации крадут фото, имена и другие данные настоящих пользователей и создают фейковые аккаунты, симулирующие жизнь настоящих людей, с целью пропаганды и рекламы.

Одно из крупнейших в России информагентств «РИА Новости» активно развивает направление инфографики, основанной на сборе и анализе данных с регионов страны. Так, например, можно получить наглядное представление о рейтинге регионов РФ по развитию ипотеки или по динамике промышленного производства.
Появляются и новые СМИ, активно развивающие журналистику данных в России. Журналисты онлайн-медиа «Проект» создали интерактивную карту в сопровождении сторителлинга о том, кому принадлежит знаменитый московский район Рублёвка.
Как это работает
Всё начинается с поиска данных для расследования. И именно поэтому на Западе количество дата-исследований в разы превосходит Россию: в нашей стране публиковать данные в открытом доступе готовы далеко не все. Тем не менее, в сети существуют невероятные объемы данных, которые могут стать основой для исследований. Соцсети, открытые коды интернет-порталов, открытые данные НКО, государственных структур, благотворительных фондов и т.д.
Затем начинается самый важный этап работы – компьютерная обработка материала. Он осуществляется с помощью автоматизированных программ, выявляющих определенные соответствия, закономерности, повторы.
После того, как данные тщательно проанализированы и команда data-исследователей сделала определенные выводы, наступает творческий этап работы – оформление и визуализация результатов работы. Статья, инфографика, сводные таблицы, интерактивные элементы, видео… а может, и всё сразу. Чем нагляднее и увлекательнее будет подана информация читателю, тем успешнее будет материал.

При чём здесь Phyton?
На данный момент Phyton – один из самых популярных языков программирования. Он используется для разных целей и задач, в том числе и для анализа и обработки данных. Считается, что он проще в освоении, чем его конкуренты, и именно этому языку обучают в ходе различных курсов по data science.
У многих начинающих журналистов может возникнуть вопрос: «Зачем мне самому учиться кодить, если можно просто отдать эту задачу программистам?» Действительно, журналист не обязан выполнять абсолютно все процессы работы над data-расследованием сам: анализ данных он может доверить программистам, визуализацию – дизайнерам и т.д. Однако в ходе работы журналист выступает в роли менеджера проекта: контролирует все этапы работы, раздаёт задания всем членам команды. И для того, чтобы достойно справиться с этой ролью, журналисту необходимо понимать все процессы, которые возникнут от выбора темы журналистского материала до его публикации.

Где научиться
В вузах России data-журналистика начинает вводиться как отдельная дисциплина, но далеко не в каждом университете. Оптимальный вариант изучения этой журналистской сферы — онлайн-курсы.
Рынок онлайн-образования предлагает огромное количество курсов по data science – тому самому этапу работы над материалом, требующему компетенций в области программирования. Существуют также варианты онлайн-курсов по data-журналистике, захватывающие все этапы работы над расследованием: от поиска темы до визуализации и презентации материала.