Журналистика данных: как заставить цифры говорить

13:2713.03.2013 (обновлено: 18:02 16.05.2013) / 1101Контент
По словам футуристов, в будущем журналисты будут получать гонорары не за сообщение, а за осмысление и интерпретацию «сырой» информации.

 

Статья впервые опубликована в журнале "Журналист" №3/201313

 

Количество информации в мире растет с пугающей быстротой. Ежедневно современному человеку приходится пропускать через себя бесчисленные потоки информации. Чтобы оставаться успешными, современным СМИ уже недостаточно просто сообщить какую-то новость — источников стало слишком много. По словам футуристов, в будущем журналисты будут получать гонорары не за сообщение, а за осмысление и интерпретацию «сырой» информации. Однако многие СМИ начинают работать с цифрами и базами данных и буквально находить в них истории уже сейчас. Это явление получило название «журналистика данных» (data journalism или data driven journalism).

Главный принцип журналистики данных: материал строится не вокруг новостного повода или явления, а вокруг статистики, цифр, сводок, отчетов и иной справочной информации. К сожалению, пока о журналистике данных как о сформировавшемся жанре можно говорить только в Европе и США, где она уже получило достаточное распространение и признание. Стимулом к ее появлению и оформлению в самостоятельный жанр послужило развитие интернета и информационных технологий, которое, в свою очередь, привели к выкладыванию в сеть больших объемов статистических и иных данных.

История в цифрах

В журналистике данных цифры — это главное, они могут говорить сами за себя, рассказывать историю. Например, освещая разрушительный ураган «Сэнди», обрушившийся на восточное побережье США в октябре 2012 года, газета The New York Times cделала карту, на которой отметила точками этапы продвижения стихии и ее превращения из тропического шторма в неистовую бурю. Получился интерактивный инструмент, в котором текст практически отсутствовал. Зато его можно было встроить во все статьи, связанные с Сэнди — для справки. Многослойная карта, интерактивная хронология событий (таймлайн) — все это тоже журналистика данных. «Иногда журналистика данных — это журналистика без журналистики в традиционном понимании этого слова», — объясняет Иван Бегтин, директор некоммерческого партнерства «Информационная культура», одного из основоположников журналистики данных в России.

Действительно, так называемые data-журналисты работают не с потоками информации, текстовым контентом, новостями. Их основной источник информации — это базы данных, которые накоплены в различных государственных информационных системах. Например, государственные контракты, бюджет, статистика, индикаторы.

Наиболее преуспевают в работе с открытой государственной информацией американские газеты — такие, как The New York Times, Chicago Tribune, Los Angeles Times и другие. Они не просто анализируют данные, но и ведут постоянные спецпроекты на их основе. Так, у NY Times есть проект, посвященный погибшим в Афганистане. Сотрудники издания собрали всю статистику, проанализировали ее и представили визуально, распределив информацию по годам, месяцам, воинским подразделениям и т.д.

Еще один пример — визуализация данных переписи. Специальный сервис позволяет щелкнуть мышью на любой район определенного города, чтобы получить информацию по этническому составу, рождаемости и смертности в разные года.

От данных к расследованиям и обратно

В России пока нет СМИ, которое бы могло заявить журналистику данных в качестве одного из своих основных жанров, однако примеры такой журналистской работы уже нередки на страницах печатных изданий и в Интернете. Сами же журналисты не привыкли относить подобные материалы к какому-либо конкретному жанру. Вот и Виталий Лейбин, главный редактор журнала «Русский репортер», признается в том, что в «РР» такой термин не используют, но с массивами данных работают часто: достаточно обратить внимание на обилие графиков и таблиц на страницах номеров «РР». В качестве примера Виталий Лейбин приводит большой материал «Клановость: польза и преодоление», состоящий из двух частей и подкрепленный инфографикой. В нем на основе открытых данных о карьерном пути российских чиновников проводится анализ их социальных связей. Лейбин называет еще несколько материалов: «Это наша молодеЖЖь», «Чайка по имени Лорен Гудрич», «Наши в Гуантанамо». Последние два относятся к периоду сотрудничества издания с проектом Джулиана Ассанжа «Wikileaks», который обнародовал огромные объемы посольских депеш американских дипломатов.

Тем не менее, приведенные примеры все же нельзя назвать журналистикой данных в классическом, западном понимании термина. Это скорее расследования, основанные на анализе данных. По словам Виталия Лейбина, расследовательский материал «Чайка по имени Лорен Гудрич» — был основан на данных из частной американской разведывательной компании «Стратфор», слитой Wikileaks: «Мы довольно быстро нашли интересное сообщение о том, что российский генпрокурор значится как информатор американцев. Потом долго, с драмами и настоящими восторгами и разочарованиями, по крупицам собирали новые материалы на эту тему, и в какой-то момент заподозрили, что шпионка Лорен Гудрич почти все сочиняет. Чтобы это проверить, понадобились еще репортаж и расследование, не связанные с этими базами данных». Похожая история происходила и с остальными вышеупомянутыми материалами. Так, во время работы над материалом «Наши в Гуантанамо» надо было сначала выделить из большой базы документов те, которые относились к заключенным Гуантанамо из СНГ, а потом сопоставить их со сведениями об их судьбе до и после заключения, чтобы обнаружить основные пути превращения из советских граждан в талибы, шпионы и обратно.

Тенденция к открытости

Начало развития журналистики данных в России стало следствием тенденции к открытости данных, в первую очередь — государственных, считает Иван Бегтин. Следующим шагом со стороны государства, по словам эксперта, должно стать представление данных не просто в открытом доступе, но и в удобном для обработки виде. «Когда какой-то бюджет доступен просто на бумажке — это одна история, а когда хотя бы в Excel-файле, и его можно загрузить, проанализировать, построить самостоятельный график — совсем другая. В данном случае речь идет о совершенно другом качестве работы с информацией. Это все имеет ценность как для национальной экономики знаний, так и для жесткого общественного контроля», — рассказывает Бегтин.

Виталий Лейбин считает, что в России вообще растет интерес к фактуре, к реальности, а не к «большим идеям», вынутым из головы, как шар. «Проблема современного мира — это не недостаток данных, а их избыток. Умение их анализировать является одним из самых востребованных», — подчеркивает главред «Русского репортера». По его мнению, новый жанр открывает и новые возможности для изданий: «Иногда можно не бегать по полям, а просто внимательно анализировать, скажем, сайты госзакупок и прочие данные. Аудитории нужен журналист (или аналитик, или ученый), чтобы увидеть хоть что-то значимое посреди нарастающего шума информации».

Как только аудитория увидит это «что-то значимое» и возникнет резонанс, у общества появится возможность диалога с государством, подкрепленного аргументами. Например, в Великобритания стали раскрывать информацию о ж/д станциях, рассказывает Иван Бегтин. Местные жители увидели, что у многих станций указаны неправильные координаты: некоторые из них, судя по данным, находились в центре озера. Британским властям пришлось извиниться и опубликовать верные данные.

Есть и более прагматичные примеры: часто американские журналисты обнаруживают несоответствие заявленного бюджета и расходов по госзакупкам. Но такие истории не становятся резонансными за рубежом, для них это нормальный процесс, объясняет Бегтин. В США действует огромное количество организаций, которые финансируют подобные проекты, и такая работа уже давно стала нормальной частью журналистской деятельности.

Наконец, журналистика данных — это принципиально новый механизм организации общения с посетителем. Современного читателя СМИ, избалованного видеоиграми и приученного к клиповому мышлению, редко чем можно удивить или по-настоящему заинтересовать. А журналистика данных предлагает такой аудитории новые инструменты визуализации «скучных» данных, помогает наглядно представить информацию или даже вовлекает читателей в какое-либо действие.

Где же data-журналисты?

Несмотря на растущую популярность у аудитории, в России журналистика данных все еще является уделом немногих СМИ. Основная проблема, связанная с новым веянием медиасферы, заключается в нехватке кадров. В России нет курсов по журналистике данных, журналистов не учат работать с большими массивами информации, и они не обладают необходимым набором технических навыков. А между тем, журналист, работающий с данными, должен сочетать в себе и «технаря», и «гуманитария». Сейчас курсы по журналистике данных преподают лишь в нескольких зарубежных университетах.

Виталий Лейбин отмечает, что в России нет журналистов, которые работают только с данными. По его мнению, хорошего аналитика нужно учить «журнализму», а журналисту неплохо бы владеть какими-либо методами анализа. «Журналиста можно учить разным методам, которые уже есть в науке и исследовательской практике, замечать сенсационные факты там, где остальные видят просто информационный шум», — объясняет Лейбин.
Иван Бегтин считает, что для формирования журналистики данных как жанра в России давно все готово. Есть данные, есть разработчики, которые умеют их визуализировать, и единственное, чего не хватает, — это системного подхода изданий. Возможно, кризис в отрасли, а также нарастающая конкуренция со стороны интернет-компаний, социальных сетей и развлекательных брендов, заставит издателей обратить внимание на этот новый перспективный жанр журналистики.

Справка:
Журналистика данных на западных ресурсах:
The New York Times — http://www.nytimes.com/pages/multimedia/index.html
Guardian Datablog — http://www.guardian.co.uk/news/datablog
Financial Times — http://www.ft.com/intl/interactive
Open Data blog ZeitOnline — http://blog.zeit.de/open-data/

Журналистика данных в Financial Times
В одной из крупнейших международных деловых газет Financial Times нет ни одного человека, чья должность звучала бы как «журналист по работе с данными». Вместо этого, над проектами, связанными с обработкой больших массивов информации, работают сразу несколько человек из разных команд. Типичный состав такой команды включает в себя специального корреспондента, пишущего журналиста из отдела интерактивной графики, дизайнера (он работает с HTML5, CSS и Java Script) и разработчика (для сложных программных решений). Подобные команды намеренно расположены вплотную к основной службе новостей, чтобы их члены были в курсе того, что происходит прямо сейчас, и могли предложить новые способы повествования о том или ином событии.

Автор: Таисия Ларот