«Большие данные работают, как астрология»
Ровно 25 лет назад, в апреле 1994 года, был официально зарегистрирован домен .ru, что считается датой рождения российского сегмента интернета. Как он изменился за четверть века? Мы поговорили с социологом и интернет-исследователем Полиной Колозариди о том, как человек и интернет меняют друг друга в России и мире, что сегодня можно узнать о нас по лайкам и комментариям и стоит ли верить в силу больших данных.
Полина Колозариди. Фото: Ted Neva River
«А»: Я помню время, когда выйти в интернет было не так просто: нужно было сесть за стационарный компьютер, нажать кучу кнопок, послушать тарахтящий модем. А сейчас, кажется, сложнее из него выйти. Мы уже давно говорим друг другу не «посмотри в интернете погоду», а просто «посмотри погоду», потому что воспринимаем интернет как должное. Эта ситуация, когда человек все время онлайн, она как-нибудь меняет мышление, поведение человека?
ПК: Вы замечательно описали ситуацию, которая называется «вездесущий интернет». Но как она повлияла на человека, я сказать не могу, потому что я не верю в так называемый «технический детерминизм» — что технологии и связанные с ним ситуации однозначно влияют на людей. Скорее могу порассуждать о том, как изменился интернет и мы вместе с ним.
Возможности человека меняются, если он включён в какую-то среду, где есть интернет — будь он преподавателем, студентом или студенткой, врачом и так далее. Что меняется? Время, потому что информация добывается быстрее и можно распределять его иначе. А это влияет на то, как организован труд, появляется больше фрилансеров, людей, работающих на аутсорсе. Ну и так далее, можно перечислять часа два.
Параллельно интернет становится частью рабочих процессов, ведь работодатели тоже не сидят на месте. Появились «Госуслуги», электронные дневники, системы фиксации приходов и уходов детей из школы, удаленная медицина.
Интернет пришел не только в жизнь человека, но и в жизнь организаций, которые тоже в свою очередь меняют его. Мы не можем сказать, что интернет изменил человека или институцию, или институция изменила интернет. Эти процессы происходят параллельно и одновременно, дополняя друг друга.
— К слову об изменениях. Чуть больше года назад в одном из интервью, отвечая на вопрос о тенденциях развития интернета, вы сказали, что он «движется в сторону отдельных национальных интернетов в соответствии с физическими границами государств». За год наблюдений вы увидели продолжение этой тенденции? Или ситуация каким-то образом поменялась?
— Я не думаю, что те ожидания, которые были у нас с коллегами, изменились. Конечно, интернет не остается монолитным. Другое дело, что границы государств — это не первое и далеко не единственное, что определяет интернет как немонолитную структуру. Интернет фрагментируется из-за индивидуализации сервисов, по разным социальным группам, и по языку. Как раз об этом мы говорили в интервью год назад: вместе с Дэниелом Миллером и его коллегами, которые делали антпрологическое исследование использования соцсетей в разных странах. Но своё исследование мы тогда только начинали. Сейчас куда чаще стали говорить о том, что национальные государства стараются играть все более важную роль, и мы видим немало примеров того, как интернет оказывается все менее вненациональным.
— Вы имеете в виду нашумевший законопроект о «суверенизации» интернета?
— Не только. Этот проект продолжает уже существующие тенденции и не кажется мне чем-то радикальным. Собственно, «суверенный интернет» — это и вовсе журналистское определение, которого нет в тексте законопроектов.
Есть гораздо более интересные вещи. Вот буквально на днях Фейсбук (соцсеть признана экстремистской, запрещена в России) объявил, что нужно включать работу с национальными государствами в часть правил и культуры социальной сети. Раньше это было вынужденной мерой, а сейчас становятся частью политики корпораций. Ничего подобного никогда не было, мы еще не знаем, чем это обернется. Это очень значительное изменение, на мой взгляд.
— Несмотря на то, что не только и не столько государственные границы определяют фрагментацию Сети, можно ли сформулировать особенности российского национального интернета? В чем уникальность этого пространства для обмена и поиска информации, которое существует в нашей стране?
— Я сразу должна сказать, что метафора интернета как пространства, на мой взгляд, очень мало работает. Потому что, во-первых, интернет материален. Во-вторых, он пронизывает все наши сегодняшние практики. Сегодня это не только сервисы для общения, это и та инфраструктура, которая обеспечивает доставку еды, услуг и так далее.
В целом у интернета в России удивительная история развития. Его инфраструктура у нас очень сильно отличается от города к городу. Это важно, потому что делает невозможным однообразное жесткое регулирование доступа к интернету в стране как к технологии. То есть в России очень сложно отключить интернет, что обусловлено его историческими и инфраструктурными особенностями.
Далее, интернет в России очень сильно фрагментирован, как минимум не меньше, чем офлайн. У нас в стране не было сильных и однозначно объединяющих всю страну сетевых медиапроектов, которые были бы поверх социальных различий. В каждом городе есть люди, которые читают «Медузу» или смотрят в интернете «Первый канал», и люди, которые пользуются просто «Одноклассниками» или Mail.ru, не особенно взаимодействуя с медиа. Но нет такой объединяющей платформы, где все люди существовали бы в одном общем пространстве. И медиапроекты городские тоже локальны. И тоже отличаются от города к городу. Вы в Новосибирске, наверное, знаете каких-то своих блогеров, но знаете ли вы томских?
— Нет, признаться.
— Вот, а они есть. Мне кажется, что и томичи не знают новосибирских, хотя это здоровенный город. А Илью Варламова многие знают, потому что Россия при этом и в интернете — централизованная страна. И Рунет тоже был частью этой централизации, хотя сейчас объединяющих фигур вроде Артемия Лебедева или Антона Носика почти не появляется. Может быть, Дудь, но он всё же в первую очередь делает журналистский проект на платформе Ютуба. Это не блогер из тех, что были в нулевые годы.
Сила и слабость больших данных
— Примерно каждую неделю я вижу новую статью о том, что в маркетинге больше нет смысла проводить интервью, чтобы что-то понять о людях, ведь они все равно не скажут правды. А настоящее и будущее исследований за большими данными, анализом тех следов, которые человек оставляет в интернете. Как вы считаете, можно ли составить корректный портрет человека и описать его потребности, опираясь только на большие данные?
— Вы привели типичный пример самонадеянности людей, которые занимаются цифрами и полагают, что их знания о поведении других людей на основе этих цифр — это окончательная правда. То, что это не так, хорошо показывают исследования повседневных практик в интернете.
Есть замечательный проект Why we post, который как раз демонстрирует, насколько по-разному сами люди воспринимают свои действия онлайн. Если мы решим, что мы как исследователи точно знаем, что значит лайк, мы, конечно, ошибемся.
Но поскольку вера в большие данные подкрепляется большим количеством работающих совпадений, то исследования, основанные на них, работают. И более того, востребованы в мире маркетинга. Потому что маркетинговые исследования в своем конечном результате — это цифры. То есть мы имеем цифры на входе — например, распределение лайков в зависимости от времени или от дохода. И мы имеем цифры на выходе — например, посещаемость или конверсия. Остается только найти соотношение между цифрами. И это, спасибо математикам, мы делать умеем.
Но как только вы выходите из мира цифр, все рушится. Во-первых, корреляция не является причинностью. На уровне корреляции работает и астрология. Всякий, кто читает гороскопы, может удостовериться, что если вам пророчат важную встречу на этой неделе, то она часто действительно происходит. Работает? Работает. Во многом так работают и большие данные. Они показывают работающие совпадения, при этом часто вовсе не касаясь вопроса о причинности. На самом деле к астрологии у меня нет особых интеллектуальных претензий. На протяжении многих столетий управленческие решения строились на астрологии, и это отлично работало. В Римской империи или Италии начала Возрождения, например.
Здесь я закончу с критической частью. Справедливости ради надо сказать, что постоянно разрабатываются новые методы и математические подходы, основанные на больших данных, и рано или поздно они дадут результат. В этом направлении сейчас сосредоточено очень много сил, в какой-то момент мы сможем увидеть что-то действительно интересное.
— Могут ли в будущем большие данные все-все про нас объяснить? Например, когда проникновение интернета достигнет 100% во всем мире, а методы анализа станут еще более совершенными?
— Надо понимать одну вещь: то, что мы считаем знанием о человеке, меняется довольно быстро. Что мы знали о себе в детстве? То, что можно написать в анкете, которую пускали по классу. Какая твоя любимая книжка, на кого ты хочешь быть похожим. Нынешние подростки знают о себе кое-что еще – количество лайков в соцсетях, музыку, которую они слушают. Это не всегда правда, конечно. Известно, что подростки заводят себе по два аккаунта: в одном слушают, что хотят, а в другом то, что социально одобряемо. Но все же.
У взрослых людей то же самое. Человек, который соцсетями почти не пользуется, не включает количество лайков и комментариев в состав знания о себе, а человек, который активно постит, включает.
И знания о других в интернете — это знания не о людях вообще, а об активных пользователях. О тех, чьи представления о норме позволяют им постить свое фото в соцсетях. И мы исключаем из этого знания очень бедных людей, людей с ограниченными физическими возможностями, людей, чья культура противоречит лайкам и селфи. Мы делаем вывод обо всех по каким-то определенным группам, и считаем это знанием о мире вообще. Чувствуете скепсис?
— Да, конечно.
— Другое дело, что big data — это важная и обоюдоострая штука. Это не только наши действия в соцсетях, но еще и гигантское количество данных. Взять, например, систему регистрации пассажиров в общественном транспорте. Здесь знание о практиках является первичным. Не важно, какие социальные смыслы вы вкладываете в поездку на троллейбусе. Важно, что вы на нем ездите. В системе принятия решений о развитии разного рода инфраструктур большие данные демонстрируют исключительную применимость. Но в интернете все несколько по-другому.