{$TWTR} Согласно утверждению компании Twitter (NYSE:TWTR), количество спам-аккаунтов и ботов на ее социальной платформе составляет менее 5% ежедневной базы пользователей, однако потенциальный покупатель Twitter — генеральный директор Tesla (NASDAQ:TSLA) и SpaceX Илон Маск утверждает, что боты — гораздо более серьезная проблема, чем это готова признать социальная платформа, пишет Bloomberg.
Несколько недель назад Маск пригрозил приостановкой сделки на $44 млрд по покупке компании, пока он не разберется с этим потенциальным несоответствием в количестве поддельных аккаунтов. История получила продолжение в понедельник, когда Маск подал письмо в Комиссию по ценным бумагам и биржам США (SEC), в котором заявил, что ему, возможно, придется полностью отказаться от сделки, если Twitter не предоставит ему больше данных, чтобы доказать, что боты действительно составляют менее 5% ежедневных пользователей социальной сети.
Весьма вероятно и то, что на фоне стремительного падения акций технологических компаний Маск просто использует проблему с ботами, чтобы попытаться пересмотреть свою сделку.
В среду Twitter сделала шаг навстречу Маску, подтвердив свою готовность в любом случае поделиться некоторыми новыми данными: предоставила ему доступ к API — хранилищу данных социальной сети, чтобы он мог видеть каждый общедоступный твит, опубликованный в Twitter.
Есть как минимум две проблемы, с которыми Маск может столкнуться при анализе данных: во-первых, доступ к хранилищу данных Twitter предлагает только данные о содержании самого твита, отметке о времени и способе его публикации (например, на iPhone), но в них не указано, является ли аккаунт, опубликовавший твит, человеком или роботом, и не содержит сведений об аккаунте, таких как номер телефона или IP-адрес, которые могут быть полезны, и во-вторых, в хранилище не учитываются те активные пользователи Twitter, которые используют контент и даже могут просматривать рекламу, но не публикуют собственные твиты. Любой анализ данных с помощью хранилища упускает из виду ключевую когорту реальных активных пользователей Twitter. Учет спам-ботов всегда требует выборки аккаунтов, так как изучение только тех аккаунтов, которые публикуют в сети публичные сообщения, может привести к ошибочным результатам.
Возможно, Маск и его команда придумают лучшую модель для идентификации ботов на основе поведения пользователей, чем та, что сейчас использует Twitter. Также не стоит упускать из виду, что Маск может использовать данные в качестве рычага, чтобы попытаться отказаться от сделки, которую он просто не хочет заключать.