Skip to main content

Гигант социальных сетей Twitter заявляет, что новая система предотвращения распространения материалов о сексуальном насилии над детьми (CSAM) на его платформе была «беспрепятственно внедрена» благодаря тестированию технологии, разработанной некоммерческой группой Thorn.

Во вторник аккаунт Twitter Safety объявил, что он принял участие в бета-тестировании решения Safer на базе искусственного интеллекта, предназначенного для упреждающего обнаружения, удаления и сообщения о текстовых материалах, содержащих сексуальную эксплуатацию детей.

«Благодаря нашему постоянному партнерству с Thorn мы делаем больше для создания безопасной платформы», — написано в аккаунте безопасности Twitter. «Эта работа основывается на наших неустанных усилиях по борьбе с сексуальной эксплуатацией детей в Интернете с конкретной целью расширения наших возможностей в борьбе с контентом, наносящим большой вред, где ребенок подвергается неминуемому риску».

«Это автономное решение было легко внедрено в наши механизмы обнаружения, что позволило нам отслеживать учетные записи с высоким уровнем риска», — продолжил он.

Компания Thorn, основанная в 2022 году актерами Деми Мур и Эштоном Катчером, разрабатывает инструменты и ресурсы, направленные на защиту детей от сексуального насилия и эксплуатации. В апреле Google, Meta и OpenAI подписали обязательство, данное Thorn и другой некоммерческой организацией All Tech is Human, пообещав обеспечить соблюдение защитных барьеров вокруг своих моделей искусственного интеллекта.

«Мы многому научились в результате нашего бета-тестирования», — рассказала Decrypt вице-президент Thorn по науке о данных Ребекка Портнофф. «Хотя мы знали, что сексуальное насилие над детьми проявляется во всех типах контента, включая текст, мы конкретно увидели в этом бета-тестировании, как машинное обучение/ИИ для текста могут иметь реальное влияние в масштабе».

Как объяснил Портнофф, модель Safer AI включает в себя языковую модель, обученную на текстах, связанных с безопасностью детей, и систему классификации, которая генерирует прогнозы с несколькими метками для текстовых последовательностей. Оценки прогноза варьируются от 0 до 1, что указывает на уверенность модели в том, что текст соответствует различным категориям безопасности детей.

Хотя Портнофф не смогла раскрыть, какие еще платформы социальных сетей участвовали в бета-тестировании набора продуктов Safer, она сказала, что реакция других компаний была положительной.

«Некоторые партнеры заявили, что эта модель особенно полезна для выявления вредных действий сексуального насилия над детьми, определения приоритетности сообщаемых сообщений и поддержки расследований известных злоумышленников», — сказал Портнофф.

В связи с распространением инструментов генеративного искусственного интеллекта с момента запуска ChatGPT в 2022 году группы по наблюдению за Интернетом, такие как базирующаяся в Великобритании Internet Watch Foundation, забили тревогу по поводу потока созданной ИИ детской порнографии, циркулирующей на форумах даркнета, заявив, что незаконные материалы может перегрузить Интернет.

Заявление группы безопасности Twitter было сделано за несколько часов до того, как Европейский Союз потребовал от компании объяснить сообщения об «сокращении ресурсов модерации контента».

В последнем отчете о прозрачности, который Twitter представил регуляторам ЕС, говорится, что меры Илона Маска по сокращению расходов позволили сократить размер команды модераторов контента платформы почти на 20% с октября 2023 года, а также сократить количество отслеживаемых языков с 11 до 7.

«Комиссия также запросила дополнительную информацию об оценках рисков и мерах по их снижению, связанных с влиянием генеративных инструментов искусственного интеллекта на избирательные процессы, распространение незаконного контента и защиту основных прав», — добавляется в требовании.

ЕС открыл официальное разбирательство против Twitter в декабре 2023 года из-за опасений, что компания нарушила Закон о цифровых услугах в нескольких областях, включая управление рисками, модерацию контента, «темные шаблоны» и доступ к данным для исследователей.

Комиссия заявила, что Twitter должен предоставить запрошенную информацию до 17 мая и ответить на дополнительные вопросы до 27 мая.

Оставить комментарий