Legatus

IT-компании используют ваши фотографии для улучшения технологии распознавания лиц

Март 13
12:05 2019

Технология распознавания лиц – несовершенная, но быстро развивающаяся, основана на алгоритмах, которые учатся распознавать человеческие лица сотнями способов, и каждый из них – уникален, пишет NBC.

Алгоритмы должны получать сотни тысяч изображений разных лиц. Эти фотографии все чаще берут из Интернета, а миллионы людей не узнают об этом. Их классифицируют по возрасту, полу, тону кожи и десяткам других метрик, и делятся с исследователями в университетах и компаниях.

По мере того, как алгоритмы становятся все более продвинутыми, юристы начинают поднимать вопросы по поводу использования фотографий обычных людей. Изображения берут без согласия пользователя, а сама технология будет использоваться для наблюдения.

По мнению экспертов и адвокатов, это вызывает особую обеспокоенность в отношении меньшинств, которые могут подвергнуться преследованиям. "Это маленький секрет тренировочных ИИ. Исследователи часто просто берут все доступные изображения", — заявила профессор юридического факультета Нью-Йоркского университета Джейсон Шульц.

Последней компанией, которая так поступила, была IBM – в январе она выпустила коллекцию из почти миллиона фотографий, взятых с Flickr и закодированных для описания внешнего вида субъектов. IBM представила коллекцию исследователям в качестве прогрессивного шага к снижению предвзятости в распознавании лиц.

1.jpg (78 KB)

Но некоторые люди, чьи изображения были включены в набор данных IBM, были удивлены и смущены, когда NBC сообщил, что их фотографии имеют детали, включая геометрию лица и тон кожи, и могут использоваться для разработки алгоритмов распознавания лиц.

"Никто из людей, которых я фотографировал, не подозревал, что их изображения используются таким образом. Кажется странным, что IBM может брать эти картинки, ничего никому не сказав", — прокомментировал Грег Певерилл-Конти, руководитель отдела связей с общественностью из Бостона, у которого в коллекции IBM более 700 фотографий, известных как "набор данных для обучения".

Джон Смит, курирующий исследования в области искусственного интеллекта в IBM, заявил, что компания взяла на себя обязательство "защищать частную жизнь лиц" и "будет работать с любым, кто запрашивает удаление URL-адреса из набора данных".

Несмотря на заверения IBM, что пользователи Flickr могут отказаться от базы данных, NBC обнаружил: практически невозможно удалить фотографии. IBM требует, чтобы фотографы отправляли по электронной почте ссылки на изображения, которые они хотят удалить, но компания публично не поделилась списком пользователей Flickr и фото, включенными в набор данных.

2.jpg (64 KB)

В IBM сообщили, что их набор данных разработан для оказания помощи академическим исследователям в попытках сделать технологию распознавания лиц более справедливой. Компания не одинока в использовании общедоступных фотографий в Интернете таким образом. Десятки других исследовательских организаций собрали изображения для обучения систем распознавания лиц.

"Люди дали свое согласие поделиться своими фотографиями в другой интернет-экосистеме. Теперь они невольно или неосознанно участвуют в обучении систем, которые потенциально могут быть использованы против их общин", — утверждает содиректор Института AI Now Мередит Уиттакер.

Как развивалась технология распознавания лиц

В первые дни создания инструментов распознавания лиц исследователи платили людям, чтобы они приходили в их лаборатории, подписывали формы согласия и фотографировались в разных позах и условиях освещения. Поскольку это было дорого и занимало много времени, ранние наборы данных были ограничены несколькими сотнями субъектов.

С появлением Интернета в 2000-х годах исследователи неожиданно получили доступ к миллионам фотографий людей. "Они заходят в поисковую систему, вводят имя известного человека и скачивают все изображения. В начале это были известные люди, знаменитости, актеры и спортсмены", — поделился П. Джонатон Филлипс, который собирает наборы данных для измерения производительности алгоритмов распознавания лиц для Национального института стандартов и технологий.

3.jpg (116 KB)

Академики часто обращаются к некоммерческому характеру своей работы, чтобы обойти вопросы авторского права. Flickr стал привлекательным ресурсом для исследователей, потому что многие пользователи публиковали свои изображения под лицензиями "Creative Commons" — другие могут повторно использовать фото без уплаты лицензионных сборов. Некоторые из этих лицензий разрешают коммерческое использование.

IBM утверждает, что для создания набора данных Diversity in Faces была собрана коллекция из 100 миллионов изображений, опубликованных с лицензиями Creative Commons. IBM сузила этот набор данных примерно до 1 миллиона.

Это единственное тематическое исследование среди наборов данных, взятых из Интернета. Согласно Google Scholar, сотни научных статей были написаны, основываясь на этих огромных коллекциях фотографий, что вносит большой вклад в точность инструментов распознавания и анализа лиц.

Как IBM использует базу данных лиц

IBM выпустила свою коллекцию изображений для других исследователей, чтобы ее можно было использовать для разработки "более справедливых" систем распознавания лиц. Это означает, что системы могут более точно идентифицировать людей всех рас, возрастов и полов.

"Чтобы системы распознавания лиц работали так, как хотелось бы, и результаты становились все более точными, данные обучения должны быть разнообразными и обеспечивать широкий охват", — пояснил Джон Смит.

4.jpg (38 KB)

Набор данных не связывает фотографии лиц людей с их именами. Но защитники гражданской свободы и исследователи технической этики все еще подвергают сомнению мотивы IBM. Например, после терактов 11 сентября компания продала технологию отделу полиции Нью-Йорка, что позволило ей искать людей с определенными тонами кожи или цветом волос. IBM также выпустила продукт "интеллектуальной видеоаналитики", в котором используется камера наблюдения для обнаружения людей по признакам "этнической принадлежности".

"Мы считаем, что как разработчики этих систем, так и организации, развертывающие их, обязаны активно работать над уменьшением предвзятости. Это единственный способ гарантировать, что системы ИИ заслужат доверие своих пользователей и общественности. IBM полностью принимает на себя эту ответственность и не будет участвовать в работе, связанной с расовым профилированием", — заявили в IBM. – "Набор данных Diversity in Faces предназначен исключительно для научных исследований и не будет использоваться для улучшения коммерческих инструментов компании по распознаванию лиц".

Сегодня компания продает систему IBM Watson Visual Recognition, которая может оценить возраст и пол людей, а правильные данные обучения могут использовать клиенты для идентификации конкретных людей по фотографиям или видео.

"Даже когда алгоритмы разрабатываются академическими исследователями с использованием некоммерческих наборов данных, эти алгоритмы часто впоследствии используются предприятиями", — убежден бывший генеральный директор Kairos Брайан Брэкни. – "Воспринимайте это как отмывание денег с целью распознавания лиц. Вы отмываете IP и права на неприкосновенность частной жизни".

Фотографы, причастные к базе данных IBM

Австрийский фотограф и предприниматель Георг Хольцер загрузил свои фотографии на Flickr, чтобы "вспомнить замечательные моменты со своей семьей и друзьями", и использовал лицензии Creative Commons. Он не ожидал, что более 700 его изображений будут изучены для технологии распознавания лиц.

5.jpg (103 KB)

Хольцер обеспокоен тем, что такая компания, как IBM — даже ее исследовательское подразделение — использовала фотографии, которые он опубликовал по некоммерческой лицензии. "Поскольку я предполагаю, что IBM не является благотворительной организацией и, в конце концов, хочет зарабатывать деньги с помощью этой технологии, это явно коммерческое использование", — считает Георг.

Долан Хэлбрук из Портленда, имеющий 452 фотографии в наборе данных, согласился с тем, что IBM должна была запросить его разрешение. "Меня раздражает, что они используются без предварительного уведомления и возможности проверить, какие из них будут включены. У меня двойственное отношение к улучшению самой технологии", — поделился Долан.

Другие фотографы были рады услышать, что их изображения могут быть использованы для продвижения в области распознавания лиц. "Распознавание лиц — это одна из тех вещей, которые мы не можем придумать, поэтому наличие надежной системы лучше, чем система, генерирующая ошибки и ложные идентификационные данные", — заявил фотограф Нил Морали.

Удаление фото из наборов данных

IBM действительно предлагает своего рода модель отказа: люди могут связаться с IBM, отправив ссылки на фото, которые они хотят удалить из набора данных. IBM обязуется их удалить в соответствии с условиями конфиденциальности.

Когда NBC предупредили одного фотографа, что более 1000 его фотографий были включены в набор данных IBM, он попытался отказаться, отправив IBM свой идентификатор пользователя Flickr. IBM сообщила ему, что ни одна из его фотографий не была в базе данных. Когда NBC поделились конкретными ссылками на некоторые из его фотографий в наборе данных IBM, компания обвинила "ошибку индексации". По истечении недели IBM подтвердила, что удалила четыре фотографии, на которые он предоставил ссылки. Согласно анализу NBC, его 1 001 фотография все еще есть в наборе данных.

"Это тот тип массового сбора и использования биометрических данных, и, по-видимому, это происходит без ведома тех, кто на фотографиях", — прокомментировал адвокат Джей Эдельсон.

Share

Статьи по теме







0 Комментариев

Хотите быть первым?

Еще никто не комментировал данный материал.

Написать комментарий

Комментировать

Залишаючи свій коментар, пам'ятайте, що зміст та тональність вашого повідомлення можуть зачіпати почуття реальних людей, що безпосередньо чи опосередковано пов'язані із цією новиною. Виявляйте повагу та толерантність до своїх співрозмовників. Користувачі, які систематично порушують це правило, будуть заблоковані.

Website Protected by Spam Master


Останні новини

Сотовий полікарбонат у сільськогосподарських будівлях: нові можливості для фермерів

Читать всю статью

Ми у соцмережах




Наші партнёри

UA.TODAY - Украина Сегодня UA.TODAY
enfrdeitplptruestruk