Компания Microsoft работает над разными алгоритмами распознавания человеческих лиц. В 2015 году был запущен сервис How-Old.net, который сразу стал популярным среди пользователей.
Вначале планировалось провести небольшое тестирование среди 50 человек, но веб-страница стала очень известной и ее сервисом воспользовались 35 тысяч пользователей. Разработчики даже не ожидали, что количество загружаемых фотографий за весь период работы будет вычисляться в миллионах.
Как работает сервис распознавания человеческих лиц?
Сам веб-сервис представляет собой страничку, на которой можно загрузить фото (размером не больше 3 Мб) и через пару секунд получить информацию о человеке с фотографии – пол и возраст. Однако многие пользователи сообщали о недостоверности полученных данных. Так, например, очень часто интеллектуальное приложение ошибалось с возрастом, иногда погрешность была достаточно велика. Лица некоторых людей вообще не были найдены на фотографии, также встречались проблемы с определением пола. Результаты зависели от выражения лица, освещения и качества фотоснимка.
Протестировав новый сервис, разработчики увидели все его недостатки и начали работу по их устранению.
Несколько месяцев назад Coca-Cola праздновала юбилей, поскольку в 1915 году был запатентован уникальный дизайн бутылки. Coca-Cola совместно с компанией Microsoft отпраздновали 100-летие с использованием веб-сайта How-Old.net. Они приготовили для пользователей всего мира грандиозный сюрприз, разблокировать который можно загрузив свои фото со стеклянной бутылкой Coca-Cola. Результат очень понравился людям, ведь кроме считывания информации о человеке, интеллектуальное приложение обнаруживало бутылку Coca-Cola и выставляло ей возраст 100.
Для реализации этого проекта пришлось разработать новый алгоритм распознавания бутылки. Разработчики разделили его на два этапа – распознать логотип Coca-Cola и уникальные контуры бутылки. На первом этапе использовали сценарии Python и библиотеки обработки изображений, затем глубокие нейронные сети от Azure Machine Learning. Они помогают в создании модели, определяющей наличие бутылки под логотипом компании. Для повышения точности модели использовали непрерывную итерацию, ведь лица могут занимать большую часть фотографии. В веб-сервисе присутствует инструмент распознавания лиц Face detection API, технология машинного изучения, аналитики в режиме реального времени PowerBI и поисковые инструменты Bing API.
Таким образом, можно распознавать не только бутылку известного бренда, но и другие предметы, их основные характеристики, что в свою очередь является значительным достижением в области IT.