Компания Google разработала интерфейс Cloud Vision, на базе технологии которой построен сервис Google Photos.

Об этом пишет ЛIГАБiзнесIнформ.

Google Vision позволяет распознавать различные объекты в изображениях. Это технология компьютерного зрения. Например, если на картине нарисован спортивный автомобиль, суши или орел, или просто контент определенного типа, то программа его распознает. Более того, если на картинке есть логотип или же надпись, наземный ориентир, они будут тут же идентифицированы и прочитаны (программа поддерживает разные языки). И это еще не все. Программа может распознать не только человеческое лицо, но еще и эмоцию его обладателя: удивление, злость, радость, грусть.

Google на прошлой неделе огласил тарифы на использование интерфейса Cloud Vision. Первую тысячу объектов Google определяет бесплатно. На каждую следующую тысячу с 1 марта действует определенный тариф. Дороже всего обходится обнаружение меток (лейблов) — $5 за тысячу. Все остальные виды компьютерного зрения — по $2,5 за то же количество объектов. Если разработчик закупает услугу оптом (от 5 млн изображений в месяц), то каждая тысяча обходится ему дешевле — в $0,6-2. Есть и лимиты по объему — обработка до 20 млн картинок за проект в месяц. Если разработчик знает, что его приложение требует большую облачную мощность, он должен будет обратиться отдельно в Google за специальными условиями сотрудничества.

С декабря 2015 года Google Vision тестировалось разработчиками. Как сообщают в Google, тысячи проектов уже начали пользоваться этим решением. И популярность сервиса уже зашкаливает. Хотя, как стоит напомнить, в сфере облачного зрения Google не первопроходец. Например, Microsoft предлагает разработчикам аналогичный функционал в сервисе Project Oxford API. И тарифы у этой компании даже ниже. В месяц 5000-10000 изображений, лиц, эмоций распознается бесплатно. При этом можно доплачивать за скорость — обработка 10 изображений в секунду обойдется от $0,1 до $1,5 за каждую тысячу картинок.

В чем же основное отличие Google? «До запуска Cloud Vision на рынке уже были решения от Clarifai, Imagga и многих других игроков. Главная проблема таких сервисов — в точности определения объектов, эмоций, распознавании текста в картинке. Они не всегда могут давать необходимый уровень детализации», — подчеркивает вице-президент по развитию Depositphotos Вадим Нехай. Но с появлением Cloud Vision, по словам управленца, у разработчиков появится доступ к алгоритму, обученному на миллиардах изображениях в поисковой системе Google, и миллиардах людей, которые эти изображения ищут. Иными словами, у этой программы «глаз наметан».

Такие платформы как Google Vision, Project Oxford API создают подспорье для экспериментов местных команд c компьютерным зрением. Специалистов подобного профиля в Украине не много, но они имеются. Как заявлял ресурсу AIN.ua основательArgumented Pixels Виталий Гончарук, в Украине есть порядка 200-300 людей, разбирающихся в этой технологии. И успешные примеры для подражания в этой сфере в Украине тоже уже существуют. Тот же стартап Гончарука, работающий в сфередополненной реальности, получил инвестиции в $1,5 млн и переехал в Калифорнию. Также в прошлом году громко выстрелил проект по распознаванию и модификации лиц в реальном времени Looksery. Одесская команда стала частью мессенджера глобального Snapchat, получив за свою технологию порядка $150 млн.

Еще одна сфера применения облачных решений компьютерного зрения — робототехника. Та же Google в видео-презентацииCloud Vision использует не фото в интернете, а реального маленького робота, оборудованного камерой. Он может делать снимки и анализировать, что видит перед собой. В Украине энтузиастов, собирающих различные «умные железяки», тоже хватает.