Здорово, бандиты! Сегодня Яндекс сделал еще один шаг к усовершенствованию своей поисковой системы, разработав и внедрив новую технологию CBIR (Content Based Image Retrieval), которая получила русское название "Сибирь"
Для того, чтобы найти похожее изображение с адресом, где оно находится, надо просто загрузить изображение или вставить ссылку на него. После того как пользователь загрузил картинку, поисковик превращает её в набор визуальных слов. Визуальные слова — это удобные для поиска численные представления ключевых элементов картинки (границы объектов, контрастные области и так далее). После этого поисковик выбирает среди известных ей миллиардов картинок изображения, содержащие такие же визуальные слова, как на загруженной картинке, отсекая все остальные. Это важный этап, потому что для увеличения скорости необходимо сузить область поиска. Потом система сопоставляет расположение ключевых элементов на оставшихся изображениях и выстраивает их по близости к загруженной картинке так, что сверху оказываются наиболее похожие. Всё это занимает меньше минуты.

Стоит отметить, что главный конкурент российской интернет компании, поисковый гигант Google, ввел подобную технологию еще в 2011 году. Более того, в марте этого года Google ввел поиск по GIF-файлам, так же появился поиск изображений на прозрачном фоне. Тем не менее, такой даже простой поиск по изображению очень сложный и только единицы компаний обладают аналогичными технологиями, так что у нас есть очередной повод погордиться за отечественную поисковую систему.
В официальном блоге компании предлагается с помощью новой системы узнать какое животное изображено на картинке:

Вот такой результат выдает, если поискать по шапке глада:
