View in Telegram
Третий персонаж - это Фей-Фей Ли Профессор Принстонского университета, она вдохновлялась работами Ирвинга Бидермана - который утвреждал, что в среднем человек распознают от 30 000 разных объектов физического мира. И Фей Фей Ли тогда решила, а что если разметить вообще все объекты, встречающиеся в мире, и сделать из этого такой огромный и качественно собранный набор данных? Ведь тогда получится дать машинам в качестве входных параметров массив данных совершенного иного порядка! Энтузиазм уперся в математический рассчет - если как Ли изначально планировала размечать этот датасет дюжине студентов Принстона, даже при всей возможной оптимизации процесса на это уйдет по меньшей мере 18 лет работы. Но тогда Ли узнала про Amazon Mechanical Turk (AMT) - сервис, через который можно было подключать руки для разметки по всему миру, в любом нужном в моменте объеме и заметно дешевле студентов Принстона. Ли посчитала, что с AMT процесс займет около двух лет - и началась работа. Спустя два года результат был получен, вручную размечено 14 000 000 картинок. Ли вдохновенно подала заявку на выступление на конференцию по компьютерному зрению. Это же фантастика, такого объема набора данных для тренировки не было никогда ранее за всю историю! Когда пришел ответ от конференции, Ли была подавлена: им предложили разместиться всего лишь с постером с описанием проекта в холле конференции - даже не на второстепенной сцене! Вызывано это было тем, что к тому моменту (2009 год) большинство исследователей разорчаровались в поплуярных ранее нейросетях и считали их пыльным пережитком прошлого. А для других трендовых тогда технологий по типу векторных машин такие объемы данных особо не требовались. Но Ли продолжала верить в свой проект и начала проводить соревнования по использованию ImageNet для распознавания картинок. В 2010 году в конкурс вписвалось 11 команд. Победители этого года исполтзовали популярную тогда Supportive Vector Machine. В 2011 было даже меньше участников, и лучшая из команд опять использовала Supportive Vector Machine - при этом результат был не сильно лучше прошлогодней. Тут настал момент, когда даже сами Ли задалась вопросом - а верная ли была ставка на ImageNet? Не пора ли смирится и признать, что все критики из индустрии, так холодно встретившие ее детище, были правы и заняться чем-то еще? Но Ли все-таки решила провести конкурс еще разок. И в 2012м году ситуация кардинально поменялась. Конкурс выиграла команда Джеффа Хинтона с его студентами - Алексом Крижевсим и Ильей Суцкевером с их проектом AlexNet. Они использовали CNN - Convolutional Neural Networks - ту же технологию, которую задолго до этого применил Ян ЛеКун, тоже ученик Хинтона. AlexNet предстаили на конференции, на которую приехала Фей-Фей Ли (она почувствовала важность момента и решила все-таки ехать, хотя изначально думала отказаться от приглашения, потому что недавно родила ребенка), на которой был и Ян ЛеКун. Когда Алекс Крижевский выстпуил, Ян ЛеКун был в восторге: “Это доказателтсво!” - сказал он тогда -“без сомнения это поворотоный момент в истории компьютерного зрения”. Photo: Wired magazine
Love Center - Dating, Friends & Matches, NY, LA, Dubai, Global
Love Center - Dating, Friends & Matches, NY, LA, Dubai, Global
Find friends or serious relationships easily