Последние годы со всех концов интернета мы слышим про нейросети. В основном в ключе новых супер-пупер приложений для айфона или инстаграмма.*
С точки зрения программирования – это самообучающаяся система. Она может функционировать как в рамках заданного алгоритма, так и на основе прошлого опыта (он, конечно, тоже приобретается и распознается через алгоритмы). Уникальность такой компьютерной программы в том, что это не выполнение конкретных команд, а распознавание и реакция на информацию.
Человек — необходим!
Однако, чтобы добиться хороших результатов, нужно прогнать через нейросеть миллионы вариантов начальных условий. И все это невозможно без участия человека. Именно человек должен окончательно определить, где машина ошиблась, а где была права. Делая поочередно то правильные, то неправильные выводы, программа постепенно повышает процент «попаданий», пока он не достигает требуемого значения. Кроме того, нейросеть не может и не может научиться ставить сама себе задачи. Правда ей можно дать задачу научиться ставить задачи, но это все равно будет под нашим контролем. В общем, нужно запомнить, что нейросеть — это не ИИ, это просто код, который написан так, что сопоставляя миллионы вариантов находит самый приемлемый\вероятный.
Все дотошные, а так же айтишники могут почитать на хабре все более умным языком
Из серьезных направлений
Нейронные сети разрабатывают и изучают прежде всего, чтобы понять как действует мозг человека. Так же они используются уже десяток с лишним лет для создания бионических протезов. Именно нейросеть обеспечивает протезу «понимание» сигнала от мозга к мышцам и его дальнейшую интерпретацию для движения механической конечности. Аналогично работают бионические протезы глаз.
Медики вообще стараются не упускать возможности, например, они адаптировали программу распознавания фото для первичной диагностирования рака кожи. Несколько таких приложений можно найти в ГуглПлее. Если решите потестировать, помните, что программа права только в 72% случаев. Но осторожность не повредит.
Из тех, которые с нами каждый день
Самое ранне применение нейросетей в быту было в системах автопилотирования. А уж цены на нефть, драг. металлы, курсы валют и даже погоду предсказывают сегодня нейросети. Гугл Переводчик обучается именно на основе нейросетей (так что не забывайте почаще пользоваться кнопкой «улучшить перевод»)
Работа фоторедакторов типа Prisma так же основаны на нейросетях. И наш любимый «Окей, гугл!» понимает нас благодаря способности обучаться и находить оптимальные варианты распознавания и реагирования.
Развлечения, за которыми стоит наука
Нейросеть можно использовать в любой области, стоит только миллионы раз прогнать миллионы вариантов :) Некоторый объем этой задачи разработчики отдают нам, простым пользователям. А самое простое — сделать это с картинками. Картинки довольно одназначны по сравнению со словами, хотя и лингвистические алгоритмы тоже есть. Поэтому в приложениях такое засилье всяких-разных распозновалок фото, рисовалок и прочего угара. Пойдемте тестировать.
Начнем с популярного и всем известного quickdraw
Проверка правильности организована в виде задания, которое мы получаем перед началом рисования. Что удобно, исключает фактор вредителей. Однако может показаться, что все подстроено. На нужно за несколько секунд нарисовать названные предмет предмет. При нахождении правильного ответа программа все сделает сама.
Этот же алгоритм умеет превращать кривой набросок в аккуратную иконку.
Слудующая программка pix2pix, заявлена как та, которая дорисует ваш эскиз. По ощущениям ее еще надо сильно-сильно дорабатывать. Больше всего крипоты вы получите от прямых линий, типа волос, усов или травы.
Над ней успели поглумиться и на дваче и на пикабу. И за год существования особенно дела у нее в гору не пошли.
Обучалась программулька на примере 2000 фотографий котов, и сгенерированными по ним набросками. По-видимому, генерация границ была настроена не очень хорошо, что сильно снизило качество обучения.
А вот следующие фильтры FaceApp для смартфонов меня страшно радуют.
Загружаем фотку и выбираем 4 любых типа фильтра. При хорошем фото в фас даже улыбка полностью на своем месте
Программа обрабатывает изображения не на самом смартфоне, а на серверах приложения. Так что запаситесь терпением.
Кое-что выбивающееся из привычного. Нам обещают картинку по написанному тексту. На сайте Wordseye собраны классные варианты изображений, вот что получилось у меня
Думаю, вся проблема в том, что она не обучается, т.е. нету возможности сказать, что все неправильно. Не понятно тогда в чем смысл выставлять программу на общий доступ.
На самом деле программа создавалась как среда, где можно быстренько сделать 3-д модель, описав, что нужно, простыми предложениями. В окне просмотра есть зум и картинку можно рассматривать с разных сторон. Программа вычленяет из текста объекта и информацию об их материале, расположении освещении. Предполагается, что программа может создавать целые трехмерные сцены.
Продолжая тему животных. Последнее время стало модно говорить про обычных дворовых псин или котов что-то вроде «похож на мейкуна», «помесь пуделеподобной таксы и ротвейлера». Сервис What Dog поможет вам грамотно составить объявление о продаже определить, к какой же породе относится ваша собачка. Вот совершенно беспородный барбос из деревни оказался норфолк-терьером.
Из огромного количества приложений на основе нейросетей, больше всего меня впечатлила Caption Bot У него забавные формулировки и лучше всех остальных определял, что же я в него загрузила. Уверена, не последнюю роль тут сыграла система оценки правильных ответов. Привычные 5 звезд, как в одноклассниках :)
Ну и последнее про распознавание фотографий. Microsoft предлагает шагнуть в более прекладные дела и использовать API для бизнес-аналитики. И правда, что может быть важнее, чем определить, какую именно эмоции на фотки с корпоратива испытывает ваш начальник или заказчик. Не знаю, как там в деловом мире, в вот всех персонажей из Ведьмака 3 эта программулина раскусила. UPD: Я все перепутала, а вот Александр меня вовремя поправил.
Трисс самая эмоциональная. Боиться, конечно, чего их там ждет, чай порталы колдовать опять придется. Злится, что обожаемую Цири обижают эльфы-агрессоры. А вот к кому у нее там презрение, это еще вопрос. Может, Йен ее достала?
И на сладенькое, вот вам музыкальный альбом гражданка-стайл. Все тексты песен написаны алгоритмом на основе нейросети. Наслаждайтесь.
* Деятельность родительской организации «Meta» признана экстремистской и запрещена на территории Российской Федерации
Лучшие комментарии
Слышал давно, что одну нейросеть в составе стартапа Magic Pony Technology (которую уже купил Твич, судя по новости годичной давности) научили улучшать качество видео, и что один из вариантов её прикладного применения — стриминговые сервисы. Как утверждают разработчики, данная программа способна работать на обычном гпу, что даёт, в теории, возможность использовать автоулучшение качества изображения в играх.
Ну и Геральт последний, чутка зол, чутка печален.