Компьютерная программа впервые проявила «воображение»

Компьютерная программа впервые проявила «воображение»

PanARMENIAN.Net - Одной из сложностей на пути создания искусственного интеллекта – отсутствие воображения у компьютерной программы. Машина не способна, подобно человеку представить визуальное изображение на основе ее описания и менять его. Однако исследователи Токийского университета Хирохару Като и Тацуя Харада создали алгоритм, который умеет грубо воспроизводить картинку по ее описанию – некий далекий аналог воображения.

Для этого ученые собрали базу из 101 изображения размером 128 × 128. С помощью алгоритма они проанализировали их на выявление визуальных слов. Визуальные слова - это понятие в компьютерном зрении, которое дает программам представление о том, что изображено на картинке: например, так можно отличить небо от горизонта. Одно визуальное слово представляет короткую последовательность пикселей. В эксперименте Като и Харады она составляла 13 × 13 пикселей.

Исследователи взяли этот метод и использовали для него два способа. Во-первых, решили считывать визуальные слова вместе с теми, которые находятся рядом с ними. Например, несколько слов о линии горизонта дадут программе представление о непрерывной линии. Таким образом они выявили пары визуальных слов, которые находятся друг с другом в их базе изображений, приняв, что 3/4 всех слов «перекрывают» друг друга. Во-вторых, ученые учитывали положение визуального слова на картинке. Например, вероятность получить визуальное слово с небом в верху изображения больше, чем внизу.

С полученным алгоритмом они провели эксперименты. Сначала воссоздали изображения по тем визуальным словам, которые получили с них. Потом использовали программу для компьютерного зрения на 10 тысячах случайных картинках, чтобы извлечь из них визуальные слова и восстановить по ним изображения. Кроме того, они попробовали с нуля создать графические файлы по описанию на естественном языке. Для этого они перевели все слова из описания набор визуальных слов и отдали их в обработку. В этом случае алгоритм воспроизвел абстрактные изображения, которые имели мало общего с исходным запросом.

 Самое значимое
Ара Хачатрян занимал должность генерального директора с апреля 2020 года
Правительство одобрило проект налогообложения рекламы, размещаемой на электронных платформах
По словам Багдасаряна, в 2020 году компания увеличила число активных пользователей в 20 раз
Krisp является одной из 50 наиболее перспективных компаний в сфере ИИ в 2020 году
Partner news
---