Не музыка еще, уже не шум

Умением компьютеров торговать на бирже, распознавать лица, прокладывать маршруты, обыгрывать человека во все более сложные игры (го уже позади, впереди – покер и старкрафт) уже сложно кого-то удивить. Какой бы ни была практическая задача, кажется, что с помощью волшебного слова «нейросеть» скоро можно решить и ее. Все, что останется нам с вами, – приглядывать за машинами, посвятив себя свободному творчеству. Есть лишь одна проблема: компьютеры, похоже, скоро станут соперничать с людьми даже в творчестве – по крайней мере, инженеры ведущих IT-компаний уже плотно занимаются этим вопросом.

Дуглас Эк, атлетичный мужчина в хипстерских очках и клетчатой рубашке, показывает презентацию с десятком цветных спектрограмм. Он кликает на одну из них, и зал, наполненный инженерами и журналистами, вдруг оглушают гитарные риффы. «Это Metallica», – объясняет Эк присутствующим, большинство из которых подобное явно слышат впервые. «А вот, например, Диззи Гиллеспи», – Эк переключает спектрограмму, гитарные риффы сменяются джазовыми трубами, и зал облегченно выдыхает. Обе записи действительно напоминают какие-то неизданные треки музыкантов, но даже самый преданный фанат не сможет их узнать. Это не редкие демо и даже не нарезка отдельных фрагментов – это полностью синтетические фонограммы, автором которых является не человек, а нейросеть, которую Дуг и его команда разрабатывают в рамках проекта Magenta.


Дуглас Эк показывает несколько музыкальных фрагментов, полученных командой Magenta

Проект Magenta – одна из команд внутри Google Brain, исследовательского подразделения глобального поисковика, которое объединяет людей, занимающихся экспериментальными подходами в области машинного интеллекта. Здесь была создана первая система, распознающая котов на видеозаписях, здесь учат нейросети соревноваться в выдумывании шифров и улучшать машинный перевод. Но даже в такой пестрой компании команда «Мадженты» выглядит немного эксцентрично: Дуглас и его сотрудники хотят использовать машинное обучение не для решения каких-то практических задач, а чтобы компьютер смог писать музыку и заниматься искусством. «Зачем?» – спросите вы. В Magenta задают другие вопросы: «Если это возможно, то как? Есть нет, то почему?» – именно так звучит слоган проекта.

Рисуй со мной

Последовательность событий важна не только в музыке и речи, но и в карандашных набросках, а значит, те же RNN можно научить рисовать. На сайте Magenta c ними можно вступить в творческий диалог – они продолжат ваш набросок и создадут сотни его аналогов. Неважно, рисуете ли вы у котенка мордочку или все тело, один глаз или три – ИИ сможет увидеть животное даже в зубной щетке.

Вальс на костях

Конечно, эксперименты с созданием «искусственной музыки» проводились задолго до появления и Googlе, и современных компьютеров. Один из первых известных нам опытов приписывается самому Моцарту – речь идет об игре в так называемые музыкальные кости. Они представляли собой обычные игральные кости, которые в соответствии со специальной таблицей позволяли выбрать один из заранее подготовленных коротких музыкальных фрагментов и добавить его в партитуру. Бросая кости много раз, можно было создать до 1116 уникальных вальсов, которые, впрочем, были очень похожи друг на друга. Создание еще одного варианта подобной игры приписывается Гайдну, но, как и в случае с Моцартом, историки не подтверждают его авторства,  хотя и признают  популярность подобных игр в XVIII веке.

Дальнейшая история «искусственной музыки» связана с авангардистами уже нашего времени – изобретением композитором Иосифом Шиллингером запутанной геометрической системы,  которая  должна  была  найти объективные законы музыки, с сюрреалистическими экспериментами Яниса Ксенакиса, который для выбора нот использовал уже не примитивные кости, а распределение Пуассона и т. д. Интересно, что, несмотря на официальную борьбу с формализмом, эксперименты в этом направлении велись и в СССР. Их пионером был математик Рудольф Зарипов: в начале 1960-х годов он получил доступ к одному из первых в стране компьютеров и разработал собственную систему кодирования нот и движения мелодии. ЭВМ, на которой он работал, называлась «Урал», поэтому получившиеся произведения Зарипов назвал «Уральскими напевами». К счастью, и они, и их полифонические версии сохранились, так что при желании их можно послушать.


Картины из шума

Психоделические галлюцинации DeepDream обходятся без RNN, но остаются самым известным примером креативности нейросетей.

Насколько музыкальными были подобные эксперименты, оставим судить музыковедам, но алгоритмы их построения были практически одинаковы: создание музыки авторы «систем» доверяли некоему случайному генератору, который продвигал партитуру от такта к такту по заранее заданным законам. Источником этих законов был сам автор – именно он должен был предусмотреть и обобщить все возможные варианты развития мелодии и аккомпанемента. Однако на практике поиск объективных музыкальных законов оказался делом почти неподъемным – так или иначе, ни «Уральские напевы», ни другие формальные творения (а подход применялся не только в музыке, но и в литературе) хитами не стали.

Однако примерно в это же время, в разгар увлечения математиков музыкальными алгоритмами, появились те самые нейросети, о которых сегодня не слышал разве что цифровой анахорет. Их устройство предполагало совершенно иной подход: нейросети исходно были заточены на то, чтобы не искать стройных, понятных человеку закономерностей, а анализировать простые корреляции, причем в автоматическом режиме. Появление нейросетей с музыкальными экспериментами исходно никак не было связано, но именно им суждено было вдохнуть в эту область новую жизнь. Однако следует оговорится, что речь идет не о нейросетях вообще, а системах особого класса – рекуррентных, или RNN (recurrent neural network).

COM_SPPAGEBUILDER_NO_ITEMS_FOUND