Products Download Order Support
пишите нам: info@widisoft.com
<< Предыдущая часть

Повторив распознавание с новыми установками Эквалайзера, мы получим результат, показанный на рисунке 3, где приведены первые четыре секунды спектрограммы (масштаб отображения уменьшен вдвое).

рисунок 3

Разглядывая полученную спектрограмму можно заметить, что в ней присутствует довольно много лишних нот. Чтобы бороться с этим, важно понимать, откуда они берутся. Когда начинается новая нота, в ней присутствует много атональных частот, то есть частот не кратных основному тону. Это и не основной тон и не обертона. Так как в любом инструменте имеется резонатор, настроенный на определенный набор частот (на гитаре это струна, в духовых инструментах – полость и так далее), то все лишние частоты достаточно быстро затухают. Следовательно, эти лишние частотные составляющие звучат достаточно малое время. Кроме того, эти частоты звучат много тише, чем основной тон. Итак, большинство нот, которые необходимо убрать из результата распознавания – короткие и тихие.

рисунок 4

Одним из самых важных параметров для распознавания является число одновременно звучащих нот. Алгоритм WIDI разделяет их по громкости – выбирается указанное в настройках число самых громких нот, остальные отсекаются. Поскольку обертона одних нот иногда оказываются громче, чем основные частоты других нот (как например случилось в этой записи с обертоном флейты), этот параметр надо выставлять чуть больше чем реальное число голосов. Послушав еще раз исходную запись, убедимся что в ней присутствуют около 5 голосов – одновременно звучат 4 гитарных струны и флейта. Установим значение полифонии равным 6, как показано на рисунке 4.

В диалоге Параметры Распознавания (Recognition Settings) Выбираем закладку Тон->MIDI (Pitch->MIDI) и указываем значение полифонии 6.

рисунок 5

Повторяем распознавание и рассматриваем спектрограмму. В этот раз обратим внимание на участок от 4 до 7,5 секунд. Видно, что количество лишних нот уменьшилось, но их все еще достаточно много. Поэтому увеличим минимальную длину ноты. Рассмотрим участок спектрограммы и выберем на ней несколько коротких лишних нот. Установим минимальную длину немного больше чем длина этих лишних нот. На рисунке 5 приведены результаты распознавания, где обведены красными кружками несколько лишних нот и указана их длительность. Выберем минимальную длину ноты равной 65 мс (рисунок 6).

рисунок 6

В диалоге Параметры Распознавания (Recognition Settings) выбираем закладку Тон->MIDI (Pitch->MIDI) и устанавливаем значение минимальной длины ноты равным 65 мс.
Повторив распознавание, убедимся, что все обведенные лишние ноты исчезли (рисунок 7).

рисунок 7

Теперь обратим внимание на синхронизацию нот различной высоты (рисунок 8). Две выделенные ноты, расположенные в районе 44-й секунды, должны звучать одновременно, но тем не менее бас запаздывает.

рисунок 8

Причина этого явления состоит в том, что начала басовых нот определяются недостаточно точно, кроме того, в большинстве случаев басовые ноты имеют тенденцию "съезжать" назад или вперед в зависимости от алгоритма распознавания. Систематическое запаздывание или опережение басов можно скорректировать выбором параметров распознавания. Подробное описание того, как это сделать, находится в следующей врезке и проиллюстрировано рисунком 9. Эта операция улучшает синхронизацию нот разных высот друг с другом, синхронизация нот с аудио-файлом будет рассмотрена далее.

рисунок 9

Открываем Параметры Распознавания (Recognition Settings)и выбираем закладку Звук->Тон (Wave->Pitch). Сдвигаем ползунок Временной сдвиг басов (Time Shift of Bass) на несколько делений вправо. Сразу выбрать правильное значение удается не всегда – в данном случае я сначала выбрал сдвиг на 4 деления, но он оказался недостаточным. Тогда я увеличил сдвиг еще – до 7 делений, а результате чего разница между временами начал нот сократилась с 60 до 20 миллисекунд.
На рисунке 10 показан результат распознавания после изменения параметра сдвига басов.

рисунок 10

В качестве последнего шага по настройке параметров распознавания вводим ограничение по громкости (эта возможность появилась только в версии 3.3). Пользуясь приемом, аналогичным тому, который использовался для определения минимальной длины ноты, выбираем навскидку несколько лишних нот и смотрим их громкость. В данном случае я выставил минимальное значение равное 25. Кроме того, если обратить внимание на то, как разбиты ноты по трекам (для этого удобно выделить ноты с помощью Редактора Треков (Track Editor) – используя кнопку A на каждом треке), мы увидим что треки совершенно не совпадают с голосами. Поэтому отключаем заодно и разбиение на треки по громкости.

рисунок 11

Открываем Параметры Распознавания (Recognition Settings), выбираем закладку Тон->MIDI (Pitch->MIDI) и устанавливаем параметр Minimal Note Velocity равным 25, кроме того, снимаем выделение с пункта Разделять треки по громкости (Separate Tracks by Volume).

Результат автоматического распознавания.

Конечный результат всех рассмотренных действий можно скачать по ссылке:
Скачать полученный MIDI-файл.
Кроме того, вы можете скачать файл настроек, который включает в себя установки параметров распознавания и эквалайзера:
Скачать файл настроек распознавания.



<< Назад     Дальше >>

Замечания по тексту? Выскажите их на нашем форуме.

Содержание:
на главную | примеры | установки mp3 to midi, wave to MIDI