Как работает WIDI

WIDI является сложной системой, в состав которой входят несколько алгоритмов, осуществляющих различные стадии процесса распознавания.

 

Имеются два типа алгоритмов - алгоритмы детектирования нот и дополнительные алгоритмы.

 

В текущую версию WIDI включены три различных алгоритма детектирования нот - это Евклид, Алгоритм распознавания ударных и Улучшенные Сенсоры.

 

Евклид и Улучшенные Сенсоры - это алгоритмы общего назначения, предназначенные для анализа любых музыкальных звуков.

Они имеют свои сильные и слабые стороны, и качество распознавания существенно зависит от значений параметров, которые устанавливаются в закладках Звук->Тон, Тон->MIDI,  а также в Эквалайзере.

 

Алгоритм распознавания ударных предназначен для распознавания только ударных и перкуссии.

 

Дополнительные алгоритмы позволяют анализировать различные характеристики произведения, при этом данные, полученные дополнительными алгоритмами, могут использоваться для повышения точности работы основного алгоритма.

 

В текущей версии дополнительные алгоритмы включают в себя Определение расстройки и Анализ тональности. Работа этих алгоритмов управляется  параметрами, расположенными на закладках Расстройка и Опции MIDI диалога Параметры распознавания, а также закладкой Маска Шкалы Эквалайзера.

 

Свойства записываемого MIDI файла могут быть заданы вручную в закладке Опции MIDI. Все они, кроме тональности, не используются при распознавании и переносятся в файл без изменений.

 

При использовании дополнительных алгоритмов последовательность автоматического распознавания может быть довольно сложной.

Например, если установить флаги Определять глобальную расстройку, Автоопределение Тональности и Учитывать Тональность, то последовательность будет следующей:

Определяется глобальная расстройка (полученные данные передаются алгоритму детектирования нот).
Предварительно распознается запись с использованием выбранного алгоритма детектирования нот и плоской Маской Шкалы.
Определяется тональность, и диалог выбора тональности из списка подходящих тональностей демонстрируется пользователю.
Установленная пользователем маска шкалы сдвигается в соответствии с определенной тональностью.
Производится повторное распознавание, с учетом установок Эквалайзера.
Запускается редактор TrueTone или Окно MIDI, в которые загружается результат распознавания.

 

В менее сложных случаях, например при выключенном флаге Автоопределение Тональности, часть шагов пропускается.

 

Как правило, при распознавании каждой конкретной записи требуется несколько попыток автоматического распознавания с разными параметрами, можно начать с одной из предустановленных настроек распознавания и уточнять значения параметров после каждой следующей попытки. После ряда итераций удается обнаружить оптимальную конфигурацию параметров, когда дальнейшее повышение точности автоматического распознавания практически невозможно - на этом этапе рекомендуется приступить к ручному редактированию с использованием редактора TrueTone, входящего в состав WIDI Professional.