Аналоговый и цифровой звук: характеристика

Аналог и цифра в записи: где же звук милее, неквадратней и круглее?

Экономика впечатлений: как реклама работает в России

Слово «реклама» произошло от латинского «reclamo», означающего «громко орать»

История глагола связана с тем, что чтобы обратить внимание на свой товар, древним римлянам приходилось привлекать покупателей криком: кто громче описывал преимущества того, что лежит на прилавке, тот получал прибыль. Сейчас никто уже не кричит в классическом понимании, но установка контакт с потребителем все равно считается основной потребностью производителей товаров и услуг

Современному человеку важно, чтобы то, что он получает, органично вписывалось в его повседневность, мировоззрение и соответствовало образу его мышления

То есть, на первый план выходит имидж

Современному человеку важно, чтобы то, что он получает, органично вписывалось в его повседневность, мировоззрение и соответствовало образу его мышления. То есть, на первый план выходит имидж. Персонализация становится основным инструментом рекламы

То же происходит со всей медиасредой: контентмейкеры стремятся сформировать свой язык, найти тот самый способ коммуникации с клиентом. Но здесь у России свой путь: как считают эксперты, в нашей стране автоматизация почти невозможна — люди в любом случае будут собираться своими группами, и чем сильнее вызов, тем больше стремление образовать коммьюнити, следовать замыслу

Персонализация становится основным инструментом рекламы. То же происходит со всей медиасредой: контентмейкеры стремятся сформировать свой язык, найти тот самый способ коммуникации с клиентом. Но здесь у России свой путь: как считают эксперты, в нашей стране автоматизация почти невозможна — люди в любом случае будут собираться своими группами, и чем сильнее вызов, тем больше стремление образовать коммьюнити, следовать замыслу.

Громкость в цифровом звуке

Громкость цифровых сигналов не должна превышать 0db. Если не учитывать этот нюанс, на входе или выходе мы получаем перегрузку цифрового сигнала. Это значение является самой высокой точкой, то есть пиковым значением. Она позволяет записывать качественный звук и воспринимать его надлежащим образом. Если превысить это значение, сигнал искажается, а оборудование от перенагрузки может испортиться.

Кроме пиковой точки, понятие громкости включает в себя еще и такой элемент, как значение RMS. Этим понятием определяют уровень актуальной громкости, который отражает плотность записи и выдает информацию о громкости, которую способен воспринять наш слух. RMS обозначают в децибелах, но с минусовым значением: звук тем громче, чем больше числовое значение RMS (максимально громко — -6db, максимально тихо — -20db). Оптимальные значения цифровой громкости — -12db —  -10db.

Нейросети и AI

Генерация музыки нейросетью — на самом деле простой, даже примитивный процесс, не имеющий принципиальных отличий от методик того же Коупа. Как это происходит, в первом приближении:

В процессе обучения нейросети ей на вход подаются фрагменты музыкальных произведений. Нейросеть анализирует музыку (высоту и длительность нот), и находит закономерности, например что после нот до и ми скорее всего будет нота соль. Эти закономерности кодируются внутри нейросети в виде весов нейронов. Чем больше обучающих данных было на входе, тем больше закономерностей найдёт нейросеть, и тем более тонкие музыкальные нюансы она сможет учесть. Само обучение заключается в том, что нейросеть просят предсказать высоту и длительность следующей ноты, которая будет после обучающего фрагмента. В зависимости от того, какую ошибку сделала нейросеть, подстраиваются веса нейронов, отвечающих за прогноз, и такой процесс повторяется много миллионов раз (нейросеть — очень плохой и ленивый ученик по сравнению с человеком, приходится много раз повторять, чтобы знания хорошо усвоились).

Обученная нейросеть готова генерировать музыку. На вход нейросети подаётся “затравка” из первых нот произведения, которое хочется продолжить (эта затравка задаёт стиль последующей сгенерированной музыки). Если хочется сгенерировать что нибудь совсем уникальное, а не продолжать существующее произведение, на вход подаётся любая случайная нота. Нейросеть делает прогноз, какие ноты и с какой длительностью могут идти после “затравки”. Прогноз это список пар “нота” — “вероятность”. Из этого списка формируется топ наиболее вероятных нот, и из топа случайным образом выбирается следующая нота. Это нота присоединяется к “затравке”, и на вход нейросети подаётся новый стартовый фрагмент, “затравка + нота”. Нейросеть опять предсказывает следующую ноту, она опять присоединяется к стартовому фрагменту, и такой цикл повторяется много раз, пока не сгенерируется музыка достаточной длительности. Собственно, это всё. Никакой магией и искуственным интеллектом здесь даже и не пахнет.

Аналогово цифровое преобразование

Звуковой сигнал может быть аналоговым или цифровым. Если рассматривать аналоговый сигнал, исходящий из аналоговой аппаратуры, то представляет он собой непрерывный электрический сигнал. Цифровой звук – это сигнал, представленный дискретными численными значениями его амплитуды. То есть такой сигнал записывается в виде чисел, а считывается он компьютерной техникой.

Аналоговый звук можно преобразовать в цифровой путем обработки аналогового сигнала, придавая ему численных значений. Сделать это можно в два этапа. Первый – дискретизация, в ходе которой из сигнала, который необходимо преобразовать, в определенные временные промежутки выбирают величины по заданным значениям. Второй – квантование: процесс разбиения значений, полученных в ходе дискретизации значений амплитуды звука с максимально приближенной точностью.

В аналогово-цифровом преобразовании точные значения не используются – все величины указываются округленными, поскольку из-за ограничения оперативной памяти приборов реальное значение амплитуды указать невозможно – оно бесконечное.

Состояние на сегодняшний день.

Самый публичный проект в области генерации музыки, который активно делится своими идеями и разработками, это Google Magenta (они занимаются генеративным искусством в целом, но музыка это их основное направление). У них много любопытных демо:

https://magenta.tensorflow.org/demos

Еще один пример неплохой генерации музыки — модель MuseNet компании OpenAI:

https://openai.com/blog/musenet/

Но, по видимому, OpenAI сейчас испытывает некоторые финансовые трудности (инвесторы начали требовать странного — отдачи от вкладываемых в течение пяти лет денег), и продолжать разработку MuseNet они вряд ли будут.

И, конечно, многочисленные стартапы по генерации музыки. Если честно, то, что генерирует большинство из них, музыкой назвать сложно. Например, известный и распиаренный Mubert — слушать это дольше пары минут лично я не могу. Подозреваю, что они обучались на выборке MIDI из файла trash.zip, найденного на самом днище Интернетов. Но возможно, такая музыка просто не в моём вкусе

Более юзабельный сервис — brain.fm. Они не претендуют на генерацию музыкальных шедевров, их продукт это фоновая музыка для работы и для расслабления/засыпания. Можно выбрать из нескольких видов музыки, в режиме ‘Piano’ у меня генерировалось что то моцартообразное и вполне благозвучное. Как они и обещают, эта музыка приятная, но без вовлекатора, чтобы не отвлекать от основного занятия. В некотором смысле это антимузыка, противоположность тому, чего пытается добиться большинство посетителей бара. Но и фоновая музыка тоже важна и нужна.

И самый, на мой взгляд, интересный стартап: AIVA Музыку, которую генерируют эти ребята, приятно слушать, в ней есть интересные мелодические ходы и даже некоторый мэджик. Ну а после некоторого допиливания руками она звучит, как музыка, написанная вполне приличным современным композитором типа Филиппа Гласса, особенно в исполнении живого оркестра. Вот пример (слушать с 0:30):

Или вот, менее “обработанный напильником” образец:

Пытаются они генерировать и рок, выходит на мой взгляд довольно смешно:

Звук – что это?

Звук представляет собой физическое явление. Это упругие волны механических колебаний, распространяющиеся в газообразной, твердой или жидкой среде. Под звуком чаще рассматривают те колебания, которые воспринимаются животными и людьми. Основными характеристиками звука считаются амплитуда и спектр частот. Для людей второй показатель колеблется в диапазоне 16-20Гц – 15-20 кГц. Все что ниже этого диапазона, называют инфразвуком, выше – ультразвуком (до 1 ГГц) или гиперзвуком (от 1 ГГц). Громкость звука формирует звуковое давление и его эффективность, форма колебаний и их частота, а вот высота звука зависит от величины звукового давления и частоты.

Усиление эмоции, которая уже присутствует визуально

Издание Scientific American опубликовало отчет об исследовании, в котором участники слушали веселую или грустную музыку, а затем смотрели на серию изображений людей, которые либо улыбались, либо грустили, либо не выражали особых эмоций. Веселая музыка усиливала восприятие изображения счастливых людей, и то же самое с грустной музыкой.Другими словами, музыка может углублять или усиливать эмоциональный опыт — делать вещи более смешными, печальными, страшными, более напряженными и т. д

Если за кем-то крадется убийца, высокие удары скрипки могут помочь зрителям испытать более глубокое чувство испугу, чем если бы они смотреть исключительно на изображение. В оркестровом саундтреке Дарио Марианелли к фильму «Искупление» в самом конце играет медленная и задумчивая музыка. Мы, как зрители, только что узнали, что жизнь двух главных героев на самом деле закончилась, а они так и не успели испытать украденную у них любовь

Это душераздирающий момент истории, который еще больше усиливается меланхоличными гармониями оркестра, нарастающими и растекающимися густыми эмоциональными аккордами.

Какое будущее ждет ИИ в музыке

Представьте, что вы едете в переполненном вагоне метро и злитесь, потому что опаздываете на работу. Крошечный биометрический гаджет над вашим ухом замечает вашу тревогу и включает песню вашего любимого артиста, но изменяет ее так, чтобы она звучала более мягко и спокойно. По обратной связи гаджет замечает меняет ваши биометрические показатели и продолжает менять композицию, чтобы ее эффект был еще более благотворным.

Таким недалекое будущее музыкального ИИ видит Анмол Саксена, глава стартапа Ashva WearTech, разрабатывающего «умную» одежду, например прибор, помогающий поддерживать осанку. «На мой взгляд, есть большая вероятность, что стриминговая индустрия попробует предлагать функции, которые будут считывать такие показатели организма, как пульс, уровень стресса, частоту дыхания, может быть, даже неврологические сигналы», — говорит Саксена.

Экс-глава поглощенного тик-током стартапа Jukedeck Эд Ньютон-Рекс видит будущее ИИ похожим образом. На вопрос газеты The Guardian о том, смогут ли однажды программы, хорошо понимающие нашу психику, сочинять музыку, которая будет помогать нам засыпать, Ньютон-Рекс отвечает: «Безусловно. Это именно та область, в которой ИИ может быть полезен».

Впрочем, частично это будущее уже наступило. Похожими вещами занимаются в том же Endel, для которого Grimes написала бесконечную колыбельную. Endel, разрабатывающийся в том числе выходцами из России, еще не умеет использовать неврологические сигналы, но уже способен учитывать циркадные ритмы, уровень физической активности (определяемый по количеству шагов в минуту) и пульс (считываемый умным браслетом). На основе таких показателей приложение создает персонализированные звуковые пейзажи. По словам создателя Endel Олега Ставицкого, пользователи рассказывали о том, как оно помогало им в борьбе с ПТСР, бессонницей и звоном в ушах.

Кроме того, работа над ИИ может помочь нам понять, как мы сами сочиняем музыку, говорит Ньютон-Рекс: «Мы по-хорошему не знаем, как работает творчество. Но разрабатывая эти системы, мы начинаем задаваться вопросами о том, как аналогичные задачи решаются нашим мозгом».

Искусственный интеллект также может сильно разнообразить жанровый ландшафт музыки.

«Мне кажется, большого прорыва стоит ждать на пересечении различных музыкальных стилей», — говорит специалист по машинному обучению в области музыки Ник Брайан-Киннс. Ожидать, что живые музыканты будут смешивать большое количество разных стилей, не приходится. Но вот искусственный интеллект с легкостью может сочетать жанры в миллионах комбинаций, считает эксперт.

Впрочем, ИИ может порождать и проблемы. Как замечает Франсуа Паше, который проводит музыкальные эксперименты с искусственным интеллектом в Spotify, количество музыки, созданной ИИ, еще очень невелико по сравнению с интенсивностью исследований в этой области. Мы еще в самом начале.

Например, чем больше будет появляться музыки, сочиненной ИИ, тем больше будет и судебных тяжб. Существующие законы об авторском праве были написаны без учета искусственного интеллекта. Поэтому скоро нам придется разобраться, за кем признавать права на песню, сочиненную ИИ: за программистом, разработавшим нейросеть, за артистом, который использовал результаты ее работы в своем творчестве, за композиторами, на чьих работах ИИ тренировался, или за самим ИИ?

Может быть интересно

Другая проблема использования этой технологии в том, что нейросети становятся сегодня всё больше и потребляют огромное количество энергии, говорит Брайан-Киннс. Представьте, например, сколько электричества потребуется, чтобы ИИ проанализировал всю поп-музыку последних двадцати лет.

Новости музыкального софта

  • United Plugins Mirror – реверсивный дилей обновлён до версии 1.1
    22 февраля, 2022

    UnitedPlugins обновил свой последний плагин и добавил новую функцию. В версии 1.1 Mirror позволяет вам использовать свою фирменную обратную…

  • WA Production Heat v2 distortion
    21 февраля, 2022

    WA Productions представляют HEAT 2 — оригинальную мощную станцию с двойным искажением, теперь с потрясающим обновлением. Этот плавящий мозг…

  • AudioThing Noises – креативный инструмент для создания текстур
    19 февраля, 2022

    Noises — это экспериментальный инструмент с игривым и вдохновляющим интерфейсом, разработанный для того, чтобы привнести огромный мир…

  • Waves Audio COSMOS – бесплатный VST AI менеджер семплов
    17 февраля, 2022

    Семплы являются сокровищем творческого человека. Но только если есть возможность найти нужные образцы – быстро найти. Известнейшая компания…

  • Модуляционный и пошаговый секвенсор Devicemeister StepicVST
    13 февраля, 2022

    Компания Devicemeister объявила о выпуске StepicVST, предоставляя для установки VST и AU версии пошагового секвенсора и секвенсора модуляции,…

Как теперь воспроизвести звук

Чтобы что-то зазвучало, нужно сделать следующие шаги:

  • Взять колонки или наушники — что угодно, что умеет «толкать воздух», то есть создавать акустические волны. В колонках за это отвечают динамики, к которым подключены специальные мягкие конусы, которые, собственно, и создают колебания воздуха. Та круглая ерунда в колонке — это и есть конус.
  • Подать на эти колонки некий ток. От того, насколько мощный этот ток, конус будет двигаться по-разному.
  • Чтобы получить этот меняющийся ток, нужен специальный чип под названием ЦАП — цифро-аналоговый преобразователь. Он получает на вход число, а на выходе дает ток. У всех ваших смартфонов и компьютеров есть такие ЦАПы.

Итого:

  1. Процессор отправляет цифры из звукового файла в ЦАП.
  2. ЦАП получает числа и выдаёт меняющееся электричество по этим цифрам.
  3. Электричество попадает в колонку, передаётся на динамик.
  4. Динамик из-за электричества начинает двигать конус колонки.
  5. Конус начинает толкать воздух перед собой, создавая звуковые волны.
  6. Волны долетают до наших ушей, и мы воспринимаем их как звук.

Пополнения софта для Windows

  • W.A. Productions ComBear v1.0.121 Февраля 2022

    ComBear — чрезвычайно мощный и невероятно динамичный плагин-компрессор, с функцией параллельного сжатия. Он придает потрясающий звук и ощущение ударным, синтезатору,

  • ToneBoosters 23 plugins pack v1.6.021 Февраля 2022

    ToneBoosters — это компания, которая занимается разработкой традиционных аудио-плагинов, таких как эквалайзеры, компрессоры и многое другое. Аудиоинструменты, с помощью

  • DSPplug Mark3 1.819 Февраля 2022

    Mark3 — это mid/side лимитер с монофоническим, стереофоническим и расширенным режимами. Как и предыдущие предложения DSPplug, mark3 предназначен только для Windows, но поддержка

  • Guitarml TS-M1N1 1.1.019 Февраля 2022

    Бесплатный овердрайв на основе нейросетиTS-M1N3 — это гитарный плагин, клон классической педали овердрайва TS-9 Tubescreamer. Для создания модели поведения ручек драйва

  • Fanan Team Yumbu 315 Февраля 2022

    Yumbu 3 — это барабанный сэмплер с молниеносной загрузкой наборов ударных и быстрым одноступенчатым управлением, приспособленный для живого использования. В новой версии

Основные форматы аудио файлов

На самом деле форматов, с помощью которых можно читать аудио файлы, очень много. Но есть те, которые получили всеобщее признание. Все они делятся на три группы:

  • аудиоформаты без сжатия;
  • со сжатием без потерь;
  • со сжатием с потерями.

Рассмотрим основные форматы аудио файлов:

  1. WAV – первый аудио формат, который мог обрабатываться компьютерными программами на высоком профессиональном уровне. Недостаток – запись занимает слишком много места.
  2.  CD-диски – расширение .cda не поддается редактированию, однако его можно переформатировать и сохранить любой программой по обработке аудио.
  3. MP3 кодек – универсальный формат, максимально сжимающий аудио файлы.
  4. AIFF-файлы – формат поддерживает монофонические и стереофонические данные размером 8 и 16 бит, изначально разрабатывался для Macintosh, однако после дополнительных разработок может использоваться и на других площадках ОС.
  5. OGG – популярный формат, однако имеет недостатки в виде использования собственных кодеков и декодеров и перегрузки системных ресурсов компьютера.
  6. AMR – низкопробный аудиоформат.
  7. Формат MIDI позволяет производить редактуру записи нажатием клавиш, изменением темпа, тональности, высоты, а также добавлением эффектов.
  8. FLAC – формат, воспроизводящий аудио в высоком качестве.

Развитие цифровых технологий

Ближайшие пять лет — переломный период цифровой трансформации, когда digital-технологии охватывают даже те сферы, где всегда господствовали аналоговые. Государственные, финансовые, медицинские услуги переходят в онлайн-формат, появляются первые прототипы электронных паспортов и цифровые платежные системы без привязки к физическим валютам и банкам.

Синергия цифровых технологий поможет объединить офлайн и онлайн, делая все устройства и сервисы взаимосвязанными между собой. Искусственный интеллект и большие данные помогают принимать более обоснованные решения, а VR и AR — проводить сложные операции, путешествовать и учиться в любой точке.

Такое будущее выглядит очень комфортным, но не для всех

Например, футуролог Герд Леонгард призывает обратить внимание на тотальную цифровизацию и ее возможные последствия. Например, полная замена реального общения цифровым или утрата человечности при принятии глобальных решений, которые мы все больше доверяем ИИ

Алиасинг

Aliasing

Цифровая обработка

  • точность, с которой указывается уровень сигнала, ограничена (причём достаточно сильно. 16 бит — это в 2 раза меньше, чем используется для стандартного числа с плавающей точкой);
  • у сигнала есть верхняя граница уровня, за которую он не может выйти.
  • уровень шумов дробления возрастает при увеличении громкости. Для малых изменений обычно это не очень критично, так как изначальный уровень шума значительно тише ощутимого, и его можно безопасно поднимать в 4-8 раз (например, применять эквалайзер с ограничением шкалы в ±12dB);
  • не стоит сначала сильно понижать уровень сигнала, а затем сильно его повышать — при этом могут появиться новые шумы дробления, которых изначально не было.

Фильтрация

BiquadFilterNodeбесконечной импульсной характеристикойВсе графики ниже отображают диапазон частот от 20 Гц до 20000 Гц. Горизонтальная ось отображает частоту, по ней применяется логарифмический масштаб, вертикальная — магнитуду (жёлтый график) от 0 до 2, или фазовый сдвиг (зелёный график) от -Pi до Pi. Частота всех фильтров (632 Гц) отмечена красной чертой на графике.

Общий вывод

Аналоговый звук – это то, что мы слышим и воспринимаем, как окружающий мир глазами. Цифровой звук, это набор координат, описывающих звуковую волну, и который мы напрямую услышать не можем без преобразования в аналоговый сигнал. Аналоговый сигнал, записанный напрямую на аудиокассету или винил нельзя без потери качества перезаписать, в то время как волну в цифровом представлении можно копировать бит в бит.

Цифровые форматы записи являются постоянным компромиссом между количеством точностью координат против объема файла и любой цифровой сигнал является лишь приближением к исходному аналоговому сигналу. Однако при этом разный уровень технологий записи и воспроизведения цифрового сигнала и хранения на носителях для аналогового сигнала дают больше преимуществ цифровому представлению сигнала, аналогично цифровой фотокамере против пленочного фотоаппарата.

Аналоговый сигнал — сигнал данных, у которого каждый из представляющих параметров описывается функцией времени и непрерывным множеством возможных значений.

Различают два пространства сигналов — пространство L (непрерывные сигналы), и пространство l (L малое) — пространство последовательностей. Пространство l (L малое) есть пространство коэффициентов Фурье (счетного набора чисел, определяющих непрерывную функцию на конечном интервале области определения), пространство L — есть пространство непрерывных по области определения (аналоговых) сигналов. При некоторых условиях, пространство L однозначно отображается в пространство l (например, первые две теоремы дискретизации Котельникова).

Аналоговые сигналы описываются непрерывными функциями времени, поэтому аналоговый сигнал иногда называют непрерывным сигналом. Аналоговым сигналам противопоставляются дискретные (квантованные, цифровые). Примеры непрерывных пространств и соответствующих физических величин:

  • прямая: электрическое напряжение

окружность: положение ротора, колеса, шестерни, стрелки аналоговых часов, или фаза несущего сигнала

отрезок: положение поршня, рычага управления, жидкостного термометра или электрический сигнал, ограниченный по амплитуде различные многомерные пространства: цвет, квадратурно-модулированный сигнал.

Свойства аналоговых сигналов в значительной мере являются противоположностью свойств квантованных или цифровых сигналов.

Отсутствие чётко отличимых друг от друга дискретных уровней сигнала приводит к невозможности применить для его описания понятие информации в том виде, как она понимается в цифровых технологиях. Содержащееся в одном отсчёте «количество информации» будет ограничено лишь динамическим диапазоном средства измерения.

Отсутствие избыточности. Из непрерывности пространства значений следует, что любая помеха, внесенная в сигнал, неотличима от самого сигнала и, следовательно, исходная амплитуда не может быть восстановлена. В действительности фильтрация возможна, например, частотными методами, если известна какая-либо дополнительная информация о свойствах этого сигнала (в частности, полоса частот).

Применение:

Аналоговые сигналы часто используют для представления непрерывно изменяющихся физических величин. Например, аналоговый электрический сигнал, снимаемый с термопары, несет информацию об изменении температуры, сигнал с микрофона — о быстрых изменениях давления в звуковой волне, и т.п.

Понравилась статья? Поделиться с друзьями:
Tehnik Shop
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: