WaveNet против говорящих голов

21.09.2016

Google, вернее его подразделение DeepMind, научило компьютер говорить голосом, неотличимым от настоящего человеческого.
Он (она, оно) может говорить любым голосом: мужским, женским, с разными обертонами, различным выражением, темпом, интонированием, на разных языках.
При этом может воспроизводить придыхание, причмокивание, придавая речи еще большую натуральность.
Сейчас Android и Siri «говорят» типичным компьютерным голосом (text-to-speech, TTS) со всеми присущими ему дефектами.
В одном случае, компиляционном (concatenative TTS), используются слова и фонемы, взятые из предварительно начитанных и записанных семплов. Их надо лишь умудриться более-менее плавно соединять.
Либо применяется параметрический способ (parametric TTS), когда вокодер синтезирует фонемы, из которых состоит проговариваемый текст.
Но результат в обоих случаях хилый.
Гугловская же система WaveNet работает несколько иначе. Сперва её нейронную сеть «натаскали», дав ей проанализировать массив разнообразной аудиоинформации. Затем дали для анализа записи, сделанные на двух языках: английском и китайском.
Ниже можно сравнить образцы, сделанные всеми тремя вышеописанными способами.

Parametric

Concatenative

WaveNet

Ниже два примера генерации речи без преобразованного осмысленного текста, то есть голая имитация. Там как раз хорошо слышны звуки вдоха и размыкания губ.


Дальше таким образом возможно создание уникального голоса или копирование голоса любого человека со всем присущим именно ему своеобразием. И пожалуйста — подсовываете машине текст и она произносит его нужным вам голосом со всеми модуляциями, интонированием, причмокиванием, прихлюпыванием, шепелявостью, картавостью и прочими узнаваемыми деталями.
Автоматически все аудиоматериалы вроде записи телефонных переговоров сразу становятся недействительными в суде или в качестве доказательных материалов.
Дикторов, «говорящие головы» с большим успехом заменят специально отшлифованные вкрадчивые или деловито отстраненные машинные «дикторы». А там и до кинематографа доберутся и примутся штамповать звезд-вокалистов с диапазоном в шесть октав, которые не «дают петуха» и никогда не поют мимо нот, не простужаются, не срывают голоса и не пьют горькую.
Словом, радужная, но при этом мрачная картина вырисовывается.
Такой вот парадокс.


Страшно далеки они от народа

14.09.2016

Всегда предполагал, что мои представления о жизни во многом расходятся с большой частью окружающего населения. Но никогда не переводил это расхождение в процентное соотношение. Сегодня пролистал тест на «Медузе», по итогам которого выяснилось, что расхождение с общепринятым мышлением в процентах даже неловко публиковать. Проездом с Марса.

Проездом с Марса


Об отходах коллективного разума

05.09.2016

Принято считать, что 10 000 обезьян за пишущими машинками рано или поздно напишут «Двенадцатую ночь». Или там, скажем, «Король Лир».
Так вот, ничего они не напишут, даже если специально соберутся и вместо машинок сядут за компьютеры.
Доказано опытом.
На сайте crowdsound.net 67 тысяч самопальных композиторов из 147 стран создали мелодию длиною в целых 350 нот.
И я вам скажу — лучше бы они этого не делали.
Унылая, скучная и абсолютно никакая мелодия.
Коллективный разум в очередной раз обделался жидким.
Мало того, этот разум намерен продолжить славную традицию марания штанов своим плодами.
Тем же способом теперь хотят приложить к мелодии подобающие вирши.
В то время, когда я туда заглядывал, было готово целых три слова первой строчки, потому о качестве поэтических результатов командной работы сказать ничего нельзя.
Но не сомневаюсь, что они будут настолько же бездарными и серыми, как и вышеупомянутая мелодия.
Принцип «одна голова хорошо, а сто лучше» в творческих вопросах не работает.
Тут неизбежно срабатывает усреднение, лучшим становится среднее арифметическое, устраивающее непритязательные вкусы большинства.
Всё, выходящее за рамки «температуры по больнице» автоматически уничтожается.
Как сказал американский ученый Роберт Виленски, «все мы слыхали про то, что миллион обезьян, стуча по клавишам миллиона пишущих машинок, могли бы написать полное собрание сочинений Шекспира. Благодаря Интернету мы знаем теперь, что это неправда».
Увы.

Отходы коллективного разума


А вам острые концы или тупые?

26.05.2016

В ЖЖ второй день идет шум по поводу обновления главной страницы и писькомерки.
Вот хорошо быть асоциальным олдфагом — на главной ни разу не был и не представляю для чего это нужно, дизайн жж лет десять не менял, и в ТОП ни разу не заглядывал.
Все нужные ленты читаю по RSS через inoreader и похрен эта жэжэжная движуха.
А в там всё по Свифту: шумит пламенный говнострач, во все стороны летят какашки, мат из тяжелых орудий очередями — тупокнечники воюют против остроконечников.
Чем бы дитяти ни тешились…

Остроконечники против тупоконечников


О законопослушных джеках-воробьях

28.03.2016

Законопослушная Flibusta
Все же хозяева Флибусты, странные ребята.
Правообладатели подают на них жалобы в роскомпозор, роскомпозор их блокирует по этим жалобам, а «флибустьеры» все так же смиренно и законопослушно продолжают прятать от выдачи книжки тех, кто их гнобит и заносит в списки экстремистских и запрещенных.
Будто такое поведение что-то изменит в отношении к ним властей и издателей.
Рутрекеру изъятие материалов из выдачи по жалобам правообладателей ничуть не помогло и Рутрекер поступил адекватно: как вы нам, так и мы вам, и разрешил все закрытые раздачи, и вообще положил на жалобщиков большой ржавый болт, что в такой ситуации совершенно справедливо.
Проблема не в том, чтобы зайти на Флибусту черз Tor с onion адреса, где ограничений на выдачу нет или воспользоваться появившимся в Telegram ботом @flibustamirrorbot.
Проблема, повторюсь, в нелогичном, странном в этой ситуации поведении «флибустьеров».
Это их дело, но когда бьют и харкают в лицо, правильнее было бы не вежливо утираться, а дать сдачи.
Тем более, что после ввода в действие бота Telegram и ответной реакции на это издателей и властей, ну совсем уже глупо расшаркиваться перед ними ножкой.

Flibusta bot


Простоплеер просто закрыли

10.03.2016

Простоплеер просто закрыли

Презрев исключительно мудрый для нашего государства совет профессора Преображенского, глянул перед сном заголовки своей новостной ленты, а там:

«Роскомнадзор объявил, что с 9 марта сайт для прослушивания музыки Pleer.com навсегда заблокирован в России. Ресурс заблокировали за размещение пиратских копий песен Дианы Арбениной.»

Иду на заблокированный pleer.com, и удалив издевательское «извинение» Роскомпозора, читаю:

… к сожалению, сегодня, как гром среди ясного неба, вопреки закону, без рассмотрения нашего обжалования, решение почему-то вступило в законную силу, и сайт был заблокирован.

Мы не получали никаких уведомлений. На сайте Мосгорсуда ещё несколько часов назад была информация о нашем обжаловании, но, вопреки здравому смыслу, история была переписана задним числом, и любое упоминание нашего обжалования удалено. Поэтому, к сожалению, у нас нет возможности рассказать вам про весь процесс от начала и до конца.
Вот ссылка с новой историей рассмотрения нашего дела А вот ссылка в кэше google с тем, как это было на самом деле

Почему так произошло и что с этим делать, мы не знаем. Наш юридический отдел никогда с таким беззаконием не сталкивался и находится сейчас в тупиковой ситуации.

То есть, фактически нас лишили возможности отстоять свою правоту в суде и заблокировали
RiP

Жаль, очень жаль. Удобный и хорошо работающий сервис.
Арбенина — сука.


Об оранжерее в серверной и прочих полезных советах

03.02.2016

Я же не просто так придумал «Сам себе философ» для младших школьников.
Количество фейковых, глупых, надуманных и просто идиотских советов, написанных строго по рецепту «сам себе философ», давно перевалило критическую точку.
Особенно раздражает, когда выкопанные из нафталина бабушкины предрассудки и рекомендации появляются в изданиях, позиционирующих себя, как честные и умные, по крайней мере, не нагло врущие.
Днями наткнулся на совет, ещё лет тридцать назад поросший седой бородой, мхом и плесенью; цитирую:
«Кактус (Cereus peruvianus) лучше других растений поглощает электромагнитное излучение компьютера.»
Тут все давит на доверие: и лексика, и учёного вида латинское название в скобках, и многообещающее «лучше других», будто кактус от фикуса в этом смысле отличается и поглощает что-нибудь кроме воды и углекислого газа.
В рекомендации устроить в серверной кактусовую оранжерею нет ничего особенно страшного, да и программисты с сисадминами в большинстве своём на такую ахинею не разведутся.
Но в этом и подобных ресурсах густо рассыпаны советы употреблять сомнительную фарму, пить горстями БАДы, жрать фуфломицины и просто откровенные яды, что уже никуда не годится.
Доверчивые читатели, не отягощённые знаниями, умением мыслить и анализировать информацию, верят этой бредятине и бросаются принимать скипидарные ванны, литрами пить кипячёное постное масло, доводить себя до анорексии по брэдду и шелтону и лечить ишемию с аритмией многокилометровыми пробежками.
Ещё подобные издания любят брать заезженные, набившие оскомину банальности и переписывать их «своими словами», выдавая за откровение.
Но необразованность и невнимание к терминам подводят даже в таком нехитром деле.
В одной из публикаций в список «любимых» мозгом вещей попали свобода и творчество, а в списке «нелюбимых» оказались стереотипы, что соответствует действительности с точностью до наоборот.
Да, мозгу полезно творчество, мышление, обучение, которые его развивают и тренируют, но он их не любит, а любит, напротив, всяческие стереотипы, шаблоны, рефлексы.
Он пытается ограничить и без того немалое энергопотребление, а потому предпочитает бездельничать, не напрягаться лишний раз и работать на рефлексах, оптимизируя затраты.
Вроде бы всего-то спутали слова «любит» и «полезно», но эта путаница меняет суть изложенного.
И такое гонево почти через публикацию.
Экзальтированной и скверно учившейся школоте, создающей подобные «полезные» рекомендации спустить бы штаны, задрать юбки и всыпать горячих, чтобы остудить воспалённую юношескую фантазию и приучить хотя бы иногда читать научно-популярные издания для альтернативно одарённых двоечников.

Не напрягаться!