Перейти к содержимому


Фотография

Изменение голоса нейросетью

озвучка нейронка программа изменение голоса виртуальный кабель

  • Авторизуйтесь для ответа в теме
Сообщений в теме: 6

#1 Djin_Tolik

Djin_Tolik

    Посетитель

  • Пользователи
  • PipPipPipPip
  • 29 сообщений
  • Пол:Мужчина
  • Город:Москва
  • Интересы:Пересматривать фильмы 30 летней давности

Отправлено 18 апреля 2025 - 00:49

Приветствую давно никто не делал топиков в данном разделе, обратил внимание что много всего нового нового придумали с последнего поста в данном разделе. (целых 5 лет прошло)

И я решил поднять такую тему как изменение голоса нейросетью. А точнее написать гайд.

 

Нейросети давно шагнули за пределы роботизированной озвучки. Может передавать эмоции, дефекты речи и тд. Благодаря данной теме вы все сами сможете попробовать и возможно взять на вооружение для озвучивания второстепенных персонажей.

 

Многие из вас видели фильм "Злостные гои: Окончательное решение"  от Gottlieb Films, многим он пришелся не по вкусу мягко говоря но это были проблемы больше сюжетной линии, но в фильме есть 1 интересный момент человек озвучивает один, но если этого не знать выглядит как многоголосая озвучка. Давайте разберемся как это делается с технической стороны вопроса.

 

 Я хочу говорит чужим голос что для этого надо?

 

Для этого вам потребуется 2 программы:

  1.  Программа для изменения голоса в потоке (нейросеть)
  2.  Виртуальный кабель 

 

Программа для изменения голоса в потоке (нейросеть)

Где нам взять нейронку:

Заходим на страницу данной программы на GITHUB

Находим строчку:

Тыкаем в нее, и попадаем в архив с множеством версий.

Выбор версии зависит от личных предпочтений, и операционной версии компьютера.

Если в названии программы MAC это для макбуков, если WIN это для виндоус соответственно.

Далее в посте будет рассматриваться работа с версией для винды.

Скачиваем к примеру последнею версию на данный момент: MMVCServerSIO_win_onnxdirectML-cuda_v.1.5.3.15.zip (Для скачивания надо нажать логотип стрелочки направленой вниз правее от версии программы)

После скачивания разархивируем архив в папку предварительно созданную на компьютере. (в любом разделе диска)

 

После того как файлы окажутся в папке на ПК программу можно запустить:

Для этого среди файлов надо найти файл START_HTTP.BAD (не путаем с START_HTTPS.BAD) Запускаем.

Для удобство дальнейшего использования можно создать ярлык данного файла на рабочий стол.

 

При запуске программы откроется окно с Командной строкой винды. Его закрывать нельзя на протяжении всего времени использования программы, но можно сворачивать.

После прогрузки команд откроется сама программа.

В программе по умолчанию будут Японские голосовые модели, они едва ли подходят для Русского и других западных голосов. (Их можно удалить)

Нам нужны Русские голосовые модели.

 

Где взять голоса?

Мы их или сами создаем, или ищем в интернете.

Так как создание голосовой модели трудоемкий процесс и можно написать еще один пост на данную тему, мы этот вопрос пока что опустим и будем рассматривать вариант с использованием готовых голосовых моделей.

Готовые голосовые модели можно взять с телеграмм канала АРБУЗИК

Выбираем подходящею нам голосовую модель (в комментариях к файлам есть итоговый пример голоса) и скачиваем 2 файла формата: .pth .intex

Сохраняем в удобное для себя на компьютере место рядом с папкой программы, или создаем папку в корневой папке программы но за стабильность работы я не могу ручаться, ибо так не пробовал.

 

Виртуальный аудиокабель:

Заходим на сайт VB-AUDIO

На главной скачиваем версию для своей операционной системы (доступно WIN и MAC)

Скачивается в виде архива .zip 

Так же разархивируем его в удобное для вас место

Среди скачанных файлов ищем VBCABLE_Setup_x64 и запускаем его через правую кнопку мыши от имени администратора.

В открывшимся окне нажимаем кнопку установки.

После установки необходимо перезапустить компьютер.

После перезагрузки в строке Пуск где у вас отображаются системные значки. Необходимо выбрать: значок наушников или колонки правой кнопкой мыши и в сплывшем окне выбрать пункт: Звуки

В открывшемся окне необходимо выбрать вкладку Воспроизведение

 

Среди доступных устройств для воспроизведения звука у вас появиться новое устройство CABLE imput которое будет использоваться по умолчанию для воспроизведения.(компьютер не будет воспроизводить звук)

Необходимо выбрать свое устройство для воспроизведения звука и назначить его кнопкой "По умолчанию" как основное.

 

Теперь все необходимое для работы с программой есть.

Работа с нейронкой:

Необходимо запустить нейронку через ранее созданный ярлык на рабочем столе, или в корневой папке.

После запуска программы для добавления скачанных голосов (мы их в посте качали с ТГ АРБУЗИК)

Нажимаем кнопку edit находиться в верхнем блоке "шапке программы" в правом нижнем углу.

Выбираем свободный слот где нет голосовой модели (если вы не удаляли японские голоса некоторые слоты будут заняты)

В свободном слоте нажимаем на кнопку upload

В открывшемся окне в строке VoiceChangerType должен быть выбран пункт RVC

В строку Model загружаем файл .pth от голосовой модели

В строку intex загружаем файл .intex от ЭТОЙ ЖЕ голосовой модели

Далее после заполнения всех полей появиться кнопка upload нажимаем на нее.

Закрываем окно Edit.

Голосовая модель появиться в "шапке программы" с синей подложкой.

Нажимаем на голосовую модель.

С "шапки программы" спускаемся и далее работаем в основном окне программы.

С личного опыта советую поставить в строке F0 Det.: параметр crepe_tiny

В параметре CHUNK: выбираем задержку записи (чем мощнее компьютер тем меньший параметр задержки можем поставить) К примеру если видеокарта мощнее GTX1050 можно ставить задержку от 320.

Чем меньше задержка тем быстрее будет обрабатываться голос и выходить на воспроизводящие устройство.

В параметре EXSTRA ставим 16384

В параметре imput выбираем свой микрофон в который вы говорите.

В параметре output выбираем виртуальный кабель CABLE imput

В параметре monitor выбираем свои наушники если хотите себя слышать и знать когда нейросеть проговорила все что вы сказали, работает с задержкой в соответствии с параметром который вы задавали в CHUNK.

 

Можно использовать голосовую модель!

Нажимаем кнопку START

рядом с иконкой голосовой модели есть окно статистики, после нажатия старт ждем пока параметр RES упадет до 130-300MS  это задержка если больше то голосовая модель еще загружается или ей мешают сторонние программы.

Говорим микрофон и слушаем свой голос с помощью наушников которые добавлены в параметр monitor.

Настраиваем голос до приемлемых для себя параметров с помощью ползунков GIAN TUNE INTEX все настройки будут строго индивидуально, так как голоса у всех разные.

Добиваемся похожести голоса согласно параметрам исходного голоса модели.

Женским голосовым моделям мужчинам все равно придеться чуть подыгрывать.

 

Использование в озвучке фильмов, и тд.

При запущенной нейронке с выставлеными параметрами и нажатой кнопки start открываете свою программу для записи голоса, или как вы там озвучиваете все по разному.

Находите через что захватывать голос и выбираете там CABLE imput и программа будет записывать голос из нейронки (не забывайте про задержку)

Что вы вернуться к своему голосу в окне захвата голоса выбираете свой микрофон. Программу закрывать не обязательно. Можно менять голос не выходя из нейронки и программы в которой вы работаете.

Нейронка сохранит ваши эмоции, дефекты речи и тд. Результат может выглядеть очень убедительным.

 

 

 

Ссылка которая может пригодиться для визуального ознакомления с программой и демонстрацией использования (видеогайд): 
Смотреть на YouTube

Всем удачи в экспериментах!

 

 

 

 

 



#2 genetret

genetret

    Автор гневных пасквилей

  • Модераторы
  • PipPipPipPipPipPipPipPipPip
  • 3 248 сообщений
  • Пол:Мужчина
  • Город:Обран Ош
  • Интересы:Гандонить сайт гандонов

Отправлено 18 апреля 2025 - 09:12

Ну и дроч. Проще своим голосом озвучить (или гестов привлечь на крайняк). Хотя, всё равно всё зависит от качества записи - какое-нибудь хуйло с пердящим микрофоном конфетку не сделает, даже если настроит софтварь как надо. А так, круто, что есть кому и чем тему оживлять.

 

Но я должен отметить, что даже у Готтлиба хромала озвучка - наиболее примечательна в этом плане Лея, голос бабки получился совсем никакущим.



#3 PortWeinShow

PortWeinShow

    Новичок

  • Пользователи
  • PipPipPip
  • 6 сообщений
  • Пол:Мужчина

Отправлено 18 апреля 2025 - 18:30

Очень полезная информация! Сам планирую этим заняться уже давно (если бы не определëнные обстоятельства). Интересует один вопрос: а можно ли заранее записать свои реплики, и уже готовые аудиофайлы прогнать через нейросети, и насколько это проще/сложнее данного способа?

#4 PortWeinShow

PortWeinShow

    Новичок

  • Пользователи
  • PipPipPip
  • 6 сообщений
  • Пол:Мужчина

Отправлено 18 апреля 2025 - 19:18

Кстати, насчëт голосовых моделей. Нерусские использовать можно, но из-за фонетических особенностей первоисточников голосовых моделей - на выходе будут фразы с typical American accent (если модель, например, американская). Это можно даже намеренно использовать для создания определëнного эффекта. А насчëт озвучки женским голосом, будучи мужиком - там вроде как ещë желательно тональность повышать.
Пример использования американских голосовых моделей: https://youtu.be/_1b...InrfHRIALwIBrLL
Там заметен американский акцент, так как были использованы оригинальные голоса
Ну и пример русских моделей: https://youtu.be/Y_R...RawQrmGfLBZFRuE
Выглядит очень убедительно, как будто это реально реплики из "Счастливы Вместе"

Сообщение отредактировал PortWeinShow: 18 апреля 2025 - 19:23


#5 Djin_Tolik

Djin_Tolik

    Посетитель

  • Пользователи
  • PipPipPipPip
  • 29 сообщений
  • Пол:Мужчина
  • Город:Москва
  • Интересы:Пересматривать фильмы 30 летней давности

Отправлено 18 апреля 2025 - 19:53

Ну и дроч. Проще своим голосом озвучить (или гестов привлечь на крайняк). Хотя, всё равно всё зависит от качества записи - какое-нибудь хуйло с пердящим микрофоном конфетку не сделает, даже если настроит софтварь как надо. А так, круто, что есть кому и чем тему оживлять.

 

Но я должен отметить, что даже у Готтлиба хромала озвучка - наиболее примечательна в этом плане Лея, голос бабки получился совсем никакущим.

ну по опыту использования могу сказать что не такая уж и запара, по сути пару вечеров посидеть все настроить под себя, все крутилки покрутить для хорошего результата.

Если у леи был голос бабки то это он так настройки настроил, скорее всего женского голоса не слышал никогда. 

Софт нормально не оформлен потому что программа Японская, а там, и не только там есть закон о запрещении производства, и использования программ схожего функционала дипфейки и тд.

Поэтому не программа, а какая то дрочилка через командную строку которой не суждено стать нормальной программой в широком смысле этого слова.

 

 

Очень полезная информация! Сам планирую этим заняться уже давно (если бы не определëнные обстоятельства). Интересует один вопрос: а можно ли заранее записать свои реплики, и уже готовые аудиофайлы прогнать через нейросети, и насколько это проще/сложнее данного способа?

 

Можно записать, и прогнать уже готовые аудиофайлы  но не без НО.

Не в этом софте.

А ничего конкурентноспособного больше и нет по сути. везде получается полу робот полу хрен пойми.

И этот процесс будет тяжелее- Представь записываешь голос\ сохраняешь\ открываешь программу\ загружаешь запись\ ждешь обработки\ сохраняешь\ выгружаешь\ добавляешь в проект.

Или процесс потокового изменения голоса: открыл программу\ открыл свой редактор видео\ нажал на кнопку захват через микрофон- пишешь своим\ нажал через CABLE imput пишешь голос нейронки.

 

Кстати, насчëт голосовых моделей. Нерусские использовать можно, но из-за фонетических особенностей первоисточников голосовых моделей - на выходе будут фразы с typical American accent (если модель, например, американская). Это можно даже намеренно использовать для создания определëнного эффекта. А насчëт озвучки женским голосом, будучи мужиком - там вроде как ещë желательно тональность повышать.
Пример использования американских голосовых моделей: https://youtu.be/_1b...InrfHRIALwIBrLL
Там заметен американский акцент, так как были использованы оригинальные голоса
Ну и пример русских моделей: https://youtu.be/Y_R...RawQrmGfLBZFRuE
Выглядит очень убедительно, как будто это реально реплики из "Счастливы Вместе"

 

Конечно не русские можно использовать для создания акцента и тд. тут мы только ограничены полетом фантазии 

Что касаемо женской озвучки- то у меня есть фильм я его пока не выкладывал у меня жена озвучила 2\3 фильма но далее не смогла помогать. и я отсканировал ее голос и добил сам.

Кота в мешке даже ganetret не заметил)



#6 genetret

genetret

    Автор гневных пасквилей

  • Модераторы
  • PipPipPipPipPipPipPipPipPip
  • 3 248 сообщений
  • Пол:Мужчина
  • Город:Обран Ош
  • Интересы:Гандонить сайт гандонов

Отправлено 19 апреля 2025 - 01:05

Что касаемо женской озвучки- то у меня есть фильм я его пока не выкладывал у меня жена озвучила 2\3 фильма но далее не смогла помогать. и я отсканировал ее голос и добил сам.
Кота в мешке даже ganetret не заметил)

Хех. Ну ты и кадр. Решил жену свою на бездушную машину поменять, робосексуал несчастный? А она хоть в курсе, или ты решил изменить у неё за спиной?

Сообщение отредактировал genetret: 19 апреля 2025 - 01:11


#7 Djin_Tolik

Djin_Tolik

    Посетитель

  • Пользователи
  • PipPipPipPip
  • 29 сообщений
  • Пол:Мужчина
  • Город:Москва
  • Интересы:Пересматривать фильмы 30 летней давности

Отправлено 19 апреля 2025 - 01:34

 

Что касаемо женской озвучки- то у меня есть фильм я его пока не выкладывал у меня жена озвучила 2\3 фильма но далее не смогла помогать. и я отсканировал ее голос и добил сам.
Кота в мешке даже ganetret не заметил)

Хех. Ну ты и кадр. Решил жену свою на бездушную машину поменять, робосексуал несчастный? А она хоть в курсе, или ты решил изменить у неё за спиной?

 

Да там минуток 8-10, не получилось у нее, и в браке иногда передернуть надо )))





Темы с аналогичным тегами озвучка, нейронка, программа, изменение голоса, виртуальный кабель

Количество пользователей, читающих эту тему: 1

0 пользователей, 1 гостей, 0 скрытых пользователей