Отключен JavaScript

У вас отключен JavaScript. Некоторые возможности системы не будут работать. Пожалуйста, включите JavaScript для получения доступа ко всем функциям.

Изменение голоса нейросетью

Автор Djin_Tolik, 18 апр 2025 00:49

озвучка нейронка программа изменение голоса виртуальный кабель

Авторизуйтесь для ответа в теме

Сообщений в теме: 6

#1 Djin_Tolik

Посетитель

Пользователи
46 сообщений

Пол:Мужчина
Город:Москва
Интересы:Пересматривать фильмы 30 летней давности

Отправлено 18 апреля 2025 - 00:49

Приветствую давно никто не делал топиков в данном разделе, обратил внимание что много всего нового нового придумали с последнего поста в данном разделе. ^{(целых 5 лет прошло)}

И я решил поднять такую тему как изменение голоса нейросетью. А точнее написать гайд.

Нейросети давно шагнули за пределы роботизированной озвучки. Может передавать эмоции, дефекты речи и тд. Благодаря данной теме вы все сами сможете попробовать и возможно взять на вооружение для озвучивания второстепенных персонажей.

Многие из вас видели фильм "Злостные гои: Окончательное решение" от Gottlieb Films, многим он пришелся не по вкусу мягко говоря но это были проблемы больше сюжетной линии, но в фильме есть 1 интересный момент человек озвучивает один, но если этого не знать выглядит как многоголосая озвучка. Давайте разберемся как это делается с технической стороны вопроса.

Я хочу говорит чужим голос что для этого надо?

Для этого вам потребуется 2 программы:

Программа для изменения голоса в потоке (нейросеть)
Виртуальный кабель

Программа для изменения голоса в потоке (нейросеть)

Где нам взять нейронку:

Заходим на страницу данной программы на GITHUB

Находим строчку:

Download from hugging face

Тыкаем в нее, и попадаем в архив с множеством версий.

Выбор версии зависит от личных предпочтений, и операционной версии компьютера.

Если в названии программы MAC это для макбуков, если WIN это для виндоус соответственно.

Далее в посте будет рассматриваться работа с версией для винды.

Скачиваем к примеру последнею версию на данный момент: MMVCServerSIO_win_onnxdirectML-cuda_v.1.5.3.15.zip (Для скачивания надо нажать логотип стрелочки направленой вниз правее от версии программы)

После скачивания разархивируем архив в папку предварительно созданную на компьютере. (в любом разделе диска)

После того как файлы окажутся в папке на ПК программу можно запустить:

Для этого среди файлов надо найти файл START_HTTP.BAD (не путаем с START_HTTPS.BAD) Запускаем.

Для удобство дальнейшего использования можно создать ярлык данного файла на рабочий стол.

При запуске программы откроется окно с Командной строкой винды. Его закрывать нельзя на протяжении всего времени использования программы, но можно сворачивать.

После прогрузки команд откроется сама программа.

В программе по умолчанию будут Японские голосовые модели, они едва ли подходят для Русского и других западных голосов. (Их можно удалить)

Нам нужны Русские голосовые модели.

Где взять голоса?

Мы их или сами создаем, или ищем в интернете.

Так как создание голосовой модели трудоемкий процесс и можно написать еще один пост на данную тему, мы этот вопрос пока что опустим и будем рассматривать вариант с использованием готовых голосовых моделей.

Готовые голосовые модели можно взять с телеграмм канала АРБУЗИК

Выбираем подходящею нам голосовую модель (в комментариях к файлам есть итоговый пример голоса) и скачиваем 2 файла формата: .pth .intex

Сохраняем в удобное для себя на компьютере место рядом с папкой программы, или создаем папку в корневой папке программы но за стабильность работы я не могу ручаться, ибо так не пробовал.

Виртуальный аудиокабель:

Заходим на сайт VB-AUDIO

На главной скачиваем версию для своей операционной системы (доступно WIN и MAC)

Скачивается в виде архива .zip

Так же разархивируем его в удобное для вас место

Среди скачанных файлов ищем VBCABLE_Setup_x64 и запускаем его через правую кнопку мыши от имени администратора.

В открывшимся окне нажимаем кнопку установки.

После установки необходимо перезапустить компьютер.

После перезагрузки в строке Пуск где у вас отображаются системные значки. Необходимо выбрать: значок наушников или колонки правой кнопкой мыши и в сплывшем окне выбрать пункт: Звуки

В открывшемся окне необходимо выбрать вкладку Воспроизведение

Среди доступных устройств для воспроизведения звука у вас появиться новое устройство CABLE imput которое будет использоваться по умолчанию для воспроизведения.(компьютер не будет воспроизводить звук)

Необходимо выбрать свое устройство для воспроизведения звука и назначить его кнопкой "По умолчанию" как основное.

Теперь все необходимое для работы с программой есть.

Работа с нейронкой:

Необходимо запустить нейронку через ранее созданный ярлык на рабочем столе, или в корневой папке.

После запуска программы для добавления скачанных голосов (мы их в посте качали с ТГ АРБУЗИК)

Нажимаем кнопку edit находиться в верхнем блоке "шапке программы" в правом нижнем углу.

Выбираем свободный слот где нет голосовой модели (если вы не удаляли японские голоса некоторые слоты будут заняты)

В свободном слоте нажимаем на кнопку upload

В открывшемся окне в строке VoiceChangerType должен быть выбран пункт RVC

В строку Model загружаем файл .pth от голосовой модели

В строку intex загружаем файл .intex от ЭТОЙ ЖЕ голосовой модели

Далее после заполнения всех полей появиться кнопка upload нажимаем на нее.

Закрываем окно Edit.

Голосовая модель появиться в "шапке программы" с синей подложкой.

Нажимаем на голосовую модель.

С "шапки программы" спускаемся и далее работаем в основном окне программы.

С личного опыта советую поставить в строке F0 Det.: параметр crepe_tiny

В параметре CHUNK: выбираем задержку записи (чем мощнее компьютер тем меньший параметр задержки можем поставить) К примеру если видеокарта мощнее GTX1050 можно ставить задержку от 320.

Чем меньше задержка тем быстрее будет обрабатываться голос и выходить на воспроизводящие устройство.

В параметре EXSTRA ставим 16384

В параметре imput выбираем свой микрофон в который вы говорите.

В параметре output выбираем виртуальный кабель CABLE imput

В параметре monitor выбираем свои наушники если хотите себя слышать и знать когда нейросеть проговорила все что вы сказали, работает с задержкой в соответствии с параметром который вы задавали в CHUNK.

Можно использовать голосовую модель!

Нажимаем кнопку START

рядом с иконкой голосовой модели есть окно статистики, после нажатия старт ждем пока параметр RES упадет до 130-300MS это задержка если больше то голосовая модель еще загружается или ей мешают сторонние программы.

Говорим микрофон и слушаем свой голос с помощью наушников которые добавлены в параметр monitor.

Настраиваем голос до приемлемых для себя параметров с помощью ползунков GIAN TUNE INTEX все настройки будут строго индивидуально, так как голоса у всех разные.

Добиваемся похожести голоса согласно параметрам исходного голоса модели.

Женским голосовым моделям мужчинам все равно придеться чуть подыгрывать.

Использование в озвучке фильмов, и тд.

При запущенной нейронке с выставлеными параметрами и нажатой кнопки start открываете свою программу для записи голоса, или как вы там озвучиваете все по разному.

Находите через что захватывать голос и выбираете там CABLE imput и программа будет записывать голос из нейронки (не забывайте про задержку)

Что вы вернуться к своему голосу в окне захвата голоса выбираете свой микрофон. Программу закрывать не обязательно. Можно менять голос не выходя из нейронки и программы в которой вы работаете.

Нейронка сохранит ваши эмоции, дефекты речи и тд. Результат может выглядеть очень убедительным.

Ссылка которая может пригодиться для визуального ознакомления с программой и демонстрацией использования (видеогайд):
Смотреть на YouTube

Всем удачи в экспериментах!

Обратная связь VK

Наверх

#2 genetret

Автор гневных пасквилей

Модераторы
3 269 сообщений

Пол:Мужчина
Город:Обран Ош
Интересы:Гандонить сайт гандонов

Отправлено 18 апреля 2025 - 09:12

Ну и дроч. Проще своим голосом озвучить (или гестов привлечь на крайняк). Хотя, всё равно всё зависит от качества записи - какое-нибудь хуйло с пердящим микрофоном конфетку не сделает, даже если настроит софтварь как надо. А так, круто, что есть кому и чем тему оживлять.

Но я должен отметить, что даже у Готтлиба хромала озвучка - наиболее примечательна в этом плане Лея, голос бабки получился совсем никакущим.

Наверх

#3 PortWeinShow

Новичок

Пользователи
6 сообщений

Пол:Мужчина

Отправлено 18 апреля 2025 - 18:30

Очень полезная информация! Сам планирую этим заняться уже давно (если бы не определëнные обстоятельства). Интересует один вопрос: а можно ли заранее записать свои реплики, и уже готовые аудиофайлы прогнать через нейросети, и насколько это проще/сложнее данного способа?

Наверх

#4 PortWeinShow

Новичок

Пользователи
6 сообщений

Пол:Мужчина

Отправлено 18 апреля 2025 - 19:18

Кстати, насчëт голосовых моделей. Нерусские использовать можно, но из-за фонетических особенностей первоисточников голосовых моделей - на выходе будут фразы с typical American accent (если модель, например, американская). Это можно даже намеренно использовать для создания определëнного эффекта. А насчëт озвучки женским голосом, будучи мужиком - там вроде как ещë желательно тональность повышать.
Пример использования американских голосовых моделей: https://youtu.be/_1b...InrfHRIALwIBrLL
Там заметен американский акцент, так как были использованы оригинальные голоса
Ну и пример русских моделей: https://youtu.be/Y_R...RawQrmGfLBZFRuE
Выглядит очень убедительно, как будто это реально реплики из "Счастливы Вместе"

Сообщение отредактировал PortWeinShow: 18 апреля 2025 - 19:23

Наверх

#5 Djin_Tolik

Посетитель

Пользователи
46 сообщений

Пол:Мужчина
Город:Москва
Интересы:Пересматривать фильмы 30 летней давности

Отправлено 18 апреля 2025 - 19:53

Ну и дроч. Проще своим голосом озвучить (или гестов привлечь на крайняк). Хотя, всё равно всё зависит от качества записи - какое-нибудь хуйло с пердящим микрофоном конфетку не сделает, даже если настроит софтварь как надо. А так, круто, что есть кому и чем тему оживлять.

Но я должен отметить, что даже у Готтлиба хромала озвучка - наиболее примечательна в этом плане Лея, голос бабки получился совсем никакущим.

ну по опыту использования могу сказать что не такая уж и запара, по сути пару вечеров посидеть все настроить под себя, все крутилки покрутить для хорошего результата.

Если у леи был голос бабки то это он так настройки настроил, скорее всего женского голоса не слышал никогда.

Софт нормально не оформлен потому что программа Японская, а там, и не только там есть закон о запрещении производства, и использования программ схожего функционала дипфейки и тд.

Поэтому не программа, а какая то дрочилка через командную строку которой не суждено стать нормальной программой в широком смысле этого слова.

Очень полезная информация! Сам планирую этим заняться уже давно (если бы не определëнные обстоятельства). Интересует один вопрос: а можно ли заранее записать свои реплики, и уже готовые аудиофайлы прогнать через нейросети, и насколько это проще/сложнее данного способа?

Можно записать, и прогнать уже готовые аудиофайлы но не без НО.

Не в этом софте.

А ничего конкурентноспособного больше и нет по сути. везде получается полу робот полу хрен пойми.

И этот процесс будет тяжелее- Представь записываешь голос\ сохраняешь\ открываешь программу\ загружаешь запись\ ждешь обработки\ сохраняешь\ выгружаешь\ добавляешь в проект.

Или процесс потокового изменения голоса: открыл программу\ открыл свой редактор видео\ нажал на кнопку захват через микрофон- пишешь своим\ нажал через CABLE imput пишешь голос нейронки.

Кстати, насчëт голосовых моделей. Нерусские использовать можно, но из-за фонетических особенностей первоисточников голосовых моделей - на выходе будут фразы с typical American accent (если модель, например, американская). Это можно даже намеренно использовать для создания определëнного эффекта. А насчëт озвучки женским голосом, будучи мужиком - там вроде как ещë желательно тональность повышать.
Пример использования американских голосовых моделей: https://youtu.be/_1b...InrfHRIALwIBrLL
Там заметен американский акцент, так как были использованы оригинальные голоса
Ну и пример русских моделей: https://youtu.be/Y_R...RawQrmGfLBZFRuE
Выглядит очень убедительно, как будто это реально реплики из "Счастливы Вместе"

Конечно не русские можно использовать для создания акцента и тд. тут мы только ограничены полетом фантазии

Что касаемо женской озвучки- то у меня есть фильм я его пока не выкладывал у меня жена озвучила 2\3 фильма но далее не смогла помогать. и я отсканировал ее голос и добил сам.

Кота в мешке даже ganetret не заметил)

Обратная связь VK

Наверх

#6 genetret

Автор гневных пасквилей

Модераторы
3 269 сообщений

Пол:Мужчина
Город:Обран Ош
Интересы:Гандонить сайт гандонов

Отправлено 19 апреля 2025 - 01:05

Что касаемо женской озвучки- то у меня есть фильм я его пока не выкладывал у меня жена озвучила 2\3 фильма но далее не смогла помогать. и я отсканировал ее голос и добил сам.
Кота в мешке даже ganetret не заметил)

Хех. Ну ты и кадр. Решил жену свою на бездушную машину поменять, робосексуал несчастный? А она хоть в курсе, или ты решил изменить у неё за спиной?

Сообщение отредактировал genetret: 19 апреля 2025 - 01:11

Наверх

#7 Djin_Tolik

Посетитель

Пользователи
46 сообщений

Пол:Мужчина
Город:Москва
Интересы:Пересматривать фильмы 30 летней давности

Отправлено 19 апреля 2025 - 01:34

Что касаемо женской озвучки- то у меня есть фильм я его пока не выкладывал у меня жена озвучила 2\3 фильма но далее не смогла помогать. и я отсканировал ее голос и добил сам.
Кота в мешке даже ganetret не заметил)

Хех. Ну ты и кадр. Решил жену свою на бездушную машину поменять, робосексуал несчастный? А она хоть в курсе, или ты решил изменить у неё за спиной?

Да там минуток 8-10, не получилось у нее, и в браке иногда передернуть надо )))

Обратная связь VK

Наверх

Обратно в Озвучка и обработка звука

Темы с аналогичным тегами озвучка, нейронка, программа, изменение голоса, виртуальный кабель

Альянс → Технические вопросы → Озвучка и обработка звука → Оцените озвучку Автор vitok, 29 июн 2020 озвучка	5 Ответов 1 516 Просмотров	Jimmy J. 03 июл 2020
Альянс → Прихожая → оно 2 (озвучка ебало с мячёом) Автор RFK, 18 мар 2020 озвучка, оно-2, ужасы, глядим и 1 еще... 1 2	34 Ответов 4 546 Просмотров	Гость_Иримпия_* 25 июн 2025
Альянс → Прихожая → Помощь с озвучкой Автор Гость_Paul_* , 29 мая 2018 озвучка, помощь 1 2 3 5 →	92 Ответов 8 733 Просмотров	Bad Pupsic 08 июл 2018
Другие студии → Прочие студии → Foka — «Зелёный» Автор Foka, 01 окт 2015 Озвучка, перевод, Шрек 1 2	26 Ответов 5 744 Просмотров	Foka 03 окт 2015

Количество пользователей, читающих эту тему: 0

0 пользователей, 0 гостей, 0 скрытых пользователей

Изменение голоса нейросетью

Темы с аналогичным тегами озвучка, нейронка, программа, изменение голоса, виртуальный кабель

Количество пользователей, читающих эту тему: 0

Войти