我想用Python训练一个神经网络,它应该能够模仿给定的人的声音。我在Github上找到了本项目,这似乎对我的案子很有好处。唯一的问题是我想模仿的人是说日语的人。
我想知道是否有可能训练一个日本语音数据的模型,并让它以某种方式说英语。如果它是用错误的方式发音的话,老实说,这对我来说不应该是个问题。
如果你想知道哪个声音应该克隆。我想从动画中克隆Shiina Mashiro的声音"Sakurasou no pet na kanojo“。
有没有办法把佩林的声音融入我的“我的克隆人”?我尝试过许多不管用的东西。
下面是我的代码片段:
from ursina import *
from ursina.prefabs.first_person_controller import FirstPersonController
from ursina.shaders import camera_grayscale_shader
app = Ursina()
grass = 'textures/grass.jpg'
class Voxel(Button):
def __init__(self, position