技术很简单,渲染一个人的模型,不同动作和口型全部渲染出来,然后裁开。 读的时候,按照对应的台词拼接视频输出。 声音就更简单了。就现阶段来看,我以为是个机器,还不是人。但是,将来
技术很简单,渲染一个人的模型,不同动作和口型全部渲染出来,然后裁开。
读的时候,按照对应的台词拼接视频输出。
声音就更简单了。