Ditto-Talkinghead:阿里巴巴数字人技术新突破 🗣️

.

阿里巴巴推出了一项新的数字人技术,名为 Ditto-Talkinghead。这项技术主要用于生成由音频驱动的说话头,也就是我们常说的“数字人”。不过,现有的基于扩散模型的同类技术存在一些问题,例如:

  • • ⏱️ 推理速度慢:难以满足需要即时响应的互动应用场景。
  • • 🎛️ 控制性不足:对面部动作的精细控制还不够到位。
  • • 👁️ 视觉伪影:有时会产生不自然的视觉效果,影响观看体验。

这些问题很大程度上是由于依赖变分自编码器(VAE)产生的隐式潜在空间造成的。

.

Ditto-Talkinghead 的主要优势 ✨

Ditto-Talkinghead 在以下几个方面表现出色:

  • • ⚡ 实时性:经过优化,可以实现接近实时的生成速度。
  • • 🕹️ 高控制性:能够精确控制面部动作,例如表情、头部姿态和视线方向。
  • • 🖼️ 高质量:生成的说话头视频效果逼真,唇形与语音同步准确,表情和头部运动自然流畅。
  • • 🤸 灵活性:仅需一张静态图像,即可生成动态的说话头视频。

快速上手指南 🚀

为了方便大家体验,我们已经将这个 AI 工具打包成了一个本地一键启动包。你只需要简单几步操作,就可以在自己的电脑上使用,无需担心隐私泄露或者复杂的环境配置问题。

🖥️ 电脑配置要求

  • • 操作系统:Windows 10/11 64位
  • • 显卡:8G 显存以上的英伟达显卡
  • • CUDA 版本:>= 12.1

⬇️ 下载和使用教程

  1. 1. 下载压缩包
    下载地址:https://hbqihe.cn/152/
  2. 2. 解压文件
    将下载的压缩包解压到电脑上,注意解压路径最好不要包含非英文字符。然后,双击 “run.exe” 文件运行。

  3. 3. 浏览器访问
    程序会自动打开你的默认浏览器,显示如下界面:

声明:本站所有软件、课程、素材等资源全部来源于互联网,赞助VIP仅用于对本站服务器带宽及网站运营等费用支出做支持,从本站下载资源,说明你已同意本条款。如若本站内容侵犯了原著者的合法权益,请携带版权证明与我们联系,我们会及时处理。