虚拟数字人从技术层面理解,是通过计算机图形学、深度学习、语音合成技术、动作捕捉、图形渲染等技术手段聚合合成,具有“人”外观、行为甚至思想的可交互虚拟形态。
【资料图】
数字人分类:
01
—
3D数字人制作标准
3D数字人的制作标准从影响产品力的两大核心指标进行评估:美术评估和技术评估。
美术评估 指标从 角色造型辨识度 (外貌、性格、背景)、 模型精度与骨骼绑定 (模型精度、动作流畅度)、 不同场景适配度 (使用场景、道具互动)三个维度出发,将虚拟数字人的设定元素细化到世界观构建、口头禅、招牌动作等的设计上;考察手发质感、布料质感肢体动作及微表情的精度与流畅度,同时还结合虚拟数字人与场景、道具的互动反馈。
技术评估 指标从 语音合成效果 (清晰度、辨析度、自然度)、 内容生成效能 (覆盖领域广、生成速度快、内容精度高)、 渲染能力 (面部渲染技术、骨骼渲染技术、皮肤毛发渲染技术、服饰渲染技术)、 角色生成效能 (图像质量、生成效率、适用性)、 交互能力 (人机交互、环境交互)等五个维度进行考察,一方面包括了虚拟数字人制作相关的语音、图像、渲染技术,另一方面包括了虚拟数字人运营相关的内容生成、交互技术等。同时从技术的复杂度、效果度、智能度将指标细化,将虚拟数字人进行分级评估。
根据指标维度,将技术分为 L1-L5 五级、美术分为 A1-A5 五级。 虚拟数字人是美术与技术的集合体,两者缺一不可,技术和美术双指标结合评估可以更完整地评估虚拟数字人的产品力。
02
—
2D数字人制作标准
2D数字人的制作标准从影响产品力性能和用户体验的几个关键指标进行评估。
唇形驱动效果: 可以从同步性、准确性、自然性等方面来衡量2D数字人唇形驱动的效果。
同步性 :数字人的唇形动画与语音的同步性,如果同步性好,数字人的唇形运动将与发音时间对齐,给用户带来更真实的体验。
准确性: 数字人的嘴唇运动与实际发音的准确性,包括观察数字人的嘴唇变化是否正确反应了所发出的音素。
自然性: 数字人的唇形驱动是否与现实生活中的人类相似。可以通过观察嘴唇的运动速度、平滑度和过度来进行评估。过于生硬或不自然的嘴唇运动会让观众感到不适。
表情和肢体语言: 除了唇形驱动外,数字人的表情和肢体语言也对整体效果产生影响。表情和肢体语言应与语音信号相协调,以增强沟通效果和真实感。
运动平滑度: 衡量数字人嘴唇运动的平滑程度。通过计算嘴唇运动速度或加速度的变化来实现,得到一个运动平滑度。
唇形相似度: 通过比较数字人嘴型与实际发音者的嘴型之间的相似程度,得出一个数值。可以通过计算嘴唇轮廓之间的距离或相关性来实现。
主观评估: 让不同类型的用户观看并评价数字人的唇形驱动效果。用户可以根据同步性、准确性和自然性等因素进行评价,通过调查问卷、评分、用户反馈等方法来收集,从而衡量整体效果。
为了全面评估数字人产品的性能和用户体验,需要收集和分析这些关键指标。这些数据可以指导产品的优化和改进,以满足用户需求和提高整体体验。