近日,哔哩哔哩(B 站)正式推出了自研的 “AI 原声翻译功能”。这项功能可谓技术感满满,它借助先进的语音生成与视频重构技术,能精准还原 UP 主那独特的声线、音色以及气口,同时还能让翻译后的语言与口型自然同步,给游戏、科技、二次元等核心内容的跨语言传播带来了全新的解决方案。
与传统机器翻译的生硬感不同,B 站的 AI 原声翻译优势就在于能实现 “原汁原味” 的本地化处理。其核心技术依托于内部研发的语音生成模型,通过创新的语音时长及情感控制方法,不仅能精确调控语音节奏,还能将情感表达与说话人身份特征分离开来。如此一来,翻译后的语音既能保留 UP 主的个人风格,又能贴合目标语言的韵律习惯。
在口型同步和字幕处理方面,B 站技术团队运用先进的智能视频处理技术,精准地擦除原字幕区域,并进行高还原度的重绘,让翻译后的口型与语音内容完美契合。针对游戏术语、二次元梗点这类翻译难题,该功能引入了深度挖掘技术,结合基于大语言模型构建的翻译引擎,把专有名词与文化梗的翻译准确率提升到了 90%,有效地解决了跨文化传播中容易出现的 “笑点断层” 问题。
目前,该功能已经支持中英双语互译,全面覆盖了站内视频、直播弹幕以及界面按钮,每天能处理数十万条非中文内容的翻译需求。据 B 站技术团队透露,后续还计划将日语、韩语等近 10 种语言纳入支持范围,进一步强化对 ACG 文化圈的覆盖能力。
B 站董事长兼 CEO 陈睿表示,这个功能是平台 “内容无国界” 战略的关键落地。此前,B 站已经完成了国内版与国际版 APP 的合并,并且积累了丰富的文化元素本地化经验。此次 AI 原声翻译功能的推出,标志着 B 站在跨语言技术布局上已经全面成熟。
业内分析认为,B 站的 AI 原声翻译功能通过多目标优化与强化学习技术,首次实现了 “翻译准确性 – 声线还原度 – 口型匹配度” 三者的高度协同,为长视频平台树立了新的技术标杆。对于 UP 主而言,该功能大大降低了内容出海的语言门槛,尤其对那些依赖 “人设声线” 的游戏解说、动画测评等创作者来说,帮助极大。而对于用户,不管是中文用户观看外语内容,还是海外用户体验中文视频,都能收获近乎 “无字幕隔阂” 的沉浸式体验。
.
.
