2024年9月20日

转码、超低时延快直播的音视频解决方案,连续四年居于市场份额和解决方案首位[1],覆盖国内 90% 音视频客户。团队通过不断的技术创新和产品优化引领行业发展,其中,腾讯云-媒体处理融合视频 AI 技术持续突破核心编解码技术,2021/2022 MSU 世界云端视频转码比赛综合最佳,且在的 SLC 评测中,也取得多项最佳的成绩,另外腾讯云-媒体处理服务支撑全网 40%+ 实时媒体处理量[2]。低延时、低码率、高画质,腾讯云音视频为全真互联时代,提供坚实的数字化助力。

首先,由于网络传输或采集设备不佳的原因,直播或点播的画质可能出现不清晰的问题,此时需要应用视频增强算法,如视频超分辨率。为了不影响用户的观看体验,视频增强算法需要以足够低的延时运行。此外,音视频 PaaS 平台还需要对视频进行高效的视频标签识别、视频分类、视频剪辑等,这都必须藉由 AI 模型的推理速度,达到最佳程度的优化和加速。

另外,在直播场景中,用户希望对主播直播的画面应用虚拟背景,这要求将人像从直播画面中精准地分割出,并应用预设的背景。如何获得实时性高、准确性强的人像分割也是一个难点。

腾讯云音视频 PaaS 平台与 NVIDIA 在诸多产品和业务中开展了深入合作,共同打造高性能的音视频解决方案。

在云直播 CSS 服务以及媒体处理MPS服务中,腾讯云推出视频增强功能。为了加速视频增强模型的推理速度,腾讯云使用了 NVIDIA TensorRT 对模型进行高性能优化。TensorRT 是构建在 NVIDIA 的并行编程模型 CUDA 基础之上的,结合最新一代 NVIDIA Ampere 架构GPU,TensorRT 还可以利用 Tensor Core 实现稀疏性加速的特点。对于深度学习推理应用的生产环境部署方面,TensorRT 提供了 INT8 和 FP16 的优化,低精度推理能够极大的降低应用的延迟,有益于实现实时视频增强服务。

在云直播 CSS 云导播台业务的 AI 智能人像抠图功能中,腾讯云采用了 NVIDIA Maxine Video Effects SDK 中提供的 AI Green Screen(简称 AIGS)功能,对直播画面进行实时而准确的人像分割。Maxine AIGS 对视频流抠图的精度和稳定性做了专门的优化,并且加入了 CUDA Graph 优化技术,及时在 GPU 负载高的时候也能降低整体的延时,使得云导播台的人像分割模块能实现多路并发、远超实时的处理高效率。Maxine AIGS 提供了简单易用的 A,腾讯云音视频 PaaS 平台可直接在 FFmpeg filter 中通过 API 调用该功能,并可与其他多媒体处理 filter 联动对视频流进行处理。

最后,在媒体处理 MPS 业务中的视频 AI 功能,涉及到了多个深度学习模型的推理,腾讯云同样采用 NVIDIA T4 GPU 进行高性能推理。这得益于几乎所有主流的深度学习框架均能在 NVIDIA GPU 上执行高效计算。

NVIDIA TensorRT 在腾讯云音视频 PaaS 平台的提供的视频增强和视频 AI 功能中,使得推理阶段的应用在 NVIDIA T4 GPU 上可以实现同比单一CPU平台高达 40 倍的加速效果。TensorRT 可以从所有主流的深度学习框架中导入训练好的模型并进行优化,同时提供相应的 API 和解析器,生成经过优化的运行时引擎可以部署到画质增强服务中。

未来,腾讯云音视频 PaaS 平台与 NVIDIA 将持续合作,进一步提升音视频产品和服务中 AI 算法的性能。双方将基于 NVIDIA TensorRT 最新的特性,利用低精度和稀疏化模型压缩技术,对云直播和云点播业务中涉及到的视频增强与视频 AI 功能模型的推理进行大幅加速。此外,NVIDIA Maxine 在视频特效和音频特效方面持续发布新特性,包括音频超分技术、立体环绕声增强技术等,也将助力腾讯云音视频 PaaS 平台提供更丰富的音视频服务和功能。双方在未来也将不断探索打造编解码、AI、图形渲染全流程 GPU 加速的视频处理方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。举报投诉

手机屏幕的新巅峰”。双方将于 10 月 24 日在重庆举行发布会,预计将带来新机的最新消息。

设备所包围。从零售广告中的数字标牌,到现场活动中的麦克风和大屏幕显示;从体育赛事的现场直播到行业的实时监控….。需要在不牺牲

Parabricks [1]  的集成和部署,为大型研究型医院、生命科学与医学领域国家实验室和科研院所、第三方医学检测实验室、基因与生物技术科技公司等企业提供

Parabricks [1] 的集成和部署,为大型研究型医院、生命科学与医学领域国家实验室和科研院所、第三方医学检测实验室、基因与生物技术科技公司等企业提供

的要求大幅提升。具有数据处理量是标准清晰度(SD)电视格式 6 倍的1,080像素高清晰度(HD)格式、管理DTV

和应用产品组合的简化,以顺利实现数字化转型。全新的数据架构将激活数据价值、赋能经销商、服务消费者,

,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化

编解码库libavcodec,为了保证高可移植性和编解码质量,libavcodec里很多code都是从头开发的。

北斗星通旗下企业真点科技共创高精度定位生态,以厘米级定位精度赋能自动驾驶汽车。此次华芯与真点科技结合双方优势,

产品多媒体设备很大程度丰富了我们的日常生活,给我们呈现出不一样的休闲娱乐方式。其产品的安全

应用开发大赛抽取垂直技术领域赛道,面向所有优秀的个人开发者、企业,发布RTC场景痛点,以悬赏揭榜的形式征集行业应用

行业目前快速发展,在远程医疗、在线教育、线上金融、企业协作等领域都有广泛的应用。参赛者可基于各赛道场景化需求提交作品。

度数字化到拟真化再到全真互联网时代。本次LiveVideoStackCon 2021上海站我们邀请到了

授课服务,满足多种教育场景的需求,帮助企业快速构建在线教育互动课堂平台,是集IM即时通信、实时

名称:智能摄像头楼宇可视对讲系统 合作客户(LOGO):绿地集团 客户简介: 绿地控股集团股份有限公司是一家以房地

将占移动端总流量的70%,未来 10 年5G将给全球传媒和娱乐产业带来1. 3 万亿美元的新营收机会。

从去年到今年,以音遇、吱呀语音、Soul为代表的声音社交应用屡屡登上APP社交排行榜前列。

从去年到今年,以音遇、吱呀语音、Soul为代表的声音社交应用屡屡登上APP社交排行榜前列。

服务VV SDK,以SDK开发包形式提供给企业客户使用,包括网页、Android、iOS、Windows等多种终端的

的应用越来越广泛,如何保障实时互动过程流畅不卡顿、如何消除回声成为关键。即构科技联合创始人蒋宁波在LiveVideoStack Meet上以语

Analog In & Out,一路S/PDIFF In & Out,两路 I2S In & Out,两路 DSD In,并带有 4*2W 功率输出接口。

苹果、Google、亚马逊等科技巨头一致看好智能音箱市场,国内厂商应该如何布局呢?Mediawin一站式

今天,压缩音频娱乐的迅猛增长已经不只限于家庭和便携式设备市场。事实上,数字和“软”音频产品正在迅速进入汽车行业,卫星广播和mp3播放

产业的共性基础标准,具有巨大的产业需求。跨入新世纪以来,随着编解码技术本身的进步和芯片集成

发表评论

邮箱地址不会被公开。 必填项已用*标注