找回密码
 立即注册
LiveVideoStack 首页 资讯 查看内容
  • QQ空间
  • 回复
  • 收藏

音视频技术开发周刊 54期

2018-6-19 08:00

『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。点击音视频技术开发周刊 54期,浏览第54期内容,祝您阅读愉快。


策划 / LiveVideoStack


架构


如何看待Pensieve:MIT基于神经网络的流媒体码率自适应策略

今年的SIGCOMM上, MIT CSAIL的一支研究团队,发表了一篇名为Pensieve的工作,即利用神经网络优化码率自适应算法,用于提高媒体传输质量。本文对其进行了简单的介绍,并发表了一些看法。


李大龙:音视频技术是互联网品质生活的连接器

结识李大龙源于LiveVideoStackCon 2017,忙碌的工作让我们在会场擦肩而过,并相约一场采访。通过采访,我深深的感受到他对行业的执着与热情,他将音视频技术定义为互联网品质生活的连接器,而我们这些社区媒体不也是这些开发者与生态的连接器吗?


直播终端技术比较

目前,连麦直播的终端主要包括:原生APP、浏览器H5、浏览器WebRTC、微信小程序。浏览器上的应用包括H5和WebRTC,前者可以拉流观看,后者可以实现推流和拉流。


WebSocket Go

本文主要介绍了WebSocket 协议、WebSocket 的 Go 语言实现,以及 socket.io 服务端库的 Go 语言实现的理解。


WebRTC下的媒体网络连接STUN、TURN、UDP、TCP


WebRTC对等连接:连接不同设备上的浏览器

本文详细介绍了如何在不需要服务器的情况下(只需要在开始交互的时候使用服务器),使不同设备上的两个浏览器相互交流。


音频/视频技术


移形换影 - 短视频色彩特效背后的故事

本文介绍了腾讯云短视频(UGSV)众多视频特效中的一种——移形换影。


详解音视频中的DRM数字版权技术

本文首先简单介绍了当前移动端DRM的一些基本概念,并通过实例重点介绍了安卓视频开发的DRM处理。


Pensieve:AI带来的更流畅的高质量观看体验

麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)开发的基于机器学习的流媒体系统能更好的适应不同的网络条件,从而提供更加流畅的流媒体传输体验。LiveVideoStack对原文进行了摘译。


FFmpeg3.3.2+SDL2实现流媒体音频播放

本文介绍了如何通过FFmpeg+SDL实现简单的播放器效果。


编解码


视频编码与封装方式详解

本文为大家介绍了视频编码的方式、封装格式、以及标准两大系统,并指出几种常用的视频编码方式以及存储封装格式。


Zoe Liu:被Chrome Media团队的专注精神感染

在WebRTCon 2018期间,Google软件工程师Zoe Liu接受了LiveVideoStack社区编辑丁雪丰的采访。Zoe畅谈了AV1及VP9的现状与应用前景,以及从On2到Chrome Media坚持20多年做编解码研发的团队。


AVS2音频标准颁布,中国自主音视频标准比翼双飞

2018年6月7日,继AVS2视频部分2016年底颁布为国家标准后,我国第二代数字音频编码标准《信息技术 高效多媒体编码 第3部分:音频》(简称AVS2音频标准)将于2019年1月1日正式实施。


Android 基于FFmpeg开发简易播放器 - FFmpeg解封装


AI智能


深度学习AI美颜系列---AI瘦身效果算法揭秘

商汤基于深度学习研发了整套瘦身SDK,包括了瘦腿,瘦腰,瘦胳膊,瘦头型等等功能,并给出了酷炫的实时瘦身视频,惊艳到了众人!本文将以瘦腰和瘦腿为例,给大家详细讲解一下。


图像语义分割的工作原理和CNN架构变迁

图像分割是根据图像内容对指定区域进行标记的计算机视觉任务,本文聚焦于语义分割任务,即在分割图中将同一类别的不同实例视为同一对象。作者将沿着该领域的研究脉络,说明如何用卷积神经网络处理语义图像分割的任务。


从ISCA论文看AI硬件加速的新技巧

总得来说,专门针对ML/DNN的硬件架构已经是ISCA连续几年的热点了,经过大家的努力,对相关问题的挖掘已经越来越深。目前,对ML/DNN硬件加速技术的研究主要围绕提高Inference的处理效率展开。


图像


压缩效率第一!CVPR图像压缩挑战赛腾讯音视频实验室胜出

CVPR 2018 图像压缩挑战赛(CLIC)结果已经出炉,腾讯音视频实验室和武汉大学陈震中教授联合团队于该项挑战赛上取得压缩性能第一。


具有感兴趣区域的静止图像压缩编码算法研究

为了提高感兴趣区域的图像质量,在信道资源和存储空间有限的条件下,提出感兴趣区域的零树编码算法EZW_ROI(Embedded Zerotree Wavelet with Region of interests),它对感兴趣区域图像和背景图像采用不同的压缩步骤,使感兴趣区域内的图像比背景图像具有更好的图像质量。


代码简单实现模拟噪声

本文介绍了图像噪声的概念、来源、几种常见的图像噪声形式以及如何通过代码简单实现模拟噪声。

原作者: LiveVideoStack 来自: LiveVideoStack
文章点评