音视频技术开发周刊 91期-LMLPHP


架构


  • 从头到脚撸一个多人视频聊天 — 前端 WebRTC 实战(一)

    本系列文章包括但不限于 WebRTC 多人视频,本文为第一部分,主要是基础讲解以及一对一的本地对等连接,网络对等连接。


  • LinkedIn Feed流视频自动播放架构演进

    为提升用户观看体验,LinkedIn视频团队一直努力完善其视频自动播放功能。本文概述了LinkedIn自动播放产品标准,以及为实现此标准所开发的技术与架构。


  • 视频直播软件开发不得不引起重视的网络架构问题

    本文主要以CDN为主来介绍视频直播软件开发过程中需要注意的网络架构相关问题。


  • 视频直播软件开发过程中需要解决的“老朋友”

    要说在视频直播软件开发的过程中,什么是技术人员最头疼的?肯定有人会毫无疑问的回答:直播的卡顿和延时!


  • 杨攀:融云专注极致技术 不忘初心打造极简体验

    本文是融云联合创始人、CTO杨攀接受 LiveVideoStack 邮件采访整理而成,杨攀聊到了个人成长经历,作为创业公司技术负责人的责任,以及对企业通信市场的格局和未来的机遇与挑战。


传输网络


  • 王盛:QUIC让B站在20%丢包时实现零卡顿

    B站团队是目前少数在生产环境中部署QUIC的视频平台,收益明显。在面对未来网络基础设施升级的背景下,如何让视频传输更流畅、稳定是各视频服务平台必须面临的挑战。LiveVideoStack邮件采访了哔哩哔哩高级工程师王盛,他畅谈了热门技术的未来。


音频/视频技术


  • MediaCodec、OpenGL、OpenSL/AudioTrack 实现一款简单的视频播放器

    功能很简单,大致流程为:MediaCodec 解码视频文件得到 YUV、PCM 数据;OpenGL 将 YUV 转为 RGB,并渲染到 Surface 上;OpenSL/AudoTrack 获取 PCM 数据并播放。


  • iOS音视频数据采集之AVFoundation

    iOS直播技术的流程大致可以分为几个步骤:数据采集、图像处理(美颜、滤镜)、视频编码、封包、上传、云端(转码、录制、分发)、直播播放器。


  • 音频带宽预测与动态参数调整优化报告

    经过多轮反复试验,最终在原来优化的基础上增加了音频带宽估计和探测模块,实时探测网络状态以此来增加动态参数调整的精准性和稳定性。


  • A Go implementation of the WebRTC API


编解码


  • AV1编码器速度和压缩率达到点播实用级别

    本文来自微帧科技的投稿,文章介绍了微帧科技的AV1编码器Visionular Aurora(以下简称Aurora),并使用公开数据集下与x264和x265做了性能对比测试。从微帧公布的数据看,无论PSNR还是VMAF,Aurora都有明显的码率节省。


  • iOS视频数据编码

    音视频编解码, 说白了就是对音视频数据进行压缩, 减少数据对空间的占用, 便于网络传输, 存储和使用!目前直播常用的音视频编解码方式是h.264/AVC, AAC/MP3。


  • H.264 中的指数哥伦布编码(Exponential-Golomb coding)

    指数哥伦布编码是一种通用的熵编码方式,编码规则比较简单,不需要知道编码数据的概率分布。


  • H.264/AVC视频编解码技术详解:解码、显示顺序与图像管理

    在H.264的解码过程中,每一帧的数据按照相应的NAL Unit在码流中的顺序传入解码器进行解码。需注意的是,首先传入解码器的视频帧的NAL unit,解码完成后其对应的图像不一定会首先显示。其原因是由于B帧的存在,视频帧在输出时会进行顺序重排。


  • Android音视频之MediaCodec

    从 API 16开始,Android提供了MediaCodec类以便开发者更加灵活的处理音视频的编解码,较MeidaPlay提供了更加丰富、完善的操作接口。


  • 高文:中国编解码技术必将引领世界

    AVS视频编码标准很早是为广播电视发展制定的。在高文院士看来,5G+4K/8K将是未来音视频编解码领域的标准配置,而这两个领域中国都拥有领先技术。未来中国将引领高清音视频编解码领域的发展。


AI智能


  • Adobe提出新型超分辨率方法:用神经网络迁移参照图像纹理

    近日,Adobe 研究院与田纳西大学的研究者提出了一种借助神经纹理迁移实现的图像超分辨技术,还构建了一个用于训练和评估超分辨率方法的基准数据集。


  • CVPR 2019 | 无监督领域特定单图像去模糊

    本文将针对 CVPR2019 Unsupervised Domain-Specific Deblurring via Disentangled Representations 一文进行分析,梳理一下基于深度神经网络下图像去模糊的实现方法。


  • 英伟达「高更」GAN让简笔画秒变逼真图像

    在GTC 2019 上,英伟达展示了一款新的交互应用 GauGAN:利用生成对抗网络(GAN)将分割图转换为栩栩如生的图像。这是继 PGGAN、StyleGAN 之后,英伟达提出的又一强大方法,相关论文已被 CVPR 2019 接收为 oral 论文。


图像


  • PNG 图片压缩原理解析

    PNG的全称叫便携式网络图型(Portable Network Graphics)是目前最流行的网络传输和展示的图片格式,原因有如下几点:无损压缩,体积小,支持透明效果。

04-20 04:37