实时互联网大会

Enable Real-time Internet

北京朝阳悠唐皇冠假日酒店

10.24 -10.25

00
Days
:
00
Hours
:
00
Minutes
:
00
Seconds

JOIN THE EVENT 为什么参加RTC大会?

只为技术

为RTC技术布道,这是一场纯粹的技术大会。不以盈利为目的,让开发者负担得起,并能学习新技术

探索前沿

从 AI、5G 、VR 等前沿技术,到 Flutter 这样的新框架,你都能听到该领域专家的实践分享

Play Video

全球视野

不出国门,你就能学习众多海外技术大咖的技术经验和实践,提供实时同步翻译,线下还能和大牛直接交流

开发者第一

这里既有经验丰富的架构师为你开拓思路,也有最Hard Core 的开发实践经验,深入浅出、干货满满

+
极具前瞻性的技术演讲人
技术创新演讲和对话
+
全球互联网公司技术领袖
+
RTC 技术社区的开发者

大会出品人

Zoe Liu

Visionular Inc 联合创始人兼首席科学家

高泽华

声网Agora 技术VP

宋利

上海交通大学图像通信与网络工程研究所副所长

马思伟

北京大学信息科学技术学院教授

银国徽

字节跳动 视频架构前端负责人

孙雨润

声网Agora 技术VP

LISTEN TO THE 演讲嘉宾

赵斌

声网Agora 创始人&CEO

Reggie Yativ

声网Agora 国际业务 COO

钟声

声网 Agora 首席科学家

Zoe Liu

Visionular Inc 联合创始人兼首席科学家

叶琰

阿里达摩院机器智能技术实验室 视频技术负责人

Philippe Le Hégaret

万维网联盟 (W3C) 技术项目总经理

Tsahi Levent-Levi

WebRTC领域知名博客 BlogGeek.me 博主

成为讲师

RTC大会是全球最大的RTC技术布道会议,是世界顶级专家和开发者分享最前沿技术和实践的聚会。

至今吸引了数万名开发者前来交流学习。现在我们向整个社区开放征集讲师,如果你有值得和社区伙伴一起分享的好议题,不要犹豫,请向我们提交。

舞台属于每一个开发者,聚光灯渴望新生力量。We are your conference!

AGENDA 议程

10.24

高峰论坛

09:00 - 09:40

开场致辞

赵斌

声网Agora 创始人&CEO

Reggie Yativ

声网Agora 国际业务 COO

09:40 - 10:20

实时视频技术的现状与未来

钟声

声网Agora 首席科学家

10:20 - 10:50

The rise and future of real-time communications on the Web

Philippe Le Hégaret

W3C 技术项目总经理

10:50 - 11:20

基于AI的实时语音交互的前沿探索

陈伟

搜狗 AI交互事业部高级总监、语音技术部负责人

11:00 - 12:00

圆桌论坛

技术分论坛

  • 编解码 Now and Then
  • 人工智能 AI 与 RTC
  • 下一代 RTC

13:30 - 14:15

AV1编码优化在实时视频通信中的探索

Zoe Liu

Visionular 联合创始人兼首席科学家

14:15 - 15:00

面向互联网的抗丢包音频编码器的开源与实践

高泽华

声网Agora 技术 VP

15:00 - 15:45

VVC overview and progress

叶琰

阿里达摩院机器智能技术实验室 视频技术负责人

15:45 - 16:30

新一代AVS3视频编码标准

马思伟

北京大学 教授

16:30 - 17:15

感知编码在实时通信上的实践

李佳俐

声网Agora 高级视频算法工程师

13:30 - 14:15

Deep Learning based Super Resolution for mobile RTC

周世付

声网Agora AI算法工程师

14:15 - 15:00

基于内容的视频推荐和实践

谢晓辉

Hulu 首席研发经理

15:00 - 15:45

RTC x Audio x AI,现状和展望

陈若非

声网Agora 音频体验与工程总监

15:45 - 16:30

互联网语音内容审核中的关键AI技术

胡泊

依图科技 高级架构师

16:30 - 17:15

基于神经网络的自适应传输

马展

南京大学电子学院 副教授、博士生导师

13:30 - 14:15

5G时代中音视频的机遇与挑战

孙松林

北京邮电大学 信息与通信工程学院多媒体教研中心主任、博士生导师

14:15 - 15:00

高速实时传输的拥塞控制

郝连福

声网Agora 资深架构师

15:00 - 15:45

微软小冰实时感官系统与未来发展趋势

刘成城

微软小冰 研发总监

15:45 - 16:30

6DoF视频技术赋能下一代3D化体育/综艺观看体验

盛骁杰

优酷 高级算法专家

16:30 - 17:15

智能图形技术的进展及应用

秦昊

相芯科技 CTO

10.25

技术峰会

  • 大前端应用开发
  • QoE 与高并发网络架构
  • WebRTC 工作坊

09:00 - 09:45

Common WebRTC mistakes and how to avoid them

Tsahi Levent-Levi

WebRTC领域知名博客 BlogGeek.me 博主,W3C WebRTC 技术的布道师

09:45 - 10:30

Flutter浪潮下的音视频研发探索

陈炉军

闲鱼技术部 无线技术专家

10:30 - 11:15

H5 实时音视频直播的技术探索

毛玉杰

声网Agora WebRTC高级架构师

11:15 - 12:00

实时通讯在美团客服的跨端应用实践

杨尚林

美团 资深前端工程师

13:30 - 14:15

MPEG-DASH 在 bilibili 的实践、优化与思考

丁建强

Bilibili 资深前端工程师

14:15 - 15:00

基于深度学习实时直播内容风控

关涛

数美 研发中心总经理

15:00 - 15:45

深度学习CV算法在WebRTC领域的应用

刘阳

字节跳动 高级移动端图像算法工程师

15:45 - 16:30

主题演讲

陶泽宇

无网信息科技 CTO

16:30 - 17:15

基于 node-canvas 与 FFmpeg 的数据可视化视频合成

孙博文

OnVideo 资深前端开发工程师

09:00 - 09:45

软件定义实时网在5G时代的挑战与机遇(拟)

孙雨润

声网Agora 技术VP

09:45 - 10:30

高并发实时信令以及在教育场景的应用

石柯

沪江CCTalk CCtalk服务端开发经理

10:30 - 11:15

利用Kubernetes 部署视频流录制服务器

汪磊

Wishlife CTO

11:15 - 12:00

Creating a Global Multicloud RTC Framework with Docker

Evan McGee

SignalWire CTO 兼联合创始人

13:30 - 14:15

高并发场景下分布式实时消息系统的架构实践(拟)

吉奇

声网Agora 资深技术架构师

14:15 - 15:00

滴滴20GB+/S日志系统的架构设计

黄佳伟

滴滴出行 高级软件开发工程师

15:00 - 15:45

爱奇艺超低延时直播服务RTCDN系统的实现及应用

陈坤中

爱奇艺终端网络部 研究员

15:45 - 16:30

新浪微博极速版四层接入网关的重构历程

聂永

新浪微博 技术专家

16:30 - 17:15

实时消息在同城货运场景中的设计与应用

刘新翠

快狗打车 移动研发部负责人

WebRTC是 RTC 领域最主流的开源技术,也是很多开发者上手 RTC 的第一个项目。但是,其编译环境复杂,涉及前后端、音视频等众多技术栈,显然不是一个新手友好的项目。通过WebRTC 工作坊,带你从基础编译到最新框架扩展,从零上手到能自己玩。培训讲师会邀请 WebRTC 专家,WebRTC 热门开源项目作者等多位专家,面授“速成”小诀窍。

09:00 - 12:00

WebRTC 从 1 对 1 到服务端的技术实践

李超

前新东方集团 产品研发中心音视频技术专家

13:30 - 15:00

Janus 服务端实践

Lorenzo Miniero

Meetecho 董事长, Janus开源项目联合创始人

15:00 - 16:00

WebRTC 网络抗丢包策略

赵晓涵

声网Agora 音频算法工程师

16:00 - 17:00

WebRTC 降噪与回声消除

李超

前新东方集团 产品研发中心音视频技术专家

JOIN THE EVENT 购票参会

普通票

88
  • 一场千人高峰论坛
  • 五大技术分会场
  • 展区参观
  • 大会资料
  • 100元代金券,可用于报名RTC Workshop

WebRTC 工作坊

188
  • 席位仅限100
  • 专场全天培训
  • 培训当天午餐
  • 展区参观
  • 培训资料
  • 大会定制T恤

RTC RETROSPECT 往届回顾

CONTACT US 联系我们

会议地点

北京市朝阳区三丰北里2号楼悠唐购物中心1层
悠唐皇冠假日酒店

票务咨询

15101014297
tickets@agora.io

商务合作

18618191582
qinxingxing@agora.io

媒体合作

15001349349
pengxiaohuan@agora.io

HURRY UP! 报名参会

赵斌

声网Agora 创始人&CEO

作为实时互联网的领军人物,赵斌在1997年作为创始工程师参与Webex(网讯)创业,2008年作为CTO参与YY (欢聚时代)创业,两家公司分别于2000年及2012年在纳斯达克上市。 2014年,赵斌创立声网Agora,开创了全球实时互联网服务,其实时音视频API已经帮助超过12万应用和企业实现全球范围的实时音视频互动能力。公司目前融资总额已逾1.25亿美元,客户遍布社交、教育、IoT、金融、医疗等行业,是全球使用最广的实时音视频互动SDK。

演讲主题:

待定

内容简介:

待定

钟声

声网Agora 首席科学家

北京大学数学系博士。曾任海信芯片总经理、博通资深主任科学家、华亚微电子技术副总裁。在美国拥有50余项技术专利,在中国拥有超过20项技术专利。曾是MPEG/JVT (H.264)与 INCITS主要成员,IEEE 成员,并发表了30余篇论文,内容覆盖了模式识别、视频编解码、计算机视觉等技术领域。

演讲主题:

待定

内容简介:

待定

Philippe Le Hégaret

万维网联盟 (W3C) Web 技术总负责人

万维网联盟 (W3C) Web 技术总负责人,管理 W3C 所有在进行的 Web 标准技术项目。曾是 W3C 的前端技术总监,对 Web 性能、Web 多媒体技术、Web 安全等有十分深入全面的了解。万维网联盟由Web的发明者 Tim Berners-Lee 及W3C的首席执行官 Jeffrey Jaffe 领导,由设立在美国麻省理工大学(MIT)、欧洲数学与信息学研究联盟(ERCIM)、日本庆应大学(Keio University)和中国北京航空航天大学的四个全球总部(W3C Hosts)的全球团队联合运营。W3C的使命是通过开发协议、指南和标准确保Web的长期发展,尽展Web的潜能。W3C 发布的都是开放性标准,基于Royalty-Free(RF)的方式加以实现,标准都对公众可用,且使用标准没有额外的费用,其技术规范覆盖了IT及互联网、出版、电视与媒体、汽车、金融、航空等众多领域。”

演讲主题:

The rise and future of real-time communications on the Web

陈伟

AI交互事业部高级总监、语音技术部负责人

搜狗AI交互事业部高级总监,语音技术部负责人,负责搜狗语音(识别、合成、声纹等)、图像(手写、唇语识别等)、机器翻译等多个技术方向,并主要负责搜狗知音OS、机器同传、语音听写、旅行翻译宝、录音翻译笔等多项软硬件产品的技术研发工作,致力于通过技术和产品的创新提升人工智能技术的实际落地能力,为用户提供优质的使用体验。

演讲主题:

基于AI的实时语音交互的前沿探索

内容简介:

待定

Zoe Liu​

Visionular 联合创始人兼首席科学家

Zoe Liu是 Visionular (微帧科技)的联合创始人兼首席科学家。微帧于2018年7月成立,是全球领先的视频AI与超高清解决方案提供商。专注于融合人工智能、新一代视频编码、图像处理等先进技术,提供低成本、超高清、智能化的视频服务。公司设立杭州、北京、硅谷三地核心研发团队。Zoe曾就读于清华大学,并获得学士、硕士与博士学位,并于美国普渡大学获得第二个博士学位。Zoe多年专注于视频编码和通信领域。在创立微帧之前,Zoe曾在Google Chrome Media团队工作5年,作为开源视频编解码标准 AOM/AV1 的核心成员参与研发与标准制定。Zoe曾先后就职于多个世界著名实验室,包括贝尔实验室、诺基亚研究中心、太阳微处理器中心实验室、惠普实验室等。Zoe也是苹果 FaceTime、Tango 视频电话、Google Glass 视频电话等实时音视频通信产品的核心开发者。她曾发表国际论文40余篇,署名国际专利50余项。她还曾作为演讲人,在2018年Google I/O 大会上为开发者们分享了 AV1的核心技术与市场前景。

演讲主题:

AV1编码优化在实时视频通信中的探索

内容简介:

待定

高泽华

声网Agora 技术 VP

音频编码与抗丢包技术专家,设计开发声网NOVA/SOLO/SOLO-X系列语音编解码器。先后在士兰微电子、摩托罗拉、虹软科技,YY语音负责音频系统设计与架构。2014年加入声网,负责音频、视频、工程管理和客户交付与服务等方面工作。

演讲主题:

面向互联网的抗丢包音频编码器的开源与实践

叶琰

阿里达摩院机器智能技术实验室 视频技术负责人

叶琰是阿里巴巴(美国)达摩院机器智能实验室的视频技术负责人,负责 ITU-T/VCEG 与 ISO/IEC/MPEG 等国际视频标准,视频编解码实现,以及视频理解和内容分析等方向的研发工作。在加入阿里巴巴之前,她是 InterDigital的研发总监,统管视频标准与平台研发,带领团队进行国际视频标准化制定和端到端视频通讯系统原型的开发工作。加入InterDigital之前,她还曾在杜比实验室负责图像技术研究工作,也曾在高通负责过多媒体研发与标准的建立。她参与了多项视频编解码与流媒体的国际标准制定工作,包括 H.266/VVC,H.265/HEVC ,SHVC,MV-HEVC,SCC,MPEG PCC,MPEG DASH和MPEG CMAF 等。她是 VVC 测试模型与 360Lib 算法描述的联合作者,也是HEVC 可扩展和SCC 扩展标准的联合作者。她的研究涉猎广泛,包括基于机器学习的视频编码,视频处理与内容分析,AR/VR,视频编码,视频流传输,和实时的沉浸式视频通话等。她在中国科技大学获得本科及硕士学位后,进入加州大学电子与计算机工程学院,并获得了博士学位。她是 IEEE 的高级会员。

演讲主题:

VVC overview and progress

内容简介:

多功能视频编码(VVC)标准是自2018年4月开始由ITU-T和MPEG联合视频标准委员会JVET开发的新一代视频压缩标准。与目前压缩性能最好的HEVC标准相比,VVC的目标是使用一半的比特率实现相同的视频质量。 VVC的另一个重要设计目标是为各种视频应用的格式提供高压缩效率,包括传统的standard dynamic range(SDR)格式,high dynamic range(HDR)格式和全方向360度视频等格式。在最近的2019年7月的JVET标准会议上,VVC标准达到了被称之为committee draft(CD)的重要里程碑,标志着VVC标准中主要编码工具和功能已经基本选定,接下来的技术发展进入稳定阶段。在本次演讲中,我们将一起回顾一下VVC中的一些主要编码工具及VVC所支持的一些重要功能。我们还将VVC与其它视频编解码标准(如HEVC和AV1)做客观压缩性能的比较。最后我们会展望未来,看看在VVC定稿之前的最后的一年中JVET委员会还需要做的工作,并探讨一下业界预期VVC在行业和市场中会产生什么样的影响。

马思伟

北京大学 教授

北京大学信息科学技术学院教授, 2005年博士毕业于中国科学院计算技术研究所。2005年8月至2007年8月在美国南加州大学进行博士后研究,之后到北大工作至今。主要研究方向为视频编码及处理,已发表论文200余篇,已获授权发明专利50多项。担任IEEE Transactions on Circuits and System for Video Technolgoy(TCSVT)、Journal of Visual Communication and Representation(JVCIR)期刊编委(AE)、AVS视频组组长、中国图象图形学学会理事等。自2002年起参与AVS系列国家标准的制定,目前正在负责组织制定新一代AVS3标准,曾获国家技术发明奖二等奖、国家科学技术进步奖二等奖等奖励。

演讲主题:

新一代AVS3视频编码标准

内容简介:

新一代AVS3视频编码标准自启动以来得到业界的广泛关注,已制定完成的AVS3基准档次相比于已有标准编码效率提升30%,将引领未来8K超高清、VR视频等产业应用的发展。本报告简要介绍新一代AVS3视频编码标准的最新进展情况,包括制定过程、关键技术、行业应用和未来展望等内容。

李佳俐

声网Agora 高级视频算法工程师

本科和博士分别毕业于中国科技大学和博士香港科技大学,14年在Apple实习,毕业后就职于声网,主要做视频编解码以及前后处理相关工作。对视频编解码中并行算法设计、码率控制、降噪、屏幕共享、视频质量评估、主观视频编码,画质提升以及视频编码的硬件设计等课题比较感兴趣,有所涉猎。

演讲主题:

感知编码在实时通信上的实践

内容简介:

感知编码是指在编码的时候结合人眼特性,进一步减除人眼通常注意不到的地方以达到节省码率的目的,或者加强人眼观看的主观效果。感知编码可以包含前处理、后处理以及编码过程中的多个算法。这里会简要介绍一下相关话题以及我们在实时通信领域限制下的相关实践。

周世付

声网Agora AI 算法工程师

毕业于上海大学,博士学位, 图像算法工程师,主要从事机器学习、计算机视觉算法的研究及落地。

演讲主题:

Deep Learning based Super Resolution for mobile RTC

内容简介:

近几年,超分辨率技术一直是计算机视觉领域的一个热门话题,其应用前景广泛,比如RTC。然后,超分辨率技术在移动端落地的过程中,面临着模型过大、运算复杂、设备发热过大的问题。本次演讲内容将重点分享超分辨技术在移动端落地的探索和实践经验,内容包括对抗神经网络、模型剪枝压缩等。

谢晓辉

HULU 首席研发经理

Hulu首席研究主管,视频内容理解和创新孵化团队负责人,具有18+年算法研发创新和管理经验。专注于模式识别、图像视频文本等多媒体信息处理,对人工智能、人机交互领域的研究以及成果落地和产品化有丰富经验,拥有上百项相关专利,学术论文近20篇。本科毕业于西安交通大学实验班,北京邮电大学取得模式识别领域博士学位。曾先后就职于松下电器研发中心、诺基亚北京研究院、联想研究院。主导研发的手写计算器曾作为诺基亚旗舰机N97首发的市场卖点之一,在Lenovo主导研发了Horizon桌面PC的创新手势交互,荣获CES数项大奖,等等。

演讲主题:

基于内容的视频推荐和实践

内容简介:

视频网站面临的技术挑战之一是如何对视频做精准的用户分发,理解用户、环境和视频内容是解决问题的核心和关键。以头部视频为主的视频网站由于用户选择成本更高、消费行为稀疏、复杂而且感性,因此对视频进行精确、细致与丰富的理解和刻画显得更为重要。相比传统的基于用户行为的推荐系统,如何借助于视频内容理解来优化个性化推荐和内容发现呢?本次演讲内容将重点分享Hulu在这一方面的探索和实践经验,内容包括视频理解在内容冷启动、视频精细化标签和分组、深度推荐模型中的应用等等。

陈若非

声网Agora 音频体验与工程总监

负责基础音频技术的架构和研发,主要研究基于模型重建的语音增强技术,对回声消除,降噪,增益控制,多麦,音效处理,丢包隐藏等语音技术有丰富经验。曾任职YY基础技术研发部门,担任IEEE权威语音期刊和会议专业reviewer。

演讲主题:

RTC x Audio x AI,现状和展望

内容简介:

本次演讲会从一个相对宏观的角度来分析介绍人人和人机交互相关的音频技术分类,现状总结和对未来的展望。其中会重点展开RTC与音频,AI结合的部分,我们需要解决哪些问题,有什么挑战,AI能在哪些方面帮到我们,声网在这些方面的一些思考和进展,其中也包括了AI降噪,AI丢包隐藏,声音美化等音效的成果展示。

胡泊

依图科技 高级架构师

逾十年内容安全、公共安全、网络安全、反电信诈骗系统设计开发经验。在依图科技负责将语音识别、自然语言理解、声纹识别、智能视频解析等技术落地为安全行业产品和解决方案。曾任公安部科信局副处长。

演讲主题:

互联网语音内容审核中的关键AI技术

内容简介:

相较于成熟的图片、视频审核,语音是行业公认的新难题。语音违规不仅风险更隐蔽、影响更恶劣,其对应的AI技术也存在更高的壁垒。难点一:高复杂度场景下的语音识别。语聊房、视频直播、短视频中的语音往往伴有极强背景音(如音乐、噪声等)、语速极快咬字不清、口音严重等情况, 使得其识别难度数倍于传统场景。难点二:极低误报率要求下的违规内容过滤。上述场景中,违规内容出现的概率往往在万分之一甚至十万分之一,这就要求算法模型在不漏太多的情况下尽可能的减少误报(从而减少人工审核的工作量)。本次演讲,依图将结合自身经验,介绍如何有针对性的进行技术实现和方案设计,克服以上难点。

马展

南京大学电子学院 副教授、博士生导师

南京大学电子学院副教授,博导。2004年和2006年获华中科技大学学士和硕士学位,2011年获纽约大学(New York University)博士学位。2011年至2014年分别在三星电子美国研究院,华为美国研究院从事下一代视频压缩技术的研究和标准化工作。2015年获登峰计划支持,加入南京大学。长期从事视频信号处理和通信研究,并在视频处理能耗感知、视觉感知和计算等方面做出一系列开创性研究。发表学术论文60余篇,被Google Scholar引用1900余次,申请美国发明专利40多项,获得专利授权17项。多项专利技术被国际/国家标准采用。曾获863国家数字视音频编码特别贡献奖,2018 ACM SIGCOMM研究竞赛入围, 2018 PCM最佳论文入围, 和2019 IEEE 广播技术协会最佳论文。

演讲主题:

基于神经网络的自适应传输

内容简介:

网络是动态变化的,如带宽波动和意想不到的延迟,伤害用户的体验质量(QoE),而且全球网络媒体服务都需要面对这个问题。在这次演讲中,我们提出了一个神经自适应传输(NAT)框架解决全球网络规模下互动媒体服务的网络问题。整个神经自适应传输(NAT)系统有三个主要组成部分:一个基于学习的云覆盖层路由(COR)方案,通过绕过网络拥塞并找到最低延时路径,提供最佳传输路径;一个基于协同视频处理(CVP)系统的残余神经网络在设备端来协调端上的计算能力,通过学习分辨率缩放来改进QoE;还有一个深度强化学习(DRL)的自适应实时流(ARS)策略,用来选择适当的视频比特率,以获得最大QoE。我们验证过COR可以提高用户满意度5%到43%,CVP可以减少相同质量下带宽消耗的30%以上,基于DRL的ARS可以保证流媒体流畅度,QoE也可改善50%以上。

孙松林

北京邮电大学 信息与通信工程学院多媒体教研中心主任、博士生导师

博士生导师,现任北京邮电大学信息与通信工程学院多媒体教研中心主任、IEEE 高级会员、中国计算机学会 CCF 高级会员、ACM 会员。2003 年于北京邮电大学获得工学博士学位。研究方向为智能信号处理、视频编码与通信,在移动互联网安全技术国家工程实验室、可信分布式计算与服务教育部重点实验室从事科研工作。负责的留学研究生课程《通信综合实验》在 2016 年被教育部评为来华留学英语授课品牌课程,是目前获评的唯一的实验类课程。2014 年获得北京邮电大学“大学生创新实践工作突出贡献指导教师奖”。2016 年,赴美国马里兰大学参加“北京邮电大学优势学科全英文课程体系建设青年骨干教师海外研修计划”项目。2014 年、2015 年连续两年获得中国产学研合作创新成果奖。国家自然科学基金评审专家、教育部学位与研究生教育发展中心评审专家、北京航天飞行控制中心评审委员会专家。

演讲主题:

5G时代中音视频的机遇与挑战

内容简介:

在移动通信技术发展史上,从来没有像5G这样,让CT与IT技术如此紧密的结合在一起。5G的能力开放让更多的资源可以为开发者使用,系统解耦让更多的技术可以不断迭代更新,网络切片让更多的业务可以复用于同一张网络。
5G时代展示了一个全新的生态,由此对音视频的冲击不仅仅是高速率低时延,还有丰富的场景和业务。音视频编码技术在充分考虑了智能算法之后,开始考虑工业互联网场景,新场景新业务的爆发将是5G时代的重要特点。音视频应用也不再会局限于短视频,很多深度体验和强交互式业务将有可能获得新生。

郝连福

声网Agora 资深架构师

资深架构师,业界首屈一指的 Linux 内核技术专家,特别擅长于高性能系统架构设计,曾独立设计开发电信核心网专用操作系统,专用高性能高并发 TCP/IP 协议栈。加入声网Agora 前,曾先后担任副总工程师/研发总监(UTStarcom),Intel 资深技术专家,技术委员会执行委员/T4 技术专家(YY)等高级技术岗位。

演讲主题:

内容简介:

高速实时传输的拥塞控制

音视频数据的实时传输需要面对诸多复杂的网络问题。其中网络拥塞是最常见的影响实时音视频互动的问题。声网在全球部署了一个实时传输网,通过实时监控、基于智能路由算法的优化,实测平均延时 76ms,每天产生 3 亿分钟数的通话。本演讲将分享我们在高速实时传输的网络拥塞控制经验。

刘成城

微软 研发总监

2009年毕业于北京大学计算机系,就职于百度网页搜索部。2011年加入微软,2014年加入小冰团队。目前任微软小冰研发总监。

演讲主题:

微软小冰实时感官系统与未来发展趋势

内容简介:

微软小冰是微软(亚洲)互联网工程院研发的人工智能机器人。微软小冰实时感官系统是微软小冰的线下实时交互平台,她具有多种实时识别和动态捕捉的能力,并可以用户进行实时交互。本次演讲将会对实时感官系统全方位深度剖析,并以之为例介绍实时感官系统的构成与应用,引领听众探索其未来发展趋势。

盛骁杰

优酷 高级算法专家

阿里巴巴高级算法专家,VR 360视频和6DoF高自由度视频技术负责人,AVS标准VR/6DoF视频专题组联合组长。毕业于上海交通大学图像通信研究所,2013 年加入阿里巴巴,2016 年开始负责优酷8K VR端到端点播/直播系统的算法研究,架构搭建,5篇技术提案被AVS标准采纳。2017年开始同时负责优酷视频AI内容理解平台的搭建和下一代6DoF高自由度视频技术的研究,2019年在CUBA联赛中主导上线了国内首例体育直播场景中的6DoF视频体验。申请国内外专利30余项,7篇美国专利已获得授权。对于视频编解码,超高清视频处理,VR与6DoF视频,以及视频AI等领域有较大兴趣。

演讲主题:

6DoF视频技术赋能下一代3D化体育/综艺观看体验

内容简介:

6DoF视频是目前的2D平面视频和VR 360度视频的下一阶段视频技术,主要体现在两个方面,首先,6DoF视频能够使得普通的2D视频往3D化体验方向发展,其次,6DoF视频能够在目前VR 360视频提供的3DoF自由度基础上再进一步,达到6DoF的自由度体验。另外,从视频技术的发展来说,6DoF视频是视频技术和视觉技术的有机结合,从而提供了视频新产品形态的可能。
目前,6DoF视频技术已经开始逐步走出实验室预研阶段,在MPEG以及AVS标准建设的同时,在工业界的不同业务场景下也开始找到了新的用户价值。在体育和综艺场景下,如何通过6DoF技术来增强用户的3D化体验,使得内容的表达能够在3D的层面上更专业和更激动人心,是我们目前探索的一个重要方向。

秦昊

相芯科技 CTO

相芯科技首席技术官,于2016年取得浙江大学工学博士学位。先后于微软亚洲研究院以及美国Adobe研究院开展计算机图形学研究工作,发表ACM/IEEE期刊论文3篇,并获得多项中国及美国发明专利。2016年加入相芯科技,负责研发团队的组建及智能图形技术的研发工作,带领团队将前沿的智能图形技术落地为行业解决方案,并累计服务了超过400家企业客户。

演讲主题:

智能图形技术的进展及应用

内容简介:

视频内容正越来越成为互联网应用的主流。我们除了优化原生视频内容的传输外,如何给让视频更加智能、更加丰富则成了带宽红利时代的新课题。计算机图形学在电影、游戏领域已经发展了数十年,在新的消费级视频浪潮下,步入智能阶段的图形学在AR视频交互、AI视频合成、云渲染等方向上,可以给视频带来什么样的新价值,是本次演讲想要探讨的主题。

Tsahi Levent-Levi

WebRTC领域知名博客 BlogGeek.me 博主

W3C WebRTC 技术的布道师。超过20年的,软件通信领域工作经验。致力于帮助公司简化通信技术,创造优雅有效的解决方案。现在担任 testRTC 的联合创始人兼首席执行官,该公司专注于测试和监控 WebRTC 应用程序。

演讲主题:

Common WebRTC mistakes and how to avoid them

内容简介:

WebRTC as a VoIP technology is the best thing ever. It “democratizes” this whole domain, taking it from the hands of experts into the hands of the masses of developers out there. While this all seems easy now (and it is a lot easier than it used to be before WebRTC), there are a few mistakes that I see people make repeatedly. In this session, I will

陈炉军

阿里巴巴闲鱼事业部 无线专家

哈尔滨工业大学本硕,毕业6年多来一直专注于音视频技术在移动端上的产品落地。曾作为手机QQ音视频iOS客户端技术负责人,负责手机QQ音视频通话(双人,多人)的产品在客户端的研发工作。如今在闲鱼负责视频、图片等的多媒体链路开发及维护,致力于音视频框架的管线化、模块化以及Flutter化推进。

演讲主题:

Flutter浪潮下的音视频研发探索

内容简介:

分享主要针对闲鱼APP在当下流行的跨平台框架Flutter的大规模实践,介绍其在音视频领域碰到的一些困难以及解决方案。并带来了闲鱼基于Flutter的音视频开源框架TPM以及基于该框架完成的Flutter音视频开源插件如播放器、相册等等。

毛玉杰

声网Agora WebRTC高级架构师

2011年毕业于华东师范大学,原英特尔WebRTC核心研发工程师,2011年开始参与Android,Chromium,WebRTC等多个开源项目开发,常年活跃于开源社区,2014年成为WebRTC Committer,2015年加入声网Agora,主要负责WebRTC在服务端架构设计与开发,探索H5在音视频领域的应用。

演讲主题:

H5 实时音视频直播的技术探索

内容简介:

H5 直播在聊天群、企业协同应用、在线教育等场景下很常见。往常会被采用的 HLS、HTTP-FLV 存在延时高或流量大等缺点,而看似兼容广泛的 WebRTC 在不同手机上的编码格式又未得到统一。这使得 H5 直播的功能和实时性受到了限制。本次演讲将总结过去一年的研发实践,从前端技术选型、性能、兼容性等层面分享我们在 H5 实时直播上的经验。

杨尚林

美团 资深前端工程师

目前就职美团点评服务体验平台部,担任前端工程师。主要负责前端工程化、基础工具建设以及通讯业务相关的前端研发工作,探索WebRTC,Electron等技术在客户服务业务场景中的应用。

演讲主题:

实时通讯在美团客服的跨端应用实践

内容简介:

待定

丁建强

Bilibili 资深前端工程师

丁建强(Tuzkiss),现任 bilibili 资深前端工程师,2016 年加入 B 站之后一直从事 Web & H5 播放器方面工作。目前主要负责直播 web & H5 播放器项目、播放器内核研发、播放器平台化支持、播放器性能优化和用户体验优化等。

演讲主题:

MPEG-DASH 在 bilibili 的实践、优化与思考

内容简介:

伴随着音视频和网络技术的快速发展,音视频内容逐渐成为互联网内容的主流,而这些内容的用户体验也显得愈发重要。B 站一直致力于用户音视频播放体验的改善及优化,于去年正式引入并全量上线 MPEG-DASH 作为新的流媒体解决方案。上线之后经过多次版本迭代优化,最终实现 5分位秒开,卡顿率得到大幅优化,切换体验大幅提升,获得用户一致好评。

而我们 B 站使用的 MPEG-DASH 是一种自适应比特率串流技术,使高质量流媒体可以通过传统的 HTTP 网络服务器以互联网传递。MPEG-DASH 播放器可以无缝适应不断变化的用户网络或者缓冲区大小并提供高质量的播放体验,减少卡顿率。同时,基于 B 站现有的音视频技术,我们也在一直思考如何为用户带来更独特的内容,更炫酷的方式,以及更优质的体验等。

关涛

数美 研发中心总经理

数美研发中心总经理,北京大学计算机专业硕士,反欺诈、内容风控解决方案专家,负责基础架构与产品研发;10年大数据应用、人工智能 、反作弊算法经验。

演讲主题:

基于深度学习实时直播内容风控

内容简介:

随着互联网高速发展,直播场景日益丰富,违规音频视频图片已经泛滥成灾;同时国家内容监管日益趋严,监管政策集中出台,行政处罚愈发严格,实时内容风控日益重要,传统的人工方式也已经无法满足实时风控的需求,时代呼唤新的解决方案。数美基于深度学习技术,提出全栈式AI实时直播内容风控的解决方案,包括LSTM、RNN、CNN、GAN等深度学习模型,有效识别直播视频涉政、暴恐、涉黄等违规内容,保证内容合规,净化了网络环境。

刘阳

字节跳动 高级移动端图像算法工程师

目前在北京字节跳动网络科技有限公司AI Lab部门担任移动端算法工程师。在字节跳动工作期间推动了深度学习及CV技术相关技术在移动端的落地应用。参与了字节跳动深度学习及CV相关技术在移动端落地从无到有的整个过程,擅长为实际业务线上的CV算法需求在移动端提供落地解决方案

演讲主题:

深度学习CV算法在WebRTC领域的应用

孙博文

OnVideo 资深前端开发工程师

现任onvideo资深前端开发工程师。负责编辑器部分的核心功能开发。精通图像处理及动效制作,有着丰富的渲染和动效方面的开发经验

演讲主题:

基于 node-canvas 与 FFmpeg 的数据可视化视频合成

内容简介:

大多数数据可视化是将数据生成为图片。但将数据实时生成为可视化的视频也存在很大需求。如何将数据从 Web 前端输入,最后生成一个可视化的视频,并支持在前端预览?如何解决其中的性能挑战?完成数据的可视化之后,合成为视频会遇到什么坑?我们在本演讲中,将分享数据可视化从canvas做成video的开发思路和这个过程中的一些坑和痛点。

孙雨润

声网Agora 技术VP

负责全球音视频传输技术架构。原YY 后台架构师,主导Web YY整体后台系统架构搭建。曾任职腾讯QQ研究员 ,主导QQ空间面孔墙等项目;任职微软Microsoft 期间,参与高性能计算产品项目。

演讲主题:

软件定义实时网在5G时代的挑战与机遇(拟)

内容简介:

石柯

沪江CCTalk CCtalk服务端开发经理

多年互联网应用服务开发经验。曾就职于腾讯、巨人,现在任职沪江负责CCtalk服务端的架构和开发工作。先后在不同公司参与研发的软件有QQ、嘟嘟语音、CCtalk等。在IM、互动直播间、互动教学场景等方面耕耘多年。关注高并发高可用服务和大型互动教学场景的服务架构实践。

演讲主题:

高并发实时信令以及在教育场景的应用

内容简介:

在国内在线教育领域,CCtalk是功能完备,体验优秀的授课平台。不同于一般的秀场模式的直播间,在线教学中师生的双向互动是教学练测中很重要的环节。小型的互动直播教室可能很容易实现,在成长为10万人规模的直播教室的道路上会有哪些难点?大型直播教室内的人人参与的频繁文字发言为何被视作洪水猛兽?业务的堆叠与服务的效率之间怎么兼得? 分布式链路上的消息顺序问题怎么解决?服务宕机时怎么快速转移和恢复数据? 这些疑问本次演讲带您一窥究竟。

汪磊

Wishlife CTO

Wishlife 联合创始人兼CTO。他有超过 15 年的系统架构与安全相关研发经验。在 Wishlife 之前,他曾任 SuccessFactors(已被 SAP 收购)带领团队从无到有,设计研发了服务于数百万用户的产品。他也是GraphQL 的早起参与者,并是开源软件graphql-clj 的作者。在不写代码的时候,他会去海里冲浪和Tahoe 滑雪,他也是单板滑雪一级教练。

演讲主题:

利用Kubernetes 部署视频流录制服务器

内容简介:

深入浅出的介绍一个视频流录制服务器的实现,以及视频录制和应用服务器集成常见的坑。本演讲会通过一些实例,分享在生产环 境利用Kubernetes StatefulSet 和Helm Charts来实现实时部署可扩展的视频录制服务器集群。

Evan McGee

SignalWire CTO & Co-founder

Evan McGee是SignalWire的CTO和创始人,该公司通过简单的API的强大功能为所有技能水平的开发人员提供可编程的语音,消息和WebRTC通信。 Evan在电信行业拥有十多年的丰富经验,包括在无线MNO / MVNO,传统PSTN和VoIP / WebRTC OSS方面的技术和业务专业知识。 他拥有涵盖硬件和软件设计的专利和专利申请,并经常在会议上演讲,主题涉及容器化的全球SaaS部署,微服务架构以及实时设置中的机器学习应用。

演讲主题:

Creating a Global Multicloud RTC Framework with Docker

内容简介:

创建和运行一个现代化的、全球分布的RTC基础设施需要思考:如何以最有效的方式弹性的部署服务。许多云服务商已经表明,不再需要运行自己的数据中心;现在,Docker Swarm & Kubernetes等框架结合的API向我们表明,使用单一云服务商同样过时。本次演讲将具体讨论:在全球范围建立多云rtc基础设施的技术和业务考虑。

吉奇

声网Agora 资深技术架构师

硅谷回国码农一枚,现负责声网RTM实时信令云服务后台及SDK技术架构设计。毕业于中国科学技术大学和Clemson University,曾就职于Verizon,负责视频广告业务API平台及服务端设计实现,在大型分布式系统后台、网络传输优化及API架构设计和实践领域有深厚的经验积累。加入声网,全面负责RTM实时信令产品的架构设计与实现。钟爱在国内按硅谷时间工作。

演讲主题:

高并发场景下分布式实时消息系统的架构实践(拟)

内容简介:

待定

黄佳伟

滴滴出行 高级软件开发工程师

毕业于浙江大学,2016年加入滴滴,专注于日志系统构建,负责当前的滴滴大数据日志系统,承接20GB+/s的日志流量,拥有丰富的大数据开发经验。

演讲主题:

滴滴20GB+/S日志系统的架构设计

内容简介:

滴滴每天服务几千万人次出行的过程中,产生了20GB+/S的日志数据,这些数据需要及时、完整的同步到大数据体系中,以满足业务实时、离线数据加工的需求。面对数以万计的服务节点,复杂的线上环境,严格的资源消耗,秒级的延时要求,建设一个稳定、及时、安全的日志采集系统是一个充满挑战的问题

陈坤中

爱奇艺终端网络部 研究员

任职于爱奇艺直播云技术团队,任爱奇艺研究员,负责实时CDN的研发工作,方向包括基于rtmp的实时直播CDN以及基于RTC的超实时直播CDN,支持爱奇艺奇秀直播和游戏直播等业务。早前曾在摩托罗拉家庭事业部从事VOD系统研发工作。

演讲主题:

爱奇艺超低延时直播服务RTCDN系统的实现及应用

内容简介:

在实时互动直播服务中,低延迟、低卡顿一直是最核心的诉求,在一定的画质下,延迟越低、卡顿率越低直播体验就越好,主播和观众间的沟通就会越顺畅;典型的,在秀场直播和游戏直播中,当前业界常规延迟在2-5秒甚至更高,这带来一定的沟通延迟,影响了互动体验。基于此,爱奇艺研发了一套完全基于WebRTC的超低延时CDN系统,RTCDN(Real Time CDN),它即具备WebRTC的实时性,又具备CDN的高并发特性,同时兼顾卡顿率,来改善互动直播的体验。我将介绍爱奇艺RTCDN系统的工程实现和在直播中的应用情况。

聂永

新浪微博 技术专家

打杂多年,前后端都有涉及:Web Page、HTTP API、GraphQL、Erlang、Lua、Golang、Linux Kernel、TCP Server、UDP/QUIC、运维、测试等,也乐此不疲,自好比一块砖,哪里需要哪里填 :)。 个人喜好折腾,为公司贡献5项技术创新专利。

演讲主题:

新浪微博极速版四层接入网关的重构历程

内容简介:

这是一个直接处理四层数据的接入网关,同时为客户端提供TCP、HTTP等链路接入通道,本演讲将逐一介绍该网关从诞生、业务分离、增加插件机制等重构过程和设计理念等。

刘新翠

快狗打车 移动研发部负责人

演讲主题:

实时消息在同城货运场景中的设计与应用

内容简介:

实时消息相信大家都不陌生,在微信普及率极高的情况下、钉钉通过企业场景切入同样获得了成功,本次演讲给大家介绍一下快狗打车的IM设计,以及在短途货运这个独特的场景下的深度融合,希望大家能有所收获。

李超

前新东方集团 产品研发中心音视频技术专家

曾就职于新东方集团。在视频行业深耕近十年,具有丰富的音视频研发经验。精通 WebRTC 整体架构及其处理流程;对常见的 3A 问题(回音消除、降噪、增益)具有非常丰富的实战经验;对网络传输有独道的见解。

演讲主题:

WebRTC 从1对1到服务端的技术实践

WebRTC 降噪与回声消除

Lorenzo Miniero

Meetecho 董事长, 开源项目 Janus 联合创始人

那不勒斯费德里克二世大学计算机工程博士,Meetecho创始人兼董事长,开源项目Janus SFU联合创始人。资深WebRTC专家,IETF成员。

演讲主题:

Janus 服务端开发实践

赵晓涵

声网Agora 音频算法工程师

北京理工大学毕业,2018 年加入声网后担任音频算法工程师,主要负责编解码器SOLO X以及AI-PLC的研发,并参与SOLO的开源。个人对能切实带来便利性、提升幸福感的技术感兴趣。

演讲主题:

WebRTC 网络抗丢包策略