加密业务运维提升方法
作者 李卓然 王婕 高宁乐 李佳鹏
发表于 2025年11月

【摘 要】在5G网络中,某视频平台点播流量占全网视频流量的44.53%,其中超文本传输安全协议(Hypertext Transfer Protocol Secure,HTTPS)流量(加密)占比达92%。加密协议使应用层信息不可见,预加载机制导致初始缓存时长识别偏差,致使基于传输控制协议(Transmission Control Protocol,TCP)/超文本传输协议(Hypertext Transfer Protocol,HTTP)的传统评价体系失效,具体表现为:加密业务指标无法识别;视频卡顿时长计算误差;质量投诉溯源困难。文章通过构建该平台点播在线业务识别系统,采用入侵检测与防御集成(Intrusion Detection and Prevention Integrated,IDPI)+基于联邦智能的入侵检测(Intrusion Detection with Federated Intelligence,IDFI)技术实现加密流量识别,通过应用梯度提升决策树(Gradient Boosting Decision Tree,GBDT)算法,构建初始卡顿时长模型,解决预加载机制引发的识别偏差问题。

【关键词】5G网络;点播;加密流量识别;卡顿时长预测;预加载机制

引言

5G网络中,某视频平台点播流量占比高达44.53%,其中92%为HTTPS加密流量。加密协议导致应用层信息不可见,加之短视频预加载机制干扰了传统基于TCP/HTTP的评价体系,引发关键指标无法识别、卡顿时长计算误差及质差溯源困难。本研究针对该平台点播场景,提出融合IDPI/IDFI加密流量识别技术与机器学习的方法:应用GBDT算法构建卡顿时长预测模型解决预加载偏差,并采用高斯混合模型(Gaussian Mixture Model,GMM)聚类与贝叶斯分类实现质差规则自学习与根因溯源[1]。

一、方案概述

本研究采用“机器学习”的GBDT算法,利用弱分类器迭代训练以得到最优模型,学习卡顿时长模型,解决预加载机制引起的卡顿时长不准问题。算法主要包含四个步骤:加密短视频数据流清洗、加密视频流的特征计算与向量化、决策树训练、GBDT加密关键质量指标(Key Quality Indicator,KQI)模型训练。

二、加密业务识别

基于一种点播HTTPS加密部分卡顿时长与频次的识别方法。该方法不需要对加密数据进行解密,而是通过流特征和包特征等方式对卡顿指标进行拟合,实现了对具体视频内容卡顿问题的准确识别,包括以下步骤。

(一)业务模式分析,多线VS单线。

用户通常感知到的初始缓冲时间是打开应用(Application,App)时(或者其等效操作)的第一个短视频的加载。在其后的每个短视频数据通常是在前序视频播放的同时缓存下载,因此用户通常感知不到其缓冲时间。而长视频不同,通常是点击操作后开始加载播放,用户在每个新视频源加载播放时都能感知到缓冲时间。

由于短视频App预加载机制的影响,用户下载视频A的时刻和播放视频A的时刻通常存在一定时间差,有时候甚至只下载,并不会开始真正的播放,为从数据下载角度评估数据播放感知带来了很大困难。

(二)视频流数据标签特征表征

流特征分析通过对网络流量和丢包率等指标进行分析,发现视频流卡顿。一般,网络流量值异常较大或者丢包率升高就意味着出现了网络拥塞现象,由于网络拥塞容易引起视频卡顿,所以对其进行实时监控并采取相应的措施能够很好地避免卡顿问题的发生,有利于用户的正常观看体验。

关于包特征分析,更多地关注数据包的大小、间隔时间等数据包自身的特征。由于数据包大小不一、间隔时间不同会引起视频传输不稳定,导致视频播放抖动。因此,对于视频帧,根据其自身所在的包特征加以判断,即可推测出当前视频帧所处状态,从而在卡顿检测时更加准确地发现视频可能出现的问题。

通过用户界面(User Interface,UI)自动化技术,研究人员用某个App的调试接口或者是直接运行这个App本身,对所有关键要素进行了视频播放的过程录制,包括视频大小、播放的分辨率等,将采集的信息进行一系列加工后,最终变成算法需要的标签信息,即体验质量(Quality of Experience,QoE)相关的指标值。

本文刊登于《消费电子》2025年23期
龙源期刊网正版版权
更多文章来自
订阅