无障碍
x

全部频道

中国> 正文

VIPKID亮相中国系统架构师大会 烽火台系统攻克故障监控与预警难题

2019-11-04 21:08 北国网

来源标题:VIPKID亮相中国系统架构师大会 烽火台系统攻克故障监控与预警难题

近日,第十一届中国系统架构师大会在京召开,来自互联网、金融、在线教育、电商等领域的100余位技术精英参会,带来了一场最具价值的技术交流盛会。在线教育企业VIPKID基础架构部基础平台负责人杨志强受邀出席,并分享了VIPKID烽火台系统在自动识别风险故障、进行根源分析和提前预测,以及创新性解决监控数据的采集通路过长等方面的实践经验。

VIPKID基础架构部基础平台负责人杨志强

自2013年成立至今,VIPKID平台用户数量实现了从0到70万的指数级增长,同时VIPKID的业务场景也产生了跨越式迭代。区别于其他教育平台,VIPKID具有跨全球、跨多云、高敏感、大规模、多模式的业务场景特点。此外,VIPKID平台围绕课堂构建的教材、IT-TEST、教师、家长、学生、LP、CC、客服等一系列业务复杂场景,也大大增加了VIPKID协作系统中故障发生的概率。

杨志强提出,智能化故障监控解决方案是对流量层、服务层、数据层的异常风险点进行全面数据采集和智能化监控,监控系统发出告警后会通过烽火台系统进行分发和送达,并实时发现持续的大颗粒风险,同时烽火台系统还会对告警大颗粒的风险进行筛选,对于持续的风险预警,将会升级成故障播报。此外,烽火台系统将通过分钟级故障播报、故障规则训练、智能化分析、自动化识别,产生自愈策略及自愈处理完成故障修复,并生成系统故障质量报告,通过运营周报通知所有研发同事,极大地减少了公司故障的发生。

VIPKID监控告警系统-天网系统

针对现阶段告警发现、处理、协作、跟踪问题多,效率低下、无法量化的现状,杨志强认为告警的预测性和针对性至关重要。目前,VIPKID烽火台预警播报已实现了3分钟持续风险的提前预警、电话、短信、钉钉、邮件等多端播报及高效协作处置风险。其中,风险播报中心已制定了人工播报、系统播报、研发跟进三个阶段的运营策略,大大提升了问题发现率、播报及跟进效率。

此外,杨志强还对智能化运维中的告警智能化分析及智能告警方案设计进行了补充介绍,基于VIPKID基础架构部,团队构建了整个监控告警系统的设计架构——天网系统,目前已完成包括告警计算、风险预警播报、订阅中心、质量报告、告警统计、问题归因分析在内的烽火台告警分析。杨志强表示,未来将继续通过与大数据算法团队的共同协作开发故障定位系统,“希望通过天网系统实现更加完善的智能告警设计,提升告警系统的智能化水平,为小学员的每一节课保驾护航。”

责任编辑:岳崎(QN0012)

为你推荐

加载更多

北京千龙新闻网络传播有限责任公司版权所有 未经千龙新闻网书面特别授权,请勿转载或建立镜像,违者依法必究新出网证(京)字013号 增值电信业务经营许可证 2-2-1-2004139 跨地区增值电信业务许可证

信息网络传播视听节目许可证0104056号 互联网新闻信息服务许可证11120180003号 京公网安备 11000002000007号

分享到:
QQ空间 新浪微博 微信 腾讯微博 QQ好友 百度首页 腾讯朋友 有道云笔记