华为重磅发布网络AI领域10大公开数据集

2020年3月20日,在华为开发者大会HDC.Cloud 3月20号直播间,华为网络人工智能数据湖专家周尧,向开发者们正式发布了网络AI领域10大公开数据集,解决了网络AI开发缺乏工业级数据的难题。

这10大数据集是华为从外场仿真数据和实验室模拟数据,经过解析治理、探索标注之后的,可以直接应用于网络领域AI应用开发的数据集。分为“异常检测类”、“控制优化类”、和“故障定界类”三大类:

3) 硬盘故障检测数据集:覆盖日立,希捷共计16款硬盘型号,累积标注坏盘数量超2300块,应用于硬盘故障预测类问题分析与研究;样本量超230W条,特征维度超100维(覆盖厂商公开SMART指标)

贵州境内铜仁机场国际航班年旅客吞吐量突破3万人次;兴义机场年旅客吞吐量突破138万人次,再创新高;黎平机场拓展通航业务,不断拓展航空客货市场;凯里黄平机场围绕“两翼齐飞”目标,实现通用和运输共同推进;荔波机场加大航旅结合开发力度,加密贵阳至荔波航线,打造“云上公交”“中转联程”,促进干支联动。

现在使用华为云账号登录华为云,选择NAIE服务(路径:EI企业智能―智能体―网络智能体 NAIE),再从AI服务目录选择数据集服务,即可进入数据集服务页面选择所需公开数据集(https://www.hwtelcloud.com/products/dsi)。

9) 无线&微波故障数据集:告警数据基于无线基站、动力环境、微波等设备拓扑进行关联,利用工单数据完成根因告警标注,覆盖29种故障类型,可用于告警压缩和故障定位,样本量100w+条,特征维度46维

5) 数据中心PUE优化数据集:覆盖3种制冷场景、4种末端空调、冷站群控、IT机房等设备能耗数据,基于冷却系统完成关联,应用于PUE优化、网络领域控制类模型开发与研究;样本量2W条,特征维度110维

8) 无线&PTN故障数据集:告警数据基于无线基站、动力环境、PTN等设备拓扑进行关联,利用工单数据完成根因告警标注,覆盖48种故障类型,可用于告警压缩和故障定位,样本量100w+条,特征维度61维

1) 性能指标异常检测数据集:时间序列数据集,包括正样本和负样本,可应用于时序序列预测等算法的训练和验证;样本量100W条,特征维度7维

返岗员工在食堂内一人一桌就餐。于晶 摄

2) 性能指标变更监控测数据集:覆盖4种网络业务变更场景,包括变更成功场景和失败场景,失败场景数据有对应标签;样本量100W条,特征维度40维

图为贵阳龙洞堡国际机场。机场集团供图

2019年,贵州省机场集团密织航线网络,深化“一枢纽十支”战略布局。累计执飞航线252条,通航点132个,航线网络通达全国所有直辖市、省会城市、副省级城市、重要旅游城市及部分三、四线城市;国际航线新增法国巴黎、澳大利亚墨尔本、尼泊尔加德满都等;加密至澳门及泰国的航线航班完成国际地区旅客运输74.89万人次,同比增长33.24%。

吃完晚餐后园区企业安排专车将员工送回银川家中。于晶 摄

随后,专车还将前往中卫、吴忠,甚至周边省份完成接人任务,被接回的职工均经过县一级的健康核查与出行轨迹追踪,并出具15天无外出证明,返银后无特殊情况可直接上岗,无需隔离。

数据和特征决定了机器学习的上限,华为发布网络领域10大数据集,不但可以帮助网络AI开发者减少90%的数据集准备时间,更重要的是将会极大提高AI模型精度。目前已验证数据中心数据集助力AI模型达准确率达到89.77%,无线&IPRAN故障数据集提高高级聚合率到95.4%,查准率到90%。

7) 无线&IPRAN故障数据集:告警数据基于无线接入和IPRAN的设备拓扑进行关联,利用工单数据完成根因告警标注,覆盖37种故障类型,可用于告警压缩和故障定位,样本量700w+条,特征维度24维

其他一些英超俱乐部,已经关闭了自己的训练基地,包括出现病例和症状案例的阿森纳和埃弗顿。

10) PON光路故障数据集:PON光路故障场景数据,包含光纤弯曲、连接器松动等故障场景,覆盖光模块的电压,电流,接收光功率,发送光功率等特征,样本量4w条,特征维度11维

据了解,固原市是宁夏劳动力输出大市,为了让职工们能早日外出返岗,固原市在做好疫情防控的同时,也积极与银川经济技术开发区沟通协调,全力支持和组织推动务工人员回银川返岗,通过联合相关部门,建立了“点对点、一站式”的运输方式,确保全市务工人员安全、即时返岗复工。

银川经济技术开发区相关负责人表示,固原返银务工人员回到了岗位,对于银川经济技术开发区来说,新的挑战也接踵而至。在疫情防控期间的劳务对接有别于以往,不仅要实现高效精准对接,还要实现安全有序协作。接下来,银川经开区也将以最为全面严格的措施,在保障园区企业职工疫情期间健康安全的前提下,与时间赛跑,开足马力搞生产,抢回失去的一个月。(完)

6) 无线接入故障数据集:覆盖20种无线接入故障类型,告警数据与工单数据相关关联,业务专家团队准确标注,可用于告警压缩和根因定位类模型开发,样本量65w条,特征维度7维

2020年3月-4月华为开发者大会HDC.Cloud上,华为网络人工智能(NAIE)论坛将在线上直播,欢迎大家关注公众号【网络人工智能园地】,点击菜单【HDC】,接入我们的直播和专家线上探讨交流!

工作人员在固原市客运站对返岗员工进行体温检测。于晶 摄

2019年,贵阳机场西北站坪正式投用,停机位新增至56个;三期扩建工程首次在喀斯特地貌下使用双套管双驱动全回转工艺进行超长桩桩基工程建设;基本完成二跑道道面混凝土浇筑工程,完成配套16个项目开工等节点目标;持续推进T3航站楼前综合体和兴义土地开发等项目进度。(完)

4) 数据中心群控数据集:包含冷塔、冷机、泵等设备的供回水温度、压力、IT机房、冷站设备能耗100+维特征,可应用于数据中心水冷冷冻水场景制冷系统优化模型训练;样本量2W条,特征维度100维

同时,记者也了解到,首站接返务工人员的目的地选择固原,也是为了精准施策,助力贫困劳动力有序返岗就业,促进宁夏脱贫攻坚工作再上新台阶。