任务目标:研究基于容器架构支持区块链的大数据分布式高性能存储、计算和管理技术;供应链过程数据的区块链和大数据平台相结合的可信计算技术;交互式、无编程、可视化的大数据建模和分析技术;基于多源数据的智能化运维技术。

研究进展:该任务参与单位中的星环科技项目团队主要针对该任务中的研究内容一和内容三开展研发工作,实现了集数据存储、分布式计算、数据分析挖掘及数据可视化于一体的大数据服务平台。能够支撑海量数据的高性能存储、分布计算、语义检索等多种分析需求。通过星环科技自主研发的统一存储技术,项目团队实现GB~PB级多源异构数据的高效存储和统一管理,支持组合、全文、语义等多种搜索方式,提供了交互式、无编程、可视化的大数据建模和分析能力。基于该平台,可以快速完成从特征工程、模型训练到模型上线的机器学习全生命周期开发工作。

清华大学项目团队针对该任务中的研究内容四“基于多源数据的智能化运维技术”开展研究。项目前期主要研究多源数据的安全事件(风险)建模和识别问题,多源数据即日志(logs)信息、指标(metrics)信息和调用链(traces)信息。围绕以上多源数据,充分挖掘、利用数据中蕴含的异常、安全等信息,建立异常事件发现、识别模型,并借助IT领域较为完善的数据进行了丰富的实验评估。

该任务相关成果目前已发表/录用论文7篇,申请发明专利10项(均已获得授权),申请软件著作权4项,完成对应4项技术指标的1份第三方评测报告,解决就业岗位10个