近期,软件工程科研团队利用暑期时间(8月13、14、20、21),针对学院老师和学生对大数据处理技术学习的需求,邀请了陕西省信息化工程研究院开发部主任梁小江来到软件工程实验室,进行了“基于Hadoop生态系统构建大数据处理平台”的实战培训,曹菡、祁超、张莉、张汇泉、程适、田丰等老师和部分研究生、本科生参加了此次培训。
本次培训包括Hadoop生态系统相关概念介绍和平台技术现场演示,首先介绍了基于Ambari搭建Hadoop生态系统的方法,重点对Ambari的自动化部署组件进行了说明。接下来则对Hadoop生态系统的基础—HDFS分布式文件系统的原理及使用方法进行了详细讲解,通过具体的例子,让各位学员了解HDFS的关键概念及相关技术,为后面的自学打下基础。
本次培训得到了学院的大力支持,培训时间紧凑、内容饱满,涵盖了Hadoop生态系统从底层到上层的关键核心组件,包括HDFS分布式文件系统、HIVE数据仓库、HBASE、内存计算框架SPARK、管理组件ZOOKEEPER、通信组件KAFKA、以及用于大数据处理的函数式开发语言SCALA等。通过本次培训,各位学员对大数据处理技术有了全面的认识,对涉及的关键组件的使用方法有了基本的了解,从而为后期进行大数据的相关研究和开发做了很好的铺垫。