高效能计算机系统——若干关键技术分析
作者: 曾宇
出版时间:2010-01-29
出版社:高等教育出版社
- 高等教育出版社
- 9787040284096
- 1版
- 98609
- 46254663-1
- 平装
- 异16开
- 2010-01-29
- 370
- 274
- 工学
- 计算机科学与技术
- TP303
- 计算机与信息
- 本科 继续教育(成教、自考等)
本书对大规模高性能计算机如何降低能耗、提升效能并减少管理的复杂度等若干关键技术进行了阐述,主要内容包括:自适应功耗管理技术、自主管理技术、应用加速技术、高密度节点技术、网络内存技术、事件流应用技术、并行模拟技术等,并介绍了并行模拟引擎SimK的设计与实现,最后给出了高效能计算机曙光5000A的相对效能评价结果。
本书可供从事高性能计算机研究及应用的科研人员使用,也可作为高年级本科生及研究生学习高性能计算相关课程的参考书。
前辅文
第1章 引言
1.1 高性能计算机的应用
1.2 高效能计算机的技术挑战
1.3 高效能计算机
1.4 本书的组织
第2章 自适应功耗管理技术
2.1 概述
2.2 相关研究
2.2.1 CPU功耗控制
2.2.2 CPU工作频率控制策略
2.2.3 冷却技术
2.2.4 系统级节能技术
2.3 自适应功耗管理
2.3.1 框架结构
2.3.2 基于自适应功耗管理的作业调度
2.3.3 性能评测
2.4 机群功耗管理软件的实现
2.4.1 软件流程
2.4.2 功耗限制
2.4.3 节点任务调度
2.5 应用效果
2.6 小结
第3章 自主管理技术
3.1 概述
3.2 相关研究
3.2.1 自主计算模型
3.2.2 自主计算体系结构
3.2.3 自主元素
3.2.4 自主计算系统
3.3 分布式层次化自主管理
3.3.1 自主管理系统框架
3.3.2 自主管理元素
3.3.3 逻辑分区
3.3.4 选举
3.3.5 告警关联推理
3.4 机群自主管理软件的实现
3.4.1 Gridview架构
3.4.2 基于485总线的全局信息融合机制
3.4.3 统一监控管理策略
3.4.4 本地事件关联分析机制
3.5 小结
第4章 应用加速技术
4.1 概述
4.2 相关研究
4.2.1 构成方式
4.2.2 Cray XD1系统
4.2.3 SGI Altix系统
4.2.4 东京工业大学Tich系统
4.3 高性能计算机应用加速部件
4.4 BLAS加速的研究
4.4.1 BLAS简介
4.4.2 I/O的设计
4.4.3 运算供数的设计
4.4.4 运算器设计
4.4.5 乘加器的操作原理
4.4.6 整机加速效果的预测
4.5 面向网络安全的应用加速卡
4.5.1 逻辑结构
4.5.2 数据预处理模块
4.5.3 规则过滤模块
4.5.4 硬件实现
4.5.5 性能评价
4.6 小结
第5章 高密度节点技术
5.1 相关研究
5.1.1 高性能计算机节点
5.1.2 对称多处理机系统
5.1.3 大规模并行处理机系统
5.1.4 分布式共享存储多处理机系统
5.1.5 机群系统
5.1.6 刀片服务器
5.2 高密度节点的设计原则
5.3 高密度节点的实现
5.3.1 总体结构
5.3.2 刀片模块
5.3.3 管理模块
5.3.4 监控子卡
5.3.5 交换模块
5.3.6 I/O模块
5.3.7 散热分析
5.4 支持虚拟化的网卡研究
5.5 高密度计算节点对比分析
5.6 小结
第6章 网络内存技术
6.1 网络内存系统相关研究
6.1.1 相关研究系统
6.1.2 相关技术
6.1.3 现有网络内存系统存在的问题
6.2 网络内存研究内容
6.2.1 系统结构
6.2.2 客户端实现形式
6.2.3 动态内存资源管理
6.2.4 可靠性
6.2.5 性能优化
6.3 网络内存系统设计与实现
6.3.1 网络内存系统设计
6.3.2 NMS客户端设计与实现
6.3.3 服务端设计与实现
6.3.4 实验及评价
6.4 网络内存性能优化
6.4.1 预取技术
6.4.2 主动内存
6.4.3 二级缓存管理
6.4.4 实验及评价
6.5 小结
第7章 事件流应用技术
7.1 概述
7.2 相关技术研究
7.2.1 数据流研究
7.2.2 决策支持系统
7.2.3 数据密集的超级计算
7.2.4 时间序列数据
7.2.5 事件流的特征
7.3 事件流应用技术
7.3.1 DBroker
7.3.2 并行查询处理
7.3.3 负载特征分析
7.3.4 并发查询调度
7.4 基于网络监控应用的事件流应用系统的设计与实现
7.4.1 系统的数据特征分析
7.4.2 基于信息熵聚类的查询特征分析
7.4.3 基于分段的资源共享模型并发查询调度
7.4.4 并行查询引擎的设计与实现
7.5 小结
第8章 并行模拟技术
8.1 概述
8.2 背景及相关研究
8.2.1 高性能计算机的模拟
8.2.2 部件模拟关键技术
8.2.3 并行模拟关键技术
8.2.4 模拟器平台
8.3 并行模拟器关键技术
8.3.1 并行模拟器体系结构
8.3.2 基于阻塞/唤醒机制的同步机制
8.3.3 锁避免调度技术
8.3.4 高性能通信技术
8.3.5 多线程缓冲区优化
8.3.6 超步执行技术
8.3.7 性能评价
8.4 细粒度模拟下的动态负载平衡技术
8.4.1 动态负载平衡的重要性
8.4.2 细粒度模拟负载特征分析
8.4.3 迁移机制的设计
8.4.4 迁移机制的实现
8.4.5 性能评价
8.5 小结
第9章 并行模拟引擎SimK
9.1 引言
9.2 SimK的设计与实现
9.2.1 设计方法
9.2.2 实现机制
9.3 SimK优化及适用性讨论
9.3.1 同步优化
9.3.2 进程间通信优化
9.3.3 对不同体系结构模拟器的支持
9.3.4 多粒度模拟模块集成
9.4 基于SimK的HPP结构模拟平台
9.4.1 HPP模拟平台结构
9.4.2 HPP节点模拟
9.4.3 千万亿次计算机互连网络模拟
9.4.4 HPP节点系统软件
9.4.5 性能评价
9.5 小结
第10章 曙光5000A的实现与评价
10.1 曙光5000A总体架构
10.2 硬件系统
10.3 软件系统
10.4 冷却子系统
10.5 性能评测
10.5.1 网络性能
10.5.2 NPB测试
10.5.3 Linpack测试
10.6 高效能评价
10.6.1 高性能计算机的评价方法
10.6.2 相关研究
10.6.3 RPI相对效能评价指标
10.6.4 曙光5000A的高效能评价
10.7 整机对比分析
10.8 小结
参考文献