版权归原作者所有,如有侵权,请联系我们

[科普中国]-Illiac计算机

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

ILLIAC是一台采用64个处理单元在统一控制下进行处理的阵列机。ILLIAC的中央处理装置分成了四个可以执行单独指令组的控制器,每个控制器管理数个处理单元,总共有256个处理单元。美国ILLIAC-IV计算机,是第一台全面使用大规模集成电路作为逻辑元件和存储器的计算机,它的出现标志着计算机的发展已到了第四代。

基本概念ILLIAC是一台采用64个处理单元在统一控制下进行处理的阵列机。为了以较低的成本得到很高的速度,ILLIAC的中央处理装置分成了四个可以执行单独指令组的控制器,每个控制器管理数个处理单元,总共有256个处理单元。每个处理单元可以作为一个运算和逻样装置, 具有它自己的2048字(每字64位)存片器,并能和所有其它的处理单元发生联系。由于运算和逻辑功能分配在256个处理单元上,因此ILLIAC可以同时完成很多类型数据结构的操作。根据这种平行机理,就要求处理单元本身是一台快速计算机,存储器周期小于300ns,64位的浮点加法为250ns,二个64位数的浮点乘法为450ns。

美国ILLIAC-IV计算机,是第一台全面使用大规模集成电路作为逻辑元件和存储器的计算机,它的出现标志着计算机的发展已到了第四代。

ILLIAC系统结构如图所示是ILLIAC系统的结构图。

它由四个单独的CU,每个CU驱动带有64个PE存储器的PE。各CU的连接线允许所有的CU精确地执行同一指令流,在这种“联合” 操作方式时,程序传送是跨象限的,是首尾相接的。

立体型设计立体型计算机一台立体型计算机根据其功能特点表示为下图:

它包括:

(1)保存操作数和指令的存储器。

(2)一台控制制器,它从存储器取出指令,对指令译码,发出操作或驱动的控制信号(微序列脉冲)。

(3)一台运算器,对由存储器取出的操作数进行运算(加、逻辑操作、乘),并将结果送回存储器。事实上,控制器监视和控制在存储器与运算器之简的信息流动情况,并对运算器进行操作。

ILLIAC立体型设计下图给出了ILLIAC设计中如何对立体型设计进行了修改,该图只给出了一个象限,也可以说是四分之一的ILLIAC列阵。

其控制器的工作方式与立体型计算机中控制器的工作极端相像,指令从存储器到控制器,并在其中进行,然后产生微序列信号。这种微序列信号重复64次,每组送到一个单独的运算器。同样的信号控制64个不同的运算
器,从而使运算器运算的数量增加了64倍。一个运算器定为一个“处理单元”(PE),64个PE中的每一个都有一个存储器,而且只能与它自己的存储器发生取数与存数的关系,然而控制器却能从64个存储器中的任一个中取出
指令,这种每个运算器只能与它单一的存储器执行存储器操作的限制解决了某些问题, 但也带来了某些另外的难题。

ILLIAC各部分功能处理单元ILLIAC的处理单元基本上是一个四寄存器的运算器。有一个A寄存器和一个B寄存器,用以存放运算操作和逻辑操作的操作数,执行运算操作时,其操作数一个放在A寄存器中,一个放在B寄存器中,结果留在A寄存器中。S寄存器作为暂用存储器,以防止利用中简结果时重复地动周存储器。R寄存器用作程序传送时PE之间的信息转换。这些寄存器的字长都是64位。下图是ILLIAC的处理单元和处理单元存储器:

控制器ILLIAC的机器语言指令由32 位组成,PLA中的64字(每字64位)提供128条指合的排队,多至128条指令的循环执行时不需与PE存储器打交道。64字分成8组,每组8个字。当控制器正在执行的指令进入8字的第5个字时,它就检验下一个8个字是否已经放入PLA,如果还没有进人PLA ,则就发出命令,把它们送入PLA,同时把原来的8个字清除。这就有效地减少了由于取指令而产生的大量延迟时间,但下述情况除外,即向程序的一部分执行转移,而该程序不在PLA中。对大量的已被模拟的程序来说,已发现控制器为了等待从存储器取出指令的延迟时间大大小于原需时间的1 %。

下图是控制器中主要部分的功能图:

控制器(CU)和处理单元(PE)的通讯在CU和PE间转换操作数与信息,可用下述几种方法:

(1)CU可以同时向所有的PE送出一个64位的字,该字原来可在CU的局部存储器中,或CU的运算器中。其目的地可为PE的64位操作寄存器中的任何一个。

(2)CU把64位的字送到PE,每个PE用一位,即第一位至 ,第二位至 …第64位至 。每位所到的目的地可为每个PE中8个1位寄存器中的任一个,这就是使PE响应或不响应的方法。

(3)CU以上述相反的方法从PE接收信息,即从每个PE的1位寄存器中取样一位,在CU中组合成一个64位的字,利用这个方便,CU就可以借助于64个不同的PE的一位模寄存器来的64位字,判断哪个PE是响应的。

(4)CU可把任一PE存储器的字取至局部数据存储器或PLA,这种取数可以是一个64位字的传送,也可以是8个相接的64位字的传送。8个相接字的取出仅比单个字的取出需要稍长的时间,因此是把PE存储器的数成批进入CU的快速方法。所有送至PLA的取数操作都是自动进行的1。

本词条内容贡献者为:

冯丽萍 - 教授 - 太原师范学院计算机系