Technical data

Optimizing with MACRO-32
Example 3–10 (Cont.) Matrix Multiply—Optimal
vvaddf v1,v5,v5 ;
vsmulf B(K,J+4),v0,v1
vvaddf v1,v6,v6 ;
vsmulf B(K,J+5),v0,v1
vvaddf v1,v7,v7 ;
vsmulf B(K,J+6),v0,v1
vvaddf v1,v8,v8 ;
vsmulf B(K,J+7),v0,v1
vvaddf v1,v9,v9 ;
vsmulf B(K,J+8),v0,v1
vvaddf v1,v10,v10 ;
vsmulf B(K,J+9),v0,v1
vvaddf v1,v11,v11 ;
vsmulf B(K,J+10),v0,v1
vvaddf v1,v12,v12 ;
vsmulf B(K,J+11),v0,v1
vvaddf v1,v13,v13 ;
vsmulf B(K,J+12),v0,v1
vvaddf v1,v14,v14 ;
vsmulf B(K,J+13),v0,v1
vvaddf v1,v15,v15 ;
; update
;
INC K
IF (K < N) GOTO LOOP1 ;Loop for all values of K
;
;last element
loopa1: ;
;load col of A
;
vldl A(I,K),#4,v0 ;
;mul, add and store
;
Example 3–10 Cont’d on next page
3–27