Technical data

Optimizing with MACRO-32
Example 3–10 (Cont.) Matrix Multiply—Optimal
vsmulf B(K,J),v0,v1
vvaddf v1,v2,v2
vstl v2,C(I,J),#4 ;
vsmulf B(K,J+1),v0,v1
vvaddf v1,v3,v3
vstl v3,C(I,J+1),#4 ;
vsmulf B(K,J+2),v0,v1
vvaddf v1,v4,v4
vstl v4,C(I,J+2),#4 ;
vsmulf B(K,J+3),v0,v1
vvaddf v1,v5,v5
vstl v5,C(I,J+3),#4 ;
vsmulf B(K,J+4),v0,v1
vvaddf v1,v6,v6
vstl v6,C(I,J+4),#4 ;
vsmulf B(K,J+5),v0,v1
vvaddf v1,v7,v7
vstl v7,C(I,J+5),#4 ;
vsmulf B(K,J+6),v0,v1
vvaddf v1,v8,v8
vstl v8,C(I,J+6),#4 ;
vsmulf B(K,J+7),v0,v1
vvaddf v1,v9,v9
vstl v9,C(I,J+7),#4 ;
vsmulf B(K,J+8),v0,v1
vvaddf v1,v10,v10
vstl v10,C(I,J+8),#4 ;
vsmulf B(K,J+9),v0,v1
vvaddf v1,v11,v11
vstl v11,C(I,J+9),#4 ;
vsmulf B(K,J+10),v0,v1
vvaddf v1,v12,v12
vstl v12,C(I,J+10),#4 ;
vsmulf B(K,J+11),v0,v1
vvaddf v1,v13,v13
vstl v13,C(I,J+11),#4 ;
vsmulf B(K,J+12),v0,v1
vvaddf v1,v14,v14
vstl v14,C(I,J+12),#4 ;
vsmulf B(K,J+13),v0,v1
vvaddf v1,v15,v15
vstl v15,C(I,J+13),#4 ;
; update
;
Example 3–10 Cont’d on next page
3–28