| @@ -310,7 +310,6 @@ | |||
| vmovddup -1 * SIZE(AO), %xmm8 | |||
| vmulpd %xmm3 , %xmm8 , %xmm3 | |||
| vmovsd %xmm0 , 0 * SIZE(CO1) | |||
| vmovsd %xmm1 , 1 * SIZE(CO1) | |||
| vmovsd %xmm2 , 2 * SIZE(CO1) | |||
| @@ -359,7 +358,6 @@ | |||
| vmovddup -13 * SIZE(AO), %xmm8 | |||
| vmulpd %xmm1 , %xmm8 , %xmm1 | |||
| vmovsd %xmm0 , 0 * SIZE(CO1) | |||
| vmovsd %xmm1 , 1 * SIZE(CO1) | |||
| @@ -481,7 +479,6 @@ | |||
| vmulsd 47 * SIZE(AO), %xmm7 , %xmm7 | |||
| vmovsd %xmm0 , 0 * SIZE(CO1) | |||
| vmovsd %xmm1 , 1 * SIZE(CO1) | |||
| vmovsd %xmm2 , 2 * SIZE(CO1) | |||
| @@ -706,7 +703,7 @@ | |||
| leaq (AO, %rax, 8), AO | |||
| leaq (BO, %rax, 2), BO | |||
| negq %rax | |||
| NOBRANCH | |||
| je .L56 | |||
| ALIGN_4 | |||
| @@ -765,10 +762,10 @@ | |||
| movq B, BO | |||
| pxor %xmm8, %xmm8 | |||
| pxor %xmm9, %xmm9 | |||
| pxor %xmm10, %xmm10 | |||
| pxor %xmm11, %xmm11 | |||
| vxorpd %xmm8 , %xmm8 , %xmm8 | |||
| vxorpd %xmm9 , %xmm9 , %xmm9 | |||
| vxorpd %xmm10, %xmm10, %xmm10 | |||
| vxorpd %xmm11, %xmm11, %xmm11 | |||
| movq KK, %rax | |||
| andq $-4, %rax | |||
| @@ -776,7 +773,7 @@ | |||
| leaq (AO, %rax, 4), AO | |||
| leaq (BO, %rax, 2), BO | |||
| negq %rax | |||
| NOBRANCH | |||
| je .L56_A | |||
| ALIGN_4 | |||
| @@ -835,8 +832,8 @@ | |||
| .L61: | |||
| movq B, BO | |||
| pxor %xmm8, %xmm8 | |||
| pxor %xmm9, %xmm9 | |||
| vxorpd %xmm8, %xmm8 , %xmm8 | |||
| vxorpd %xmm9, %xmm9 , %xmm9 | |||
| movq KK, %rax | |||
| andq $-4, %rax | |||
| @@ -844,7 +841,7 @@ | |||
| leaq (AO, %rax, 2), AO | |||
| leaq (BO, %rax, 2), BO | |||
| negq %rax | |||
| NOBRANCH | |||
| je .L66 | |||
| ALIGN_4 | |||
| @@ -901,7 +898,7 @@ | |||
| .L71: | |||
| movq B, BO | |||
| pxor %xmm8, %xmm8 | |||
| vxorpd %xmm8, %xmm8 , %xmm8 | |||
| movq KK, %rax | |||
| andq $-4, %rax | |||
| @@ -909,7 +906,7 @@ | |||
| leaq (AO, %rax, 1), AO | |||
| leaq (BO, %rax, 2), BO | |||
| negq %rax | |||
| NOBRANCH | |||
| je .L76 | |||
| ALIGN_4 | |||
| @@ -985,10 +982,10 @@ | |||
| movq B, BO | |||
| pxor %xmm8, %xmm8 | |||
| pxor %xmm9, %xmm9 | |||
| pxor %xmm10, %xmm10 | |||
| pxor %xmm11, %xmm11 | |||
| vxorpd %xmm8, %xmm8 , %xmm8 | |||
| vxorpd %xmm9, %xmm9 , %xmm9 | |||
| vxorpd %xmm10, %xmm10, %xmm10 | |||
| vxorpd %xmm11, %xmm11, %xmm11 | |||
| movq KK, %rax | |||
| @@ -997,7 +994,7 @@ | |||
| leaq (AO, %rax, 8), AO | |||
| leaq (BO, %rax, 1), BO | |||
| negq %rax | |||
| NOBRANCH | |||
| je .L96 | |||
| ALIGN_4 | |||
| @@ -1053,8 +1050,8 @@ | |||
| .L91_A: | |||
| movq B, BO | |||
| pxor %xmm8, %xmm8 | |||
| pxor %xmm9, %xmm9 | |||
| vxorpd %xmm8, %xmm8 , %xmm8 | |||
| vxorpd %xmm9, %xmm9 , %xmm9 | |||
| movq KK, %rax | |||
| andq $-4, %rax | |||
| @@ -1062,7 +1059,7 @@ | |||
| leaq (AO, %rax, 4), AO | |||
| leaq (BO, %rax, 1), BO | |||
| negq %rax | |||
| NOBRANCH | |||
| je .L96_A | |||
| ALIGN_4 | |||
| @@ -1119,7 +1116,7 @@ | |||
| movq B, BO | |||
| pxor %xmm8, %xmm8 | |||
| vxorpd %xmm8, %xmm8 , %xmm8 | |||
| movq KK, %rax | |||
| andq $-4, %rax | |||
| @@ -1127,7 +1124,7 @@ | |||
| leaq (AO, %rax, 2), AO | |||
| leaq (BO, %rax, 1), BO | |||
| negq %rax | |||
| NOBRANCH | |||
| je .L106 | |||
| ALIGN_4 | |||
| @@ -1183,7 +1180,7 @@ | |||
| .L111: | |||
| movq B, BO | |||
| pxor %xmm8, %xmm8 | |||
| vxorpd %xmm8, %xmm8 , %xmm8 | |||
| movq KK, %rax | |||
| andq $-4, %rax | |||
| @@ -1191,7 +1188,7 @@ | |||
| leaq (AO, %rax, 1), AO | |||
| leaq (BO, %rax, 1), BO | |||
| negq %rax | |||
| NOBRANCH | |||
| je .L116 | |||
| ALIGN_4 | |||