|
|
|
@@ -117,11 +117,11 @@ static void cscal_kernel_16( BLASLONG n, FLOAT *alpha, FLOAT *x) |
|
|
|
"vzeroupper \n\t" |
|
|
|
|
|
|
|
: |
|
|
|
: |
|
|
|
"r" (n), // 0 |
|
|
|
"r" (x), // 1 |
|
|
|
"+r" (n), // 0 |
|
|
|
"+r" (x), // 1 |
|
|
|
: |
|
|
|
"r" (alpha) // 2 |
|
|
|
: "cc", //"0", "1", |
|
|
|
: "cc", |
|
|
|
"%xmm0", "%xmm1", "%xmm2", "%xmm3", |
|
|
|
"%xmm4", "%xmm5", "%xmm6", "%xmm7", |
|
|
|
"%xmm8", "%xmm9", "%xmm10", "%xmm11", |
|
|
|
@@ -208,12 +208,12 @@ static void cscal_kernel_16_zero_r( BLASLONG n, FLOAT *alpha, FLOAT *x) |
|
|
|
|
|
|
|
"vzeroupper \n\t" |
|
|
|
|
|
|
|
: |
|
|
|
"+r" (n), // 0 |
|
|
|
"+r" (x), // 1 |
|
|
|
: |
|
|
|
: |
|
|
|
"r" (n), // 0 |
|
|
|
"r" (x), // 1 |
|
|
|
"r" (alpha) // 2 |
|
|
|
: "cc", //"0", "1", |
|
|
|
: "cc", |
|
|
|
"%xmm0", "%xmm1", "%xmm2", "%xmm3", |
|
|
|
"%xmm4", "%xmm5", "%xmm6", "%xmm7", |
|
|
|
"%xmm8", "%xmm9", "%xmm10", "%xmm11", |
|
|
|
@@ -286,11 +286,11 @@ static void cscal_kernel_16_zero_i( BLASLONG n, FLOAT *alpha, FLOAT *x) |
|
|
|
"vzeroupper \n\t" |
|
|
|
|
|
|
|
: |
|
|
|
: |
|
|
|
"r" (n), // 0 |
|
|
|
"r" (x), // 1 |
|
|
|
"+r" (n), // 0 |
|
|
|
"+r" (x), // 1 |
|
|
|
: |
|
|
|
"r" (alpha) // 2 |
|
|
|
: "cc", //"%0", "%1", |
|
|
|
: "cc", |
|
|
|
"%xmm0", "%xmm1", "%xmm2", "%xmm3", |
|
|
|
"%xmm4", "%xmm5", "%xmm6", "%xmm7", |
|
|
|
"%xmm8", "%xmm9", "%xmm10", "%xmm11", |
|
|
|
@@ -331,11 +331,11 @@ static void cscal_kernel_16_zero( BLASLONG n, FLOAT *alpha, FLOAT *x) |
|
|
|
"vzeroupper \n\t" |
|
|
|
|
|
|
|
: |
|
|
|
: |
|
|
|
"r" (n), // 0 |
|
|
|
"r" (x), // 1 |
|
|
|
"+r" (n), // 0 |
|
|
|
"+r" (x), // 1 |
|
|
|
: |
|
|
|
"r" (alpha) // 2 |
|
|
|
: "cc", //"0", "1", |
|
|
|
: "cc", |
|
|
|
"%xmm0", "%xmm1", "%xmm2", "%xmm3", |
|
|
|
"%xmm4", "%xmm5", "%xmm6", "%xmm7", |
|
|
|
"%xmm8", "%xmm9", "%xmm10", "%xmm11", |
|
|
|
|