|
|
|
@@ -116,11 +116,11 @@ static void cscal_kernel_16( BLASLONG n, FLOAT *alpha, FLOAT *x) |
|
|
|
"vzeroupper \n\t" |
|
|
|
|
|
|
|
: |
|
|
|
: |
|
|
|
"r" (n), // 0 |
|
|
|
"r" (x), // 1 |
|
|
|
"+r" (n), // 0 |
|
|
|
"+r" (x), // 1 |
|
|
|
: |
|
|
|
"r" (alpha) // 2 |
|
|
|
: "cc", //"0", "1", |
|
|
|
: "cc", |
|
|
|
"%xmm0", "%xmm1", "%xmm2", "%xmm3", |
|
|
|
"%xmm4", "%xmm5", "%xmm6", "%xmm7", |
|
|
|
"%xmm8", "%xmm9", "%xmm10", "%xmm11", |
|
|
|
@@ -208,9 +208,9 @@ static void cscal_kernel_16_zero_r( BLASLONG n, FLOAT *alpha, FLOAT *x) |
|
|
|
"vzeroupper \n\t" |
|
|
|
|
|
|
|
: |
|
|
|
: |
|
|
|
"r" (n), // 0 |
|
|
|
"r" (x), // 1 |
|
|
|
"+r" (n), // 0 |
|
|
|
"+r" (x), // 1 |
|
|
|
: |
|
|
|
"r" (alpha) // 2 |
|
|
|
: "cc", // "0", "1", |
|
|
|
"%xmm0", "%xmm1", "%xmm2", "%xmm3", |
|
|
|
@@ -285,9 +285,9 @@ static void cscal_kernel_16_zero_i( BLASLONG n, FLOAT *alpha, FLOAT *x) |
|
|
|
"vzeroupper \n\t" |
|
|
|
|
|
|
|
: |
|
|
|
: |
|
|
|
"r" (n), // 0 |
|
|
|
"r" (x), // 1 |
|
|
|
"+r" (n), // 0 |
|
|
|
"+r" (x), // 1 |
|
|
|
: |
|
|
|
"r" (alpha) // 2 |
|
|
|
: "cc", //"%0", "%1", |
|
|
|
"%xmm0", "%xmm1", "%xmm2", "%xmm3", |
|
|
|
@@ -329,12 +329,12 @@ static void cscal_kernel_16_zero( BLASLONG n, FLOAT *alpha, FLOAT *x) |
|
|
|
|
|
|
|
"vzeroupper \n\t" |
|
|
|
|
|
|
|
: |
|
|
|
: |
|
|
|
"r" (n), // 0 |
|
|
|
"r" (x), // 1 |
|
|
|
: |
|
|
|
"+r" (n), // 0 |
|
|
|
"+r" (x), // 1 |
|
|
|
: |
|
|
|
"r" (alpha) // 2 |
|
|
|
: "cc", //"0", "1", |
|
|
|
: "cc", |
|
|
|
"%xmm0", "%xmm1", "%xmm2", "%xmm3", |
|
|
|
"%xmm4", "%xmm5", "%xmm6", "%xmm7", |
|
|
|
"%xmm8", "%xmm9", "%xmm10", "%xmm11", |
|
|
|
|