|
|
|
@@ -90,36 +90,36 @@ ConvDwInt8Center: |
|
|
|
LoopKw16: |
|
|
|
mov x22, x21 |
|
|
|
ld1 {v25.4h}, [x17], #8 |
|
|
|
ld1 {v16.4h}, [x22], x13 |
|
|
|
ld1 {v17.4h}, [x22], x13 |
|
|
|
ld1 {v16.4h}, [x22], x11 |
|
|
|
ld1 {v17.4h}, [x22], x11 |
|
|
|
smlal v0.4s, v16.4h, v25.4h |
|
|
|
smlal v1.4s, v17.4h, v25.4h |
|
|
|
ld1 {v18.4h}, [x22], x13 |
|
|
|
ld1 {v19.4h}, [x22], x13 |
|
|
|
ld1 {v18.4h}, [x22], x11 |
|
|
|
ld1 {v19.4h}, [x22], x11 |
|
|
|
smlal v2.4s, v18.4h, v25.4h |
|
|
|
smlal v3.4s, v19.4h, v25.4h |
|
|
|
ld1 {v20.4h}, [x22], x13 |
|
|
|
ld1 {v21.4h}, [x22], x13 |
|
|
|
ld1 {v20.4h}, [x22], x11 |
|
|
|
ld1 {v21.4h}, [x22], x11 |
|
|
|
smlal v4.4s, v20.4h, v25.4h |
|
|
|
smlal v5.4s, v21.4h, v25.4h |
|
|
|
ld1 {v22.4h}, [x22], x13 |
|
|
|
ld1 {v23.4h}, [x22], x13 |
|
|
|
ld1 {v22.4h}, [x22], x11 |
|
|
|
ld1 {v23.4h}, [x22], x11 |
|
|
|
smlal v6.4s, v22.4h, v25.4h |
|
|
|
smlal v7.4s, v23.4h, v25.4h |
|
|
|
ld1 {v16.4h}, [x22], x13 |
|
|
|
ld1 {v17.4h}, [x22], x13 |
|
|
|
ld1 {v16.4h}, [x22], x11 |
|
|
|
ld1 {v17.4h}, [x22], x11 |
|
|
|
smlal v8.4s, v16.4h, v25.4h |
|
|
|
smlal v9.4s, v17.4h, v25.4h |
|
|
|
ld1 {v18.4h}, [x22], x13 |
|
|
|
ld1 {v19.4h}, [x22], x13 |
|
|
|
ld1 {v18.4h}, [x22], x11 |
|
|
|
ld1 {v19.4h}, [x22], x11 |
|
|
|
smlal v10.4s, v18.4h, v25.4h |
|
|
|
smlal v11.4s, v19.4h, v25.4h |
|
|
|
ld1 {v20.4h}, [x22], x13 |
|
|
|
ld1 {v21.4h}, [x22], x13 |
|
|
|
ld1 {v20.4h}, [x22], x11 |
|
|
|
ld1 {v21.4h}, [x22], x11 |
|
|
|
smlal v12.4s, v20.4h, v25.4h |
|
|
|
smlal v13.4s, v21.4h, v25.4h |
|
|
|
ld1 {v22.4h}, [x22], x13 |
|
|
|
ld1 {v23.4h}, [x22], x13 |
|
|
|
ld1 {v22.4h}, [x22], x11 |
|
|
|
ld1 {v23.4h}, [x22], x11 |
|
|
|
smlal v14.4s, v22.4h, v25.4h |
|
|
|
smlal v15.4s, v23.4h, v25.4h |
|
|
|
subs x18, x18, #1 |
|
|
|
@@ -420,20 +420,20 @@ ConvDwInt8Center: |
|
|
|
LoopKw8: |
|
|
|
mov x22, x21 |
|
|
|
ld1 {v25.4h}, [x17], #8 |
|
|
|
ld1 {v16.4h}, [x22], x13 |
|
|
|
ld1 {v17.4h}, [x22], x13 |
|
|
|
ld1 {v16.4h}, [x22], x11 |
|
|
|
ld1 {v17.4h}, [x22], x11 |
|
|
|
smlal v0.4s, v16.4h, v25.4h |
|
|
|
smlal v1.4s, v17.4h, v25.4h |
|
|
|
ld1 {v18.4h}, [x22], x13 |
|
|
|
ld1 {v19.4h}, [x22], x13 |
|
|
|
ld1 {v18.4h}, [x22], x11 |
|
|
|
ld1 {v19.4h}, [x22], x11 |
|
|
|
smlal v2.4s, v18.4h, v25.4h |
|
|
|
smlal v3.4s, v19.4h, v25.4h |
|
|
|
ld1 {v20.4h}, [x22], x13 |
|
|
|
ld1 {v21.4h}, [x22], x13 |
|
|
|
ld1 {v20.4h}, [x22], x11 |
|
|
|
ld1 {v21.4h}, [x22], x11 |
|
|
|
smlal v4.4s, v20.4h, v25.4h |
|
|
|
smlal v5.4s, v21.4h, v25.4h |
|
|
|
ld1 {v22.4h}, [x22], x13 |
|
|
|
ld1 {v23.4h}, [x22], x13 |
|
|
|
ld1 {v22.4h}, [x22], x11 |
|
|
|
ld1 {v23.4h}, [x22], x11 |
|
|
|
smlal v6.4s, v22.4h, v25.4h |
|
|
|
smlal v7.4s, v23.4h, v25.4h |
|
|
|
subs x18, x18, #1 |
|
|
|
|