| @@ -90,36 +90,36 @@ ConvDwInt8Center: | |||||
| LoopKw16: | LoopKw16: | ||||
| mov x22, x21 | mov x22, x21 | ||||
| ld1 {v25.4h}, [x17], #8 | ld1 {v25.4h}, [x17], #8 | ||||
| ld1 {v16.4h}, [x22], x13 | |||||
| ld1 {v17.4h}, [x22], x13 | |||||
| ld1 {v16.4h}, [x22], x11 | |||||
| ld1 {v17.4h}, [x22], x11 | |||||
| smlal v0.4s, v16.4h, v25.4h | smlal v0.4s, v16.4h, v25.4h | ||||
| smlal v1.4s, v17.4h, v25.4h | smlal v1.4s, v17.4h, v25.4h | ||||
| ld1 {v18.4h}, [x22], x13 | |||||
| ld1 {v19.4h}, [x22], x13 | |||||
| ld1 {v18.4h}, [x22], x11 | |||||
| ld1 {v19.4h}, [x22], x11 | |||||
| smlal v2.4s, v18.4h, v25.4h | smlal v2.4s, v18.4h, v25.4h | ||||
| smlal v3.4s, v19.4h, v25.4h | smlal v3.4s, v19.4h, v25.4h | ||||
| ld1 {v20.4h}, [x22], x13 | |||||
| ld1 {v21.4h}, [x22], x13 | |||||
| ld1 {v20.4h}, [x22], x11 | |||||
| ld1 {v21.4h}, [x22], x11 | |||||
| smlal v4.4s, v20.4h, v25.4h | smlal v4.4s, v20.4h, v25.4h | ||||
| smlal v5.4s, v21.4h, v25.4h | smlal v5.4s, v21.4h, v25.4h | ||||
| ld1 {v22.4h}, [x22], x13 | |||||
| ld1 {v23.4h}, [x22], x13 | |||||
| ld1 {v22.4h}, [x22], x11 | |||||
| ld1 {v23.4h}, [x22], x11 | |||||
| smlal v6.4s, v22.4h, v25.4h | smlal v6.4s, v22.4h, v25.4h | ||||
| smlal v7.4s, v23.4h, v25.4h | smlal v7.4s, v23.4h, v25.4h | ||||
| ld1 {v16.4h}, [x22], x13 | |||||
| ld1 {v17.4h}, [x22], x13 | |||||
| ld1 {v16.4h}, [x22], x11 | |||||
| ld1 {v17.4h}, [x22], x11 | |||||
| smlal v8.4s, v16.4h, v25.4h | smlal v8.4s, v16.4h, v25.4h | ||||
| smlal v9.4s, v17.4h, v25.4h | smlal v9.4s, v17.4h, v25.4h | ||||
| ld1 {v18.4h}, [x22], x13 | |||||
| ld1 {v19.4h}, [x22], x13 | |||||
| ld1 {v18.4h}, [x22], x11 | |||||
| ld1 {v19.4h}, [x22], x11 | |||||
| smlal v10.4s, v18.4h, v25.4h | smlal v10.4s, v18.4h, v25.4h | ||||
| smlal v11.4s, v19.4h, v25.4h | smlal v11.4s, v19.4h, v25.4h | ||||
| ld1 {v20.4h}, [x22], x13 | |||||
| ld1 {v21.4h}, [x22], x13 | |||||
| ld1 {v20.4h}, [x22], x11 | |||||
| ld1 {v21.4h}, [x22], x11 | |||||
| smlal v12.4s, v20.4h, v25.4h | smlal v12.4s, v20.4h, v25.4h | ||||
| smlal v13.4s, v21.4h, v25.4h | smlal v13.4s, v21.4h, v25.4h | ||||
| ld1 {v22.4h}, [x22], x13 | |||||
| ld1 {v23.4h}, [x22], x13 | |||||
| ld1 {v22.4h}, [x22], x11 | |||||
| ld1 {v23.4h}, [x22], x11 | |||||
| smlal v14.4s, v22.4h, v25.4h | smlal v14.4s, v22.4h, v25.4h | ||||
| smlal v15.4s, v23.4h, v25.4h | smlal v15.4s, v23.4h, v25.4h | ||||
| subs x18, x18, #1 | subs x18, x18, #1 | ||||
| @@ -420,20 +420,20 @@ ConvDwInt8Center: | |||||
| LoopKw8: | LoopKw8: | ||||
| mov x22, x21 | mov x22, x21 | ||||
| ld1 {v25.4h}, [x17], #8 | ld1 {v25.4h}, [x17], #8 | ||||
| ld1 {v16.4h}, [x22], x13 | |||||
| ld1 {v17.4h}, [x22], x13 | |||||
| ld1 {v16.4h}, [x22], x11 | |||||
| ld1 {v17.4h}, [x22], x11 | |||||
| smlal v0.4s, v16.4h, v25.4h | smlal v0.4s, v16.4h, v25.4h | ||||
| smlal v1.4s, v17.4h, v25.4h | smlal v1.4s, v17.4h, v25.4h | ||||
| ld1 {v18.4h}, [x22], x13 | |||||
| ld1 {v19.4h}, [x22], x13 | |||||
| ld1 {v18.4h}, [x22], x11 | |||||
| ld1 {v19.4h}, [x22], x11 | |||||
| smlal v2.4s, v18.4h, v25.4h | smlal v2.4s, v18.4h, v25.4h | ||||
| smlal v3.4s, v19.4h, v25.4h | smlal v3.4s, v19.4h, v25.4h | ||||
| ld1 {v20.4h}, [x22], x13 | |||||
| ld1 {v21.4h}, [x22], x13 | |||||
| ld1 {v20.4h}, [x22], x11 | |||||
| ld1 {v21.4h}, [x22], x11 | |||||
| smlal v4.4s, v20.4h, v25.4h | smlal v4.4s, v20.4h, v25.4h | ||||
| smlal v5.4s, v21.4h, v25.4h | smlal v5.4s, v21.4h, v25.4h | ||||
| ld1 {v22.4h}, [x22], x13 | |||||
| ld1 {v23.4h}, [x22], x13 | |||||
| ld1 {v22.4h}, [x22], x11 | |||||
| ld1 {v23.4h}, [x22], x11 | |||||
| smlal v6.4s, v22.4h, v25.4h | smlal v6.4s, v22.4h, v25.4h | ||||
| smlal v7.4s, v23.4h, v25.4h | smlal v7.4s, v23.4h, v25.4h | ||||
| subs x18, x18, #1 | subs x18, x18, #1 | ||||