|
|
|
@@ -344,35 +344,35 @@ base_kops = [ |
|
|
|
'_oncopyi': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_4.c', |
|
|
|
'addl': ['-DUSE_ALPHA', '-DIMAGE_ONLY']}, |
|
|
|
'_otcopyi': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_4.c', |
|
|
|
'addl': ['-DUSE_ALPHA', '-DREAL_ONLY']}, |
|
|
|
'addl': ['-DUSE_ALPHA', '-DIMAGE_ONLY']}, |
|
|
|
}}, |
|
|
|
'z': {'exts': { |
|
|
|
'_kernel': {'dir': 'x86_64', 'kernel': 'zgemm3m_kernel_4x4_haswell.c', |
|
|
|
'addl': ['-DICOPY', '-UUSE_ALPHA']}, |
|
|
|
'addl': ['-DNN']}, |
|
|
|
'_oncopyb': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_4.c', |
|
|
|
'addl': ['-DUSE_ALPHA']}, |
|
|
|
'_otcopyb': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_4.c', |
|
|
|
'addl': ['-DUSE_ALPHA']}, |
|
|
|
'_itcopyb': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_8.c', |
|
|
|
'_itcopyb': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_4.c', |
|
|
|
'addl': ['-DICOPY', '-UUSE_ALPHA']}, |
|
|
|
'_itcopyr': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_8.c', |
|
|
|
'_itcopyr': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_4.c', |
|
|
|
'addl': ['-DICOPY', '-UUSE_ALPHA', '-DREAL_ONLY']}, |
|
|
|
'_itcopyi': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_8.c', |
|
|
|
'_itcopyi': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_4.c', |
|
|
|
'addl': ['-DICOPY', '-UUSE_ALPHA', '-DIMAGE_ONLY']}, |
|
|
|
'_incopyb': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_8.c', |
|
|
|
'_incopyb': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_4.c', |
|
|
|
'addl': ['-DICOPY', '-UUSE_ALPHA']}, |
|
|
|
'_incopyr': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_8.c', |
|
|
|
'_incopyr': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_4.c', |
|
|
|
'addl': ['-DICOPY', '-UUSE_ALPHA', '-DREAL_ONLY']}, |
|
|
|
'_oncopyr': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_4.c', |
|
|
|
'addl': ['-DUSE_ALPHA', '-DREAL_ONLY']}, |
|
|
|
'_otcopyr': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_4.c', |
|
|
|
'addl': ['-DUSE_ALPHA', '-DREAL_ONLY']}, |
|
|
|
'_incopyi': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_8.c', |
|
|
|
'_incopyi': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_4.c', |
|
|
|
'addl': ['-DICOPY', '-UUSE_ALPHA', '-DIMAGE_ONLY']}, |
|
|
|
'_oncopyi': {'dir': 'generic', 'kernel': 'zgemm3m_ncopy_4.c', |
|
|
|
'addl': ['-DUSE_ALPHA', '-DIMAGE_ONLY']}, |
|
|
|
'_otcopyi': {'dir': 'generic', 'kernel': 'zgemm3m_tcopy_4.c', |
|
|
|
'addl': ['-DUSE_ALPHA', '-DREAL_ONLY']}, |
|
|
|
'addl': ['-DUSE_ALPHA', '-DIMAGE_ONLY']}, |
|
|
|
}}, |
|
|
|
}, |
|
|
|
}, |
|
|
|
@@ -407,18 +407,18 @@ base_kops = [ |
|
|
|
'modes': { |
|
|
|
'c': { |
|
|
|
'exts': { |
|
|
|
'_U': {'dir': 'generic', 'kernel': 'zhemv_k.c'}, |
|
|
|
'_L': {'dir': 'generic', 'kernel': 'zhemv_k.c'}, |
|
|
|
'_V': {'dir': 'generic', 'kernel': 'zhemv_k.c'}, |
|
|
|
'_M': {'dir': 'generic', 'kernel': 'zhemv_k.c'}, |
|
|
|
'_U': {'dir': 'generic', 'kernel': 'zhemv_k.c', 'addl': ['-DHEMV']}, |
|
|
|
'_L': {'dir': 'generic', 'kernel': 'zhemv_k.c', 'addl': ['-DHEMV']}, |
|
|
|
'_V': {'dir': 'generic', 'kernel': 'zhemv_k.c', 'addl': ['-DHEMV', '-DHEMVREV']}, |
|
|
|
'_M': {'dir': 'generic', 'kernel': 'zhemv_k.c', 'addl': ['-DHEMV', '-DHEMVREV']}, |
|
|
|
} |
|
|
|
}, |
|
|
|
'z': { |
|
|
|
'exts': { |
|
|
|
'_U': {'dir': 'x86_64', 'kernel': 'zsymv_U_sse2.S'}, |
|
|
|
'_L': {'dir': 'x86_64', 'kernel': 'zsymv_L_sse2.S'}, |
|
|
|
'_V': {'dir': 'x86_64', 'kernel': 'zsymv_L_sse2.S'}, |
|
|
|
'_M': {'dir': 'generic', 'kernel': 'zhemv_k.c'}, |
|
|
|
'_U': {'dir': 'x86_64', 'kernel': 'zsymv_U_sse2.S', 'addl': ['-DHEMV']}, |
|
|
|
'_L': {'dir': 'x86_64', 'kernel': 'zsymv_L_sse2.S', 'addl': ['-DHEMV']}, |
|
|
|
'_V': {'dir': 'generic', 'kernel': 'zhemv_k.c', 'addl': ['-DHEMV', '-DHEMVREV']}, |
|
|
|
'_M': {'dir': 'generic', 'kernel': 'zhemv_k.c', 'addl': ['-DHEMV', '-DHEMVREV']}, |
|
|
|
} |
|
|
|
}, |
|
|
|
# 'x': { |
|
|
|
@@ -488,41 +488,41 @@ base_kops = [ |
|
|
|
'c': { |
|
|
|
'exts': { |
|
|
|
'_LN': {'dir': 'x86_64', 'kernel': 'cgemm_kernel_8x2_haswell.S', |
|
|
|
'addl': ['-UCONJ', '-DNN']}, |
|
|
|
'addl': ['-DLEFT', '-UTRANSA', '-UCONJ', '-DNN']}, |
|
|
|
'_LT': {'dir': 'x86_64', 'kernel': 'cgemm_kernel_8x2_haswell.S', |
|
|
|
'addl': ['-DLEFT', '-DTRANSA', '-UCONJ', '-DNN']}, |
|
|
|
'_LR': {'dir': 'x86_64', 'kernel': 'cgemm_kernel_8x2_haswell.S', |
|
|
|
'addl': ['-DCONJ', '-DCN']}, |
|
|
|
'addl': ['-DLEFT', '-UTRANSA', '-DCONJ', '-DCN']}, |
|
|
|
'_LC': {'dir': 'x86_64', 'kernel': 'cgemm_kernel_8x2_haswell.S', |
|
|
|
'addl': ['-DCONJ', '-DCN']}, |
|
|
|
'addl': ['-DLEFT', '-DTRANSA', '-DCONJ', '-DCN']}, |
|
|
|
'_RN': {'dir': 'x86_64', 'kernel': 'cgemm_kernel_8x2_haswell.S', |
|
|
|
'addl': ['-UCONJ', '-DNN']}, |
|
|
|
'addl': ['-ULEFT', '-UTRANSA', '-UCONJ', '-DNN']}, |
|
|
|
'_RT': {'dir': 'x86_64', 'kernel': 'cgemm_kernel_8x2_haswell.S', |
|
|
|
'addl': ['-ULEFT', '-DTRANSA', '-UCONJ', '-DNN']}, |
|
|
|
'_RR': {'dir': 'x86_64', 'kernel': 'cgemm_kernel_8x2_haswell.S', |
|
|
|
'addl': ['-DCONJ', '-DNC']}, |
|
|
|
'addl': ['-ULEFT', '-UTRANSA', '-DCONJ', '-DNC']}, |
|
|
|
'_RC': {'dir': 'x86_64', 'kernel': 'cgemm_kernel_8x2_haswell.S', |
|
|
|
'addl': ['-DCONJ', '-DCN']}, |
|
|
|
'addl': ['-ULEFT', '-DTRANSA', '-DCONJ', '-DNC']}, |
|
|
|
} |
|
|
|
}, |
|
|
|
'z': { |
|
|
|
'exts': { |
|
|
|
'_LN': {'dir': 'x86_64', 'kernel': 'zgemm_kernel_4x2_haswell.S', |
|
|
|
'addl': ['-UCONJ', '-DNN']}, |
|
|
|
'addl': ['-DLEFT', '-UTRANSA', '-UCONJ', '-DNN']}, |
|
|
|
'_LT': {'dir': 'x86_64', 'kernel': 'zgemm_kernel_4x2_haswell.S', |
|
|
|
'addl': ['-DLEFT', '-DTRANSA', '-UCONJ', '-DNN']}, |
|
|
|
'_LR': {'dir': 'x86_64', 'kernel': 'zgemm_kernel_4x2_haswell.S', |
|
|
|
'addl': ['-DCONJ', '-DCN']}, |
|
|
|
'addl': ['-DLEFT', '-UTRANSA', '-DCONJ', '-DCN']}, |
|
|
|
'_LC': {'dir': 'x86_64', 'kernel': 'zgemm_kernel_4x2_haswell.S', |
|
|
|
'addl': ['-DCONJ', '-DCN']}, |
|
|
|
'addl': ['-DLEFT', '-DTRANSA', '-DCONJ', '-DCN']}, |
|
|
|
'_RN': {'dir': 'x86_64', 'kernel': 'zgemm_kernel_4x2_haswell.S', |
|
|
|
'addl': ['-UCONJ', '-DNN']}, |
|
|
|
'addl': ['-ULEFT', '-UTRANSA', '-UCONJ', '-DNN']}, |
|
|
|
'_RT': {'dir': 'x86_64', 'kernel': 'zgemm_kernel_4x2_haswell.S', |
|
|
|
'addl': ['-ULEFT', '-DTRANSA', '-UCONJ', '-DNN']}, |
|
|
|
'_RR': {'dir': 'x86_64', 'kernel': 'zgemm_kernel_4x2_haswell.S', |
|
|
|
'addl': ['-DCONJ', '-DNC']}, |
|
|
|
'addl': ['-ULEFT', '-UTRANSA', '-DCONJ', '-DNC']}, |
|
|
|
'_RC': {'dir': 'x86_64', 'kernel': 'zgemm_kernel_4x2_haswell.S', |
|
|
|
'addl': ['-DCONJ', '-DCN']}, |
|
|
|
'addl': ['-ULEFT', '-DTRANSA', '-DCONJ', '-DNC']}, |
|
|
|
}, |
|
|
|
}, |
|
|
|
}, |
|
|
|
@@ -677,37 +677,37 @@ base_kops = [ |
|
|
|
'addl': ['-UDOUBLE', '-UCOMPLEX', '-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
}}, |
|
|
|
'd': {'exts': { |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'trmm_uncopy_8.c', |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'trmm_uncopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'trmm_uncopy_8.c', |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'trmm_uncopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'trmm_lncopy_8.c', |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'trmm_lncopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'trmm_lncopy_8.c', |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'trmm_lncopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'trmm_utcopy_8.c', |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'trmm_utcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'trmm_utcopy_8.c', |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'trmm_utcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'trmm_ltcopy_8.c', |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'trmm_ltcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'trmm_ltcopy_8.c', |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'trmm_ltcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'trmm_uncopy_4.c', |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'trmm_uncopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'trmm_uncopy_4.c', |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'trmm_uncopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'trmm_lncopy_4.c', |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'trmm_lncopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'trmm_lncopy_4.c', |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'trmm_lncopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'trmm_utcopy_4.c', |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'trmm_utcopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'trmm_utcopy_4.c', |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'trmm_utcopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'trmm_ltcopy_4.c', |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'trmm_ltcopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'trmm_ltcopy_4.c', |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'trmm_ltcopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
}}, |
|
|
|
'c': {'exts': { |
|
|
|
@@ -727,55 +727,55 @@ base_kops = [ |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_8.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_4.c', |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_4.c', |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_4.c', |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_4.c', |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_4.c', |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_4.c', |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_4.c', |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_4.c', |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
}}, |
|
|
|
'z': {'exts': { |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_8.c', |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_8.c', |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_8.c', |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_8.c', |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_8.c', |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_8.c', |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_8.c', |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_8.c', |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_4.c', |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_4.c', |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'ztrmm_uncopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_4.c', |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_4.c', |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'ztrmm_lncopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_4.c', |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_4.c', |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'ztrmm_utcopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_4.c', |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_4.c', |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'ztrmm_ltcopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
}}, |
|
|
|
}, |
|
|
|
@@ -783,23 +783,23 @@ base_kops = [ |
|
|
|
{ 'base': '?hemm', |
|
|
|
'modes': { |
|
|
|
'c': {'exts': { |
|
|
|
'_iutcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_4.c', |
|
|
|
'_iutcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_8.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-UOUTER', '-ULOWER']}, |
|
|
|
'_iltcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_4.c', |
|
|
|
'_iltcopy': {'dir': 'generic', 'kernel': 'zhemm_ltcopy_8.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER']}, |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_4.c', |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER']}, |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_4.c', |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'zhemm_ltcopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER']}, |
|
|
|
}}, |
|
|
|
'z': {'exts': { |
|
|
|
'_iutcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-ULOWER']}, |
|
|
|
'_iltcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_4.c', |
|
|
|
'_iltcopy': {'dir': 'generic', 'kernel': 'zhemm_ltcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER']}, |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_4.c', |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER']}, |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'zhemm_utcopy_4.c', |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'zhemm_ltcopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER']}, |
|
|
|
}}, |
|
|
|
}, |
|
|
|
@@ -843,37 +843,37 @@ base_kops = [ |
|
|
|
}}, |
|
|
|
'd': {'exts': { |
|
|
|
# TODO(rg): These actually use $(SGEMM_UNROLL_M) to choose the size |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_8.c', |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_8.c', |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_8.c', |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_8.c', |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_8.c', |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_8.c', |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_8.c', |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_8.c', |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_4.c', |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_8.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_4.c', |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_8.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_4.c', |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_8.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_4.c', |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_8.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_4.c', |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_8.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_4.c', |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_8.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_4.c', |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_8.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_4.c', |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_8.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
}}, |
|
|
|
'q': {'exts': { |
|
|
|
@@ -913,72 +913,72 @@ base_kops = [ |
|
|
|
}}, |
|
|
|
'c': {'exts': { |
|
|
|
# TODO(rg): These actually use $(SGEMM_UNROLL_M) to choose the size |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_8.c', |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'ztrsm_uncopy_8.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_8.c', |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'ztrsm_uncopy_8.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_8.c', |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'ztrsm_lncopy_8.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_8.c', |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'ztrsm_lncopy_8.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_8.c', |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'ztrsm_utcopy_8.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_8.c', |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'ztrsm_utcopy_8.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_8.c', |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'ztrsm_ltcopy_8.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_8.c', |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'ztrsm_ltcopy_8.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_4.c', |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'ztrsm_uncopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_4.c', |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'ztrsm_uncopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_4.c', |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'ztrsm_lncopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_4.c', |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'ztrsm_lncopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_4.c', |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'ztrsm_utcopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_4.c', |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'ztrsm_utcopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_4.c', |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'ztrsm_ltcopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_4.c', |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'ztrsm_ltcopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
}}, |
|
|
|
'z': {'exts': { |
|
|
|
# TODO(rg): These actually use $(SGEMM_UNROLL_M) to choose the size |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_8.c', |
|
|
|
'_iunucopy': {'dir': 'generic', 'kernel': 'ztrsm_uncopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_8.c', |
|
|
|
'_iunncopy': {'dir': 'generic', 'kernel': 'ztrsm_uncopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_8.c', |
|
|
|
'_ilnucopy': {'dir': 'generic', 'kernel': 'ztrsm_lncopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_8.c', |
|
|
|
'_ilnncopy': {'dir': 'generic', 'kernel': 'ztrsm_lncopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_8.c', |
|
|
|
'_iutucopy': {'dir': 'generic', 'kernel': 'ztrsm_utcopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_8.c', |
|
|
|
'_iutncopy': {'dir': 'generic', 'kernel': 'ztrsm_utcopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_8.c', |
|
|
|
'_iltucopy': {'dir': 'generic', 'kernel': 'ztrsm_ltcopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_8.c', |
|
|
|
'_iltncopy': {'dir': 'generic', 'kernel': 'ztrsm_ltcopy_4.c', |
|
|
|
'addl': ['-UOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_4.c', |
|
|
|
'_ounucopy': {'dir': 'generic', 'kernel': 'ztrsm_uncopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'trsm_uncopy_4.c', |
|
|
|
'_ounncopy': {'dir': 'generic', 'kernel': 'ztrsm_uncopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_4.c', |
|
|
|
'_olnucopy': {'dir': 'generic', 'kernel': 'ztrsm_lncopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'trsm_lncopy_4.c', |
|
|
|
'_olnncopy': {'dir': 'generic', 'kernel': 'ztrsm_lncopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_4.c', |
|
|
|
'_outucopy': {'dir': 'generic', 'kernel': 'ztrsm_utcopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-DUNIT']}, |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'trsm_utcopy_4.c', |
|
|
|
'_outncopy': {'dir': 'generic', 'kernel': 'ztrsm_utcopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-ULOWER', '-UUNIT']}, |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_4.c', |
|
|
|
'_oltucopy': {'dir': 'generic', 'kernel': 'ztrsm_ltcopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-DUNIT']}, |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'trsm_ltcopy_4.c', |
|
|
|
'_oltncopy': {'dir': 'generic', 'kernel': 'ztrsm_ltcopy_2.c', |
|
|
|
'addl': ['-DOUTER', '-DLOWER', '-UUNIT']}, |
|
|
|
}}, |
|
|
|
}, |
|
|
|
@@ -997,13 +997,13 @@ base_kops = [ |
|
|
|
'addl': ['-UDOUBLE', '-UCOMPLEX', '-DOUTER', '-DLOWER']}, |
|
|
|
}}, |
|
|
|
'd': {'exts': { |
|
|
|
'_iutcopy': {'dir': 'generic', 'kernel': 'symm_ucopy_8.c', |
|
|
|
'_iutcopy': {'dir': 'generic', 'kernel': 'symm_ucopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-ULOWER']}, |
|
|
|
'_iltcopy': {'dir': 'generic', 'kernel': 'symm_lcopy_8.c', |
|
|
|
'_iltcopy': {'dir': 'generic', 'kernel': 'symm_lcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-UOUTER', '-DLOWER']}, |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'symm_ucopy_4.c', |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'symm_ucopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-ULOWER']}, |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'symm_lcopy_4.c', |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'symm_lcopy_8.c', |
|
|
|
'addl': ['-DDOUBLE', '-UCOMPLEX', '-DOUTER', '-DLOWER']}, |
|
|
|
}}, |
|
|
|
'c': {'exts': { |
|
|
|
@@ -1011,19 +1011,19 @@ base_kops = [ |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-UOUTER', '-ULOWER']}, |
|
|
|
'_iltcopy': {'dir': 'generic', 'kernel': 'zsymm_lcopy_8.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER']}, |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'zsymm_ucopy_4.c', |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'zsymm_ucopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER']}, |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'zsymm_lcopy_4.c', |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'zsymm_lcopy_2.c', |
|
|
|
'addl': ['-UDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER']}, |
|
|
|
}}, |
|
|
|
'z': {'exts': { |
|
|
|
'_iutcopy': {'dir': 'generic', 'kernel': 'zsymm_ucopy_8.c', |
|
|
|
'_iutcopy': {'dir': 'generic', 'kernel': 'zsymm_ucopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-ULOWER']}, |
|
|
|
'_iltcopy': {'dir': 'generic', 'kernel': 'zsymm_lcopy_8.c', |
|
|
|
'_iltcopy': {'dir': 'generic', 'kernel': 'zsymm_lcopy_4.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-UOUTER', '-DLOWER']}, |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'zsymm_ucopy_4.c', |
|
|
|
'_outcopy': {'dir': 'generic', 'kernel': 'zsymm_ucopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-ULOWER']}, |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'zsymm_lcopy_4.c', |
|
|
|
'_oltcopy': {'dir': 'generic', 'kernel': 'zsymm_lcopy_2.c', |
|
|
|
'addl': ['-DDOUBLE', '-DCOMPLEX', '-DOUTER', '-DLOWER']}, |
|
|
|
}}, |
|
|
|
}, |
|
|
|
|