|
|
|
@@ -56,12 +56,18 @@ base_kops = [ |
|
|
|
'modes': { |
|
|
|
's': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'saxpy.c'}}}, |
|
|
|
'd': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'daxpy.c'}}}, |
|
|
|
'c': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'caxpy.c'}}}, |
|
|
|
'z': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'zaxpy.c'}}}, |
|
|
|
'c': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'caxpy.c', 'addl': ['-UCONJ']}}}, |
|
|
|
'z': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'zaxpy.c', 'addl': ['-UCONJ']}}}, |
|
|
|
# 'q': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'axpy.S'}}}, |
|
|
|
# 'x': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'zaxpy.S'}}}, |
|
|
|
}, |
|
|
|
}, |
|
|
|
{ 'base': '?axpyc', |
|
|
|
'modes': { |
|
|
|
'c': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'caxpy.c', 'addl': ['-DCONJ']}}}, |
|
|
|
'z': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'zaxpy.c', 'addl': ['-DCONJ']}}}, |
|
|
|
}, |
|
|
|
}, |
|
|
|
{ 'base': '?dot', |
|
|
|
'modes': { |
|
|
|
's': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'sdot.c'}}}, |
|
|
|
@@ -84,7 +90,7 @@ base_kops = [ |
|
|
|
{ 'base': '?dsdot', |
|
|
|
'modes': { |
|
|
|
's': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'sdot.c'}}}, |
|
|
|
'd': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'sdot.c'}}}, |
|
|
|
'': {'exts': {'_k': {'dir': 'x86_64', 'kernel': 'sdot.c', 'addl': ['-DDSDOT']}}}, |
|
|
|
}, |
|
|
|
}, |
|
|
|
# TODO(rg): Add dsdotkernel conditionals |
|
|
|
@@ -863,17 +869,84 @@ base_kops = [ |
|
|
|
{ 'base': '?omatcopy_k', |
|
|
|
'modes': { |
|
|
|
's': {'exts': { |
|
|
|
'_cn': {'dir': 'arm', 'kernel': 'omatcopy_cn.c', |
|
|
|
'addl': ['-UROWM']}, |
|
|
|
'_rn': {'dir': 'arm', 'kernel': 'omatcopy_rn.c', |
|
|
|
'addl': ['-DROWM']}, |
|
|
|
'_ct': {'dir': 'arm', 'kernel': 'omatcopy_ct.c', |
|
|
|
'addl': ['-UROWM']}, |
|
|
|
'_rt': {'dir': 'x86_64', 'kernel': 'omatcopy_rt.c', |
|
|
|
'addl': ['-DROWM']}, |
|
|
|
'_cn': {'dir': 'arm', 'kernel': 'omatcopy_cn.c', 'addl': ['-UROWM']}, |
|
|
|
'_rn': {'dir': 'arm', 'kernel': 'omatcopy_rn.c', 'addl': ['-DROWM']}, |
|
|
|
'_ct': {'dir': 'arm', 'kernel': 'omatcopy_ct.c', 'addl': ['-UROWM']}, |
|
|
|
'_rt': {'dir': 'arm', 'kernel': 'omatcopy_rt.c', 'addl': ['-DROWM']}, |
|
|
|
}}, |
|
|
|
'd': {'exts': { |
|
|
|
'_cn': {'dir': 'arm', 'kernel': 'omatcopy_cn.c', 'addl': ['-UROWM']}, |
|
|
|
'_rn': {'dir': 'arm', 'kernel': 'omatcopy_rn.c', 'addl': ['-DROWM']}, |
|
|
|
'_ct': {'dir': 'arm', 'kernel': 'omatcopy_ct.c', 'addl': ['-UROWM']}, |
|
|
|
'_rt': {'dir': 'arm', 'kernel': 'omatcopy_rt.c', 'addl': ['-DROWM']}, |
|
|
|
}}, |
|
|
|
'c': {'exts': { |
|
|
|
'_cn': {'dir': 'arm', 'kernel': 'zomatcopy_cn.c', 'addl': ['-UROWM', '-UCONJ']}, |
|
|
|
'_rn': {'dir': 'arm', 'kernel': 'zomatcopy_rn.c', 'addl': ['-DROWM', '-UCONJ']}, |
|
|
|
'_ct': {'dir': 'arm', 'kernel': 'zomatcopy_ct.c', 'addl': ['-UROWM', '-UCONJ']}, |
|
|
|
'_rt': {'dir': 'arm', 'kernel': 'zomatcopy_rt.c', 'addl': ['-DROWM', '-UCONJ']}, |
|
|
|
'_cnc': {'dir': 'arm', 'kernel': 'zomatcopy_cnc.c', 'addl': ['-UROWM', '-DCONJ']}, |
|
|
|
'_rnc': {'dir': 'arm', 'kernel': 'zomatcopy_rnc.c', 'addl': ['-DROWM', '-DCONJ']}, |
|
|
|
'_ctc': {'dir': 'arm', 'kernel': 'zomatcopy_ctc.c', 'addl': ['-UROWM', '-DCONJ']}, |
|
|
|
'_rtc': {'dir': 'arm', 'kernel': 'zomatcopy_rtc.c', 'addl': ['-DROWM', '-DCONJ']}, |
|
|
|
}}, |
|
|
|
'z': {'exts': { |
|
|
|
'_cn': {'dir': 'arm', 'kernel': 'zomatcopy_cn.c', 'addl': ['-UROWM', '-UCONJ']}, |
|
|
|
'_rn': {'dir': 'arm', 'kernel': 'zomatcopy_rn.c', 'addl': ['-DROWM', '-UCONJ']}, |
|
|
|
'_ct': {'dir': 'arm', 'kernel': 'zomatcopy_ct.c', 'addl': ['-UROWM', '-UCONJ']}, |
|
|
|
'_rt': {'dir': 'arm', 'kernel': 'zomatcopy_rt.c', 'addl': ['-DROWM', '-UCONJ']}, |
|
|
|
'_cnc': {'dir': 'arm', 'kernel': 'zomatcopy_cnc.c', 'addl': ['-UROWM', '-DCONJ']}, |
|
|
|
'_rnc': {'dir': 'arm', 'kernel': 'zomatcopy_rnc.c', 'addl': ['-DROWM', '-DCONJ']}, |
|
|
|
'_ctc': {'dir': 'arm', 'kernel': 'zomatcopy_ctc.c', 'addl': ['-UROWM', '-DCONJ']}, |
|
|
|
'_rtc': {'dir': 'arm', 'kernel': 'zomatcopy_rtc.c', 'addl': ['-DROWM', '-DCONJ']}, |
|
|
|
}}, |
|
|
|
}, |
|
|
|
}, |
|
|
|
{ 'base': '?imatcopy_k', |
|
|
|
'modes': { |
|
|
|
's': {'exts': { |
|
|
|
'_cn': {'dir': 'generic', 'kernel': 'imatcopy_cn.c', 'addl': ['-UROWM']}, |
|
|
|
'_rn': {'dir': 'generic', 'kernel': 'imatcopy_rn.c', 'addl': ['-DROWM']}, |
|
|
|
'_ct': {'dir': 'generic', 'kernel': 'imatcopy_ct.c', 'addl': ['-UROWM']}, |
|
|
|
'_rt': {'dir': 'generic', 'kernel': 'imatcopy_rt.c', 'addl': ['-DROWM']}, |
|
|
|
}}, |
|
|
|
'd': {'exts': { |
|
|
|
'_cn': {'dir': 'generic', 'kernel': 'imatcopy_cn.c', 'addl': ['-UROWM']}, |
|
|
|
'_rn': {'dir': 'generic', 'kernel': 'imatcopy_rn.c', 'addl': ['-DROWM']}, |
|
|
|
'_ct': {'dir': 'generic', 'kernel': 'imatcopy_ct.c', 'addl': ['-UROWM']}, |
|
|
|
'_rt': {'dir': 'generic', 'kernel': 'imatcopy_rt.c', 'addl': ['-DROWM']}, |
|
|
|
}}, |
|
|
|
'c': {'exts': { |
|
|
|
'_cn': {'dir': 'generic', 'kernel': 'zimatcopy_cn.c', 'addl': ['-UROWM', '-UCONJ']}, |
|
|
|
'_rn': {'dir': 'generic', 'kernel': 'zimatcopy_rn.c', 'addl': ['-DROWM', '-UCONJ']}, |
|
|
|
'_ct': {'dir': 'generic', 'kernel': 'zimatcopy_ct.c', 'addl': ['-UROWM', '-UCONJ']}, |
|
|
|
'_rt': {'dir': 'generic', 'kernel': 'zimatcopy_rt.c', 'addl': ['-DROWM', '-UCONJ']}, |
|
|
|
'_cnc': {'dir': 'generic', 'kernel': 'zimatcopy_cnc.c', 'addl': ['-UROWM', '-DCONJ']}, |
|
|
|
'_rnc': {'dir': 'generic', 'kernel': 'zimatcopy_rnc.c', 'addl': ['-DROWM', '-DCONJ']}, |
|
|
|
'_ctc': {'dir': 'generic', 'kernel': 'zimatcopy_ctc.c', 'addl': ['-UROWM', '-DCONJ']}, |
|
|
|
'_rtc': {'dir': 'generic', 'kernel': 'zimatcopy_rtc.c', 'addl': ['-DROWM', '-DCONJ']}, |
|
|
|
}}, |
|
|
|
'z': {'exts': { |
|
|
|
'_cn': {'dir': 'generic', 'kernel': 'zimatcopy_cn.c', 'addl': ['-UROWM', '-UCONJ']}, |
|
|
|
'_rn': {'dir': 'generic', 'kernel': 'zimatcopy_rn.c', 'addl': ['-DROWM', '-UCONJ']}, |
|
|
|
'_ct': {'dir': 'generic', 'kernel': 'zimatcopy_ct.c', 'addl': ['-UROWM', '-UCONJ']}, |
|
|
|
'_rt': {'dir': 'generic', 'kernel': 'zimatcopy_rt.c', 'addl': ['-DROWM', '-UCONJ']}, |
|
|
|
'_cnc': {'dir': 'generic', 'kernel': 'zimatcopy_cnc.c', 'addl': ['-UROWM', '-DCONJ']}, |
|
|
|
'_rnc': {'dir': 'generic', 'kernel': 'zimatcopy_rnc.c', 'addl': ['-DROWM', '-DCONJ']}, |
|
|
|
'_ctc': {'dir': 'generic', 'kernel': 'zimatcopy_ctc.c', 'addl': ['-UROWM', '-DCONJ']}, |
|
|
|
'_rtc': {'dir': 'generic', 'kernel': 'zimatcopy_rtc.c', 'addl': ['-DROWM', '-DCONJ']}, |
|
|
|
}}, |
|
|
|
}, |
|
|
|
}, |
|
|
|
{ |
|
|
|
'base': '?geadd', |
|
|
|
'modes': { |
|
|
|
's': {'exts': {'_k': {'dir': 'generic', 'kernel': 'geadd.c', 'addl': ['-UROWM']}}}, |
|
|
|
'd': {'exts': {'_k': {'dir': 'generic', 'kernel': 'geadd.c', 'addl': ['-UROWM']}}}, |
|
|
|
'c': {'exts': {'_k': {'dir': 'generic', 'kernel': 'zgeadd.c', 'addl': ['-UROWM']}}}, |
|
|
|
'z': {'exts': {'_k': {'dir': 'generic', 'kernel': 'zgeadd.c', 'addl': ['-UROWM']}}}, |
|
|
|
}, |
|
|
|
}, |
|
|
|
{ 'base': '?gemm_small_kernel', |
|
|
|
'modes': { |
|
|
|
's': { |
|
|
|
|