MegEngine

25 MB

Tree: defbc20efb

Author	SHA1	Message	Date
Megvii Engine Team	0708bc780c	fix(dnn/cuda): disallow implicit dtype conversion in cublaslt matmul algos disable tensor op matmul kernels when input and output tensors are in f32 data type to avoid potential accuracy loss GitOrigin-RevId: `36859cba5a`	4 years ago
Megvii Engine Team	ff0e6be7b9	fix(dnn/cuda): fix cutlass tensorop kernels do not compile cutlass tensorop kernels, when using cuda version less than 10.2 GitOrigin-RevId: `d4c37d5f41`	4 years ago
Megvii Engine Team	336761253d	feat(dnn/cuda): add tensorcore matmul for fp16 data type GitOrigin-RevId: `025c591f75`	4 years ago
Megvii Engine Team	ff755451d2	refactor(mgb): move algo's name from info to desc and delete some algo's unnecessary param() method GitOrigin-RevId: `144ff547d1`	5 years ago
Megvii Engine Team	2de2222e46	feat(dnn/cuda): add cutlass batched gemv kernel for matmul operator GitOrigin-RevId: `51702c4e79`	5 years ago
Megvii Engine Team	973d2a0ac2	feat(dnn/cuda): add cutlass matmul using split k parallel GitOrigin-RevId: `650209e35f`	5 years ago
Megvii Engine Team	03c921f7c4	feat(dnn/cuda): add cutlass matmul impls GitOrigin-RevId: `619c8c299c`	5 years ago