All challenges

Keywordscuda

Vector Addition 2^20 Throughput

open

Optimize a Triton vector-addition kernel for 2^20 CUDA elements.

cuda vector triton

vector-addition-frontier-cs-vector-addition-2-20

Vector Addition 2^28 Throughput

open

Optimize a Triton vector-addition kernel for 2^28 CUDA elements.

cuda vector triton

vector-add-2-28-frontier-cs-vector-add-2-28

Vector Addition 2^24 Throughput

open

Optimize a Triton vector-addition kernel for 2^24 CUDA elements.

cuda vector triton

vector-add-2-24-frontier-cs-vector-add-2-24

Ragged Attention Optimization

open

Optimize ragged CUDA attention with per-row length masks.

cuda attention triton

ragged-attention-frontier-cs-ragged-attn

INT4 Quantized Dot Optimization

open

Optimize packed INT4 quantized dot products on CUDA.

cuda int4 triton

quant-dot-int4-frontier-cs-quant-dot-int4

QKNorm Optimization

open

Optimize QK RMSNorm on CUDA tensors.

cuda qknorm flashinfer

qknorm-frontier-cs-qknorm

Mixed GEMM GELU Optimization

open

Optimize mixed-precision linear, bias, and GELU CUDA computation.

cuda gemm gelu

mixed-gemm-frontier-cs-mixed-gemm

Mamba2 Scan Optimization

open

Optimize a CUDA/Triton implementation of the Mamba2 sequential scan recurrence.

cuda triton scan

mamba2-scan-frontier-cs-mamba2-scan

Grouped GEMM Optimization

open

Optimize batched CUDA matrix multiplication across grouped shapes.

cuda gemm batch

group-gemm-frontier-cs-group-gemm

Transformer GEMM Optimization

open

Optimize Triton GEMM with GELU for transformer-like CUDA shapes.

cuda gemm triton

gemm-transformer-frontier-cs-gemm-transformer

GEMM Squares Optimization

open

Optimize Triton GEMM with GELU for square CUDA matrix shapes.

cuda gemm triton

gemm-squares-frontier-cs-gemm-squares

GEMM Optimization: Rectangles

open

Optimize a Triton GEMM with GELU for tall/skinny and short/wide matrices.

cuda triton gemm frontier-cs

gemm-rectangles-frontier-cs-gemm-rectangles