high performance computing on graphics processing units: hgpu.org

hgpu.org » comparison

A Survey of Methods For Analyzing and Improving GPU Energy Efficiency

Sparsh Mittal, Jeffrey S. Vetter

View

Download (PDF)

Tags: comparison, Computer science, cpu, CUDA, Energy-efficient computing, FPGA, Hardware Architecture, nVidia

April 18, 2014 by sparsh0mittal

Comparing CUDA, OpenCL and OpenGL Implementations of the Cardiac Monodomain Equations

Rafael Sachetto Oliveira, Bernardo Martins Rocha, Ronan Mendonça Amorim, Fernando Otaviano Campos, Wagner Meira Jr., Elson Magalhães Toledo, Rodrigo Weber dos Santos

View

Download (PDF)

Tags: cardiac simulation, comparison, CUDA, OpenCL, OpenGL

August 2, 2013 by rbm84

UniCoder: Unified Visual-to-Code Generation via Symbolic Rewards and Reference-Guided Code Optimization

CuFuzz: An API-Knowledge-Graph Coverage-Driven Fuzzing Framework for CUDA Libraries

AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuning

KernelBenchX: A Comprehensive Benchmark for Evaluating LLM-Generated GPU Kernels

CUDA Kernel Fusion Benchmarks

Analyzing the Impact of Kernel Fusion on GPU Tensor Operation Performance: A Systematic Performance Study

IntelliKit: Agent-first tooling for AMD hardware

Kerncap: Automated Kernel Extraction and Isolation for AMD GPUs

DITRON: Distributed Compiler based on Triton for Parallel Systems

DITRON: Distributed Multi-level Tiling Compiler for Parallel Tensor Programs

See all packages

* * *

high performance computing on graphics processing units: hgpu.org

A Survey of Methods For Analyzing and Improving GPU Energy Efficiency

Comparing CUDA, OpenCL and OpenGL Implementations of the Cardiac Monodomain Equations

Recent source codes

UniCoder: Unified Visual-to-Code Generation via Symbolic Rewards and Reference-Guided Code Optimization

CuFuzz: An API-Knowledge-Graph Coverage-Driven Fuzzing Framework for CUDA Libraries

AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuning

Probe-and-Refine Tuning of Repository Guidance for AI Coding Agents

CUDAnalyst (CUDA + Analyst)

CodegenBench

KernelBenchX: A Comprehensive Benchmark for Evaluating LLM-Generated GPU Kernels

CUDA Kernel Fusion Benchmarks

IntelliKit: Agent-first tooling for AMD hardware

DITRON: Distributed Compiler based on Triton for Parallel Systems

Most viewed papers (last 30 days)