high performance computing on graphics processing units: hgpu.org

hgpu.org » Code generation

FortranX: Harnessing Code Generation, Portability, and Heterogeneity in Fortran

Sanil Rao, Mike Franusich, , Mohammad Alaul Haque Monil, Het Mankad, Jeffrey S. Vetter, Franz Franchetti

View

Tags: AMD, ATI, Code generation, Computer science, CUDA, Differential equations, Fortran, Heterogeneous systems, HIP, nVidia, OpenCL, OpenMP, Partial differential equations, PDEs

December 8, 2024 by hgpu

Improving Parallel Program Performance Through DSL-Driven Code Generation with LLM Optimizers

Anjiang Wei, Allen Nie, Thiago S. F. X. Teixeira, Rohan Yadav, Wonchan Lee, Ke Wang, Alex Aiken

View

Tags: Code generation, Computer science, DSL, LLM, Matrix multiplication, nVidia, Optimization, Tesla P100

November 17, 2024 by hgpu

Optimized Code Generation for Parallel and Polyhedral Loop Nests using MLIR

Arun Thangamani

View

Tags: AMD Radeon Instinct Mi50, ATI, Code generation, Computer science, CUDA, Heterogeneous systems, nVidia, nVidia A100, OpenCL, Thesis

October 13, 2024 by hgpu

Automatic Generation of OpenCL Code through Polyhedral Compilation with LLM

Marek Palkowski, Mateusz Gruzewski

View

Tags: AMD Radeon RX 6800, ATI, Code generation, Computer science, CUDA, LLM, nVidia, nVidia A100, OpenCL, OpenMP

September 29, 2024 by hgpu

A Comparison of OpenCL, CUDA, and HIP as Compilation Targets for a Functional Array Language

Troels Henriksen

View

Tags: AMD Radeon Instinct MI100, ATI, Code generation, Computer science, CUDA, HIP, nVidia, nVidia A100, OpenCL, Package, Programming Languages

July 28, 2024 by hgpu

Automated C/C++ Program Repair for High-Level Synthesis via Large Language Models

Kangwei Xu, Grace Li Zhang, Xunzhao Yin, Cheng Zhuo, Ulf Schlichtmann, Bing Li

View

Tags: Code generation, Computer science, FPGA, HLS, LLM

July 14, 2024 by hgpu

APPy: Annotated Parallelism for Python on GPUs

Tong Zhou, Jun Shirako, Vivek Sarkar

View

Tags: Code generation, Compilers, Computer science, CUDA, Machine learning, nVidia, nVidia GeForce RTX 3090, Python

February 25, 2024 by hgpu

DeepSeek-Coder: When the Large Language Model Meets Programming – The Rise of Code Intelligence

Daya Guo, Qihao Zhu, Dejian Yang, Zhenda Xie, Kai Dong, Wentao Zhang, Guanting Chen, Xiao Bi, Y. Wu, Y.K. Li, Fuli Luo, Yingfei Xiong, Wenfeng Liang

View

Tags: Code generation, Computer science, nVidia, nVidia A100, Package

February 12, 2024 by hgpu

swCUDA: Auto parallel code translation framework from CUDA to ATHREAD for new generation sunway supercomputer

Maoxue Yu, Guanghao Ma, Zhuoya Wang, Shuai Tang, Yuhu Chen, Yucheng Wang, Yuanyuan Liu, Dongning Jia, Zhiqiang Wei

View

Tags: Code generation, Computer science, CUDA, nVidia, nVidia GeForce GTX 1050 Ti

January 21, 2024 by hgpu

Code Generation for a Variety of Accelerators for a Graph DSL

Ashwina Kumar, M. Venkata Krishna, Prasanna Bartakke, Rahul Kumar, Rajesh Pandian M, Nibedita Behera, Rupesh Nasre

View

Tags: Code generation, Computer science, CUDA, DSL, nVidia, nVidia GeForce RTX 2080 Ti, OpenACC, OpenCL, Package, SYCL, Tesla V100

January 14, 2024 by hgpu

Domain-Specific Code Language Models: Unraveling the Potential for HPC Codes and Tasks

Tal Kadosh, Niranjan Hasabnis, Vy A. Vo, Nadav Schneider, Neva Krien, Mihai Capota, Abdul Wasay, Nesreen Ahmed, Ted Willke, Guy Tamir, Yuval Pinter, Timothy Mattson, Gal Oren

View

Tags: AI, Code generation, Computer science, Heterogeneous systems, HPC, nVidia, nVidia A40, OpenMP, Package, Python

January 7, 2024 by hgpu

An Autonomous Data Language

Tom T.P. Franken, Thomas Neele, Jan Friso Groote

View

Tags: Code generation, Computer science, CUDA, nVidia, OpenCL, Programming Languages

January 7, 2024 by hgpu

UniCoder: Unified Visual-to-Code Generation via Symbolic Rewards and Reference-Guided Code Optimization

UniCoder: Unified Visual-to-Code Generation via Symbolic Rewards and Reference-Guided Code Optimization

CuFuzz: An API-Knowledge-Graph Coverage-Driven Fuzzing Framework for CUDA Libraries

CuFuzz: An API-Knowledge-Graph Coverage-Driven Fuzzing Framework for CUDA Libraries

AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuning

AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuning

Probe-and-Refine Tuning of Repository Guidance for AI Coding Agents

Probe-and-Refine Tuning of Repository Guidance for Coding Agents

CUDAnalyst (CUDA + Analyst)

Towards Feedback-to-Plan Decisions for Self-Evolving LLM Agents in CUDA Kernel Generation

CodegenBench

CodegenBench: Can LLMs Write Efficient Code Across Architectures?

KernelBenchX: A Comprehensive Benchmark for Evaluating LLM-Generated GPU Kernels

KernelBenchX: A Comprehensive Benchmark for Evaluating LLM-Generated GPU Kernels

CUDA Kernel Fusion Benchmarks

Analyzing the Impact of Kernel Fusion on GPU Tensor Operation Performance: A Systematic Performance Study

IntelliKit: Agent-first tooling for AMD hardware

Kerncap: Automated Kernel Extraction and Isolation for AMD GPUs

DITRON: Distributed Compiler based on Triton for Parallel Systems

DITRON: Distributed Multi-level Tiling Compiler for Parallel Tensor Programs

See all packages

* * *

* * *

HGPU group © 2010-2026 hgpu.org

All rights belong to the respective authors

Login | Sitemap | Feedback | Policy

Contact us: