high performance computing on graphics processing units: hgpu.org

Papers on hgpu.org (.txt-file)

Value Prediction and Speculative Execution on GPU

ValuePack: value-based scheduling framework for CPU-GPU clusters

Variable Bit Rate GPU Texture Decompression

Variable selection in a GPU cluster using delta test

Variants of Jump Flooding Algorithm for Computing Discrete Voronoi Diagrams

Variants of Mersenne Twister Suitable for Graphic Processors

Variational Bayesian Image Super-Resolution with GPU Acceleration

Various String Matching Algorithms for DNA Sequences to Detect Breast Cancer using CUDA Processors

VASP on a GPU: application to exact-exchange calculations of the stability of elemental boron

vCUDA Framework Development for GPU Virtualization

vCUDA: GPU accelerated high performance computing in virtual machines

VDBSCAN+: Performance Optimization Based on GPU Parallelism

Vector and Line Quantization for Billion-scale Similarity Search on GPUs

Vector graphics depicting marbling flow

Vector Quantization: A Many-Core Approach

Vectorization of Hybrid Breadth First Search on the Intel Xeon Phi

Vectorized algorithm for multidimensional Monte Carlo integration on modern GPU, CPU and MIC architectures

Vectorized Higher Order Finite Difference Kernels

Vectorized OpenCL implementation of numerical integration for higher order finite elements

Vendors Draw up a New Graphics-Hardware Approach

Vergence Using GPU Cepstral Filtering

Verifiable Computation with Massively Parallel Interactive Proofs

Verification of GPU Program Optimizations in Lean

Verification of Producer-Consumer Synchronization in GPU Programs

Verification of Program Parallelization

Verified Instruction-Level Energy Consumption Measurement for NVIDIA GPUs

Verifying CUDA Programs using SMT-Based Context-Bounded Model Checking

Verifying GPU Kernels by Test Amplification

VertexAPI2 – A Vertex-Program API for Large Graph Computations on the GPU

Very fast ellipse detection using GPU-based RHT

Very Fast Non-Dominated Sorting

VHF SAR image formation implemented on a GPU

Viability of Feature Detection on Sony Xperia Z3 using OpenCL

VibeCodeHPC: An Agent-Based Iterative Prompting Auto-Tuner for HPC Code Generation Using LLMs

Video architecture and real-time lighting technology for tangible teleconference

Video Coding on Multicore Graphics Processors

Video coding on multicore graphics processors (GPUs)

Videogame Graphics, BigData & Analytics

View-dependent exploration of massive volumetric models on large-scale light field displays

View-Dependent Real-Time Rendering of Large Outdoor Scenes

View-Dependent Streamlines for 3D Vector Fields

Viewpoints: A high-performance high-dimensional exploratory data analysis tool

VirtCL: a framework for OpenCL device abstraction and management

Virtual open heart surgery: obtaining models suitable for surgical simulation.

Virtual Rheoscopic Fluids

Virtual Texturing with WebGL

Virtual Viewpoint Disparity Estimation and Convergence Check for Real-Time View Synthesis

Virtualization and Migration with GPGPUs

Virtualizing Data Parallel Systems for Portability, Productivity, and Performance

Virtualizing Deep Neural Networks for Memory-Efficient Neural Network Design

Visibility Cuts: A System for Rendering Dynamic Virtual Environments

Visibility Sampling on GPU and Applications

Vision based Navigation (VBN) of Unmanned Aerial Vehicles (UAV)

Vispark: GPU-Accelerated Distributed Visual Computing Using Spark

VisPy: Harnessing The GPU For Fast, High-Level Visualization

Visual Analysis Algorithms for Embedded Systems

Visual Computing in Biology and Medicine: Interactive visual analysis of contrast-enhanced ultrasound data based on small neighborhood statistics

Visual cortex on the GPU: Biologically inspired classifier and feature descriptor for rapid recognition

Visual Data Mining Using the Point Distribution Tensor

Visual Human – Machine Learning

Visual Performance Analysis of Memory Behavior in a Task-Based Runtime on Hybrid Platforms

Visual Signatures in Video Visualization

Visual Simulation of Breaking Waves in Shallow Water

Visual Simulation of Flow

Visual Simulation of Heat Shimmering and Mirage

Visual simulation of shockwaves

Visual simulation of thermal fluid dynamics in a pressurized water reactor

Visual system design for excavator simulator with deformable terrain

Visual-model-based, real-time 3D pose tracking for autonomous navigation: methodology and experiments

Visual, Spatial and Temporal Quality in Video-Based Reconstruction of People: Achieving, Prototyping and Evaluating

Visualisation of Physical Lung Simulation: an Interactive Application to Assist Physicians

Visualising Interfaces in Scalar and Vector Field-Model Simulations

Visualising spins and clusters in regular and small-world Ising models with GPUs

Visualization and Analysis of GPU Summer School Applicants and Participants

Visualization and Correction of Automated Segmentation, Tracking and Lineaging from 5-D Stem Cell Image Sequences

Visualization and GPU-accelerated simulation of medical ultrasound from CT images

Visualization assisted by parallel processing

Visualization in the Einstein Year 2005: a case study on explanatory and illustrative visualization of relativity and astrophysics

Visualization of Astronomical Nebulae via Distributed Multi-GPU Compressed Sensing Tomography

Visualization of Fibrous and Thread-like Data

Visualization of large multidimensional data sets by using multi-core CPU, GPU and MPI cluster

Visualization of Large Volumetric Multi-Channel Microscopy Data Streams on Standard PCs

Visualization of level-of-detail meshes on the GPU

Visualization of LIDAR datasets using point-based rendering technique

Visualization of OpenCL Application Execution on CPU-GPU Systems

Visualization of Pareto Solutions by Spherical Self-Organizing Map and It’s acceleration on a GPU

Visualization of structured nonuniform grids

Visualization Tool for GPGPU Programming

Visualization with stylized line primitives

Visualizing and Analyzing the Mona Lisa

Visualizing complex dynamics in many-core accelerator architectures

Visualizing Complex Functions Using GPUs

Visualizing Multiwavelength Astrophysical Data

Visualizing the Radiation of the Kelvin-Helmholtz Instability

Visualizing Trends on Twitter

VitBit: Enhancing Embedded GPU Performance for AI Workloads through Register Operand Packing

Vivaldi: A Domain-Specific Language for Volume Processing and Visualization on Distributed Heterogeneous Systems

Vlasov on GPU (VOG Project)

VOCL: An Optimized Environment for Transparent Virtualization of Graphics Processing Units

Voice Command Recognition with Dynamic Time Warping (DTW) using Graphics Processing Units (GPU) with Compute Unified Device Architecture (CUDA)

Brief statistics for this page

Titles: 100

Download open PDFs: 87

Package packages: 14

UniCoder: Unified Visual-to-Code Generation via Symbolic Rewards and Reference-Guided Code Optimization

CuFuzz: An API-Knowledge-Graph Coverage-Driven Fuzzing Framework for CUDA Libraries

AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuning

KernelBenchX: A Comprehensive Benchmark for Evaluating LLM-Generated GPU Kernels

CUDA Kernel Fusion Benchmarks

Analyzing the Impact of Kernel Fusion on GPU Tensor Operation Performance: A Systematic Performance Study

IntelliKit: Agent-first tooling for AMD hardware

Kerncap: Automated Kernel Extraction and Isolation for AMD GPUs

DITRON: Distributed Compiler based on Triton for Parallel Systems

DITRON: Distributed Multi-level Tiling Compiler for Parallel Tensor Programs

See all packages

* * *

high performance computing on graphics processing units: hgpu.org

Papers on hgpu.org (.txt-file)

Recent source codes

UniCoder: Unified Visual-to-Code Generation via Symbolic Rewards and Reference-Guided Code Optimization

CuFuzz: An API-Knowledge-Graph Coverage-Driven Fuzzing Framework for CUDA Libraries

AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuning

Probe-and-Refine Tuning of Repository Guidance for AI Coding Agents

CUDAnalyst (CUDA + Analyst)

CodegenBench

KernelBenchX: A Comprehensive Benchmark for Evaluating LLM-Generated GPU Kernels

CUDA Kernel Fusion Benchmarks

IntelliKit: Agent-first tooling for AMD hardware

DITRON: Distributed Compiler based on Triton for Parallel Systems

Most viewed papers (last 30 days)