high performance computing on graphics processing units: hgpu.org

hgpu.org » Symbolic Computation

Accelerating Winograd Convolutions using Symbolic Computation and Meta-programming

Arya Mazaheri, Tim Beringer, Matthew Moskewicz, Felix Wolf, Ali Jannesari

View

Tags: AMD Radeon RX 580, ATI, Code generation, Computer science, CUDA, Deep learning, Neural networks, nVidia, nVidia GeForce GTX 1080 Ti, OpenCL, Performance, performance portability, Symbolic Computation, Vulkan

April 26, 2020 by hgpu

GPU Accelerated Finite Element Assembly with Runtime Compilation

Tao Cui, Xiaohu Guo, Hui Liu

View

Download (PDF)

Tags: Computer science, CUDA, Differential equations, FEM, Finite element method, Mathematical Software, Numerical Analysis, nVidia, Partial differential equations, PDEs, Symbolic Computation, Tesla K20, Tesla M2090, Tesla V100

February 15, 2018 by hgpu

Comprehensive Optimization of Parametric Kernels for Graphics Processing Units

Xiaohui Chen, Marc Moreno-Maza, Jeeva Paudel, Ning Xie

View

Download (PDF)

Source codes

Tags: Code generation, Computer science, CUDA, LLVM, nVidia, Package, Performance, PTX, Symbolic Computation, Tesla M2050

January 20, 2018 by hgpu

Theano: A Python framework for fast computation of mathematical expressions

Rami Al-Rfou, Guillaume Alain, Amjad Almahairi, Christof Angermueller, Dzmitry Bahdanau, Nicolas Ballas, Frederic Bastien, Justin Bayer, Anatoly Belikov, Alexander Belopolsky, Yoshua Bengio, Arnaud Bergeron, James Bergstra, Valentin Bisson, Josh Bleecher Snyder, Nicolas Bouchard, Nicolas Boulanger-Lewandowski, Xavier Bouthillier, Alexandre de Brebisson, Olivier Breuleux, Pierre-Luc Carrier, Kyunghyun Cho, Jan Chorowski, Paul Christiano, Tim Cooijmans, Marc-Alexandre Cote, Myriam Cote, Aaron Courville, Yann N. Dauphin, Olivier Delalleau, Julien Demouth, Guillaume Desjardins, Sander Dieleman, Laurent Dinh, Melanie Ducoffe, Vincent Dumoulin, Samira Ebrahimi Kahou, Dumitru Erhan, Ziye Fan, Orhan Firat, Mathieu Germain, Xavier Glorot, Ian Goodfellow, Matt Graham, Caglar Gulcehre, Philippe Hamel, Iban Harlouchet, Jean-Philippe Heng, Balazs Hidasi, Sina Honari, Arjun Jain, Sebastien Jean, Kai Jia, Mikhail Korobov, Vivek Kulkarni, Alex Lamb, Pascal Lamblin, Eric Larsen, Cesar Laurent, Sean Lee, Simon Lefrancois, Simon Lemieux, Nicholas Leonard, Zhouhan Lin, Jesse A. Livezey, Cory Lorenz, Jeremiah Lowin, Qianli Ma, Pierre-Antoine Manzagol, Olivier Mastropietro, Robert T. McGibbon, Roland Memisevic, Bart van Merrienboer, Vincent Michalski, Mehdi Mirza, Alberto Orlandi, Christopher Pal, Razvan Pascanu, Mohammad Pezeshki, Colin Raffel, Daniel Renshaw, Matthew Rocklin, Adriana Romero, Markus Roth, Peter Sadowski, John Salvatier, Francois Savard, Jan Schluter, John Schulman, Gabriel Schwartz, Iulian Vlad Serban, Dmitriy Serdyuk, Samira Shabanian, Etienne Simon, Sigurd Spieckermann, S. Ramana Subramanyam, Jakub Sygnowski, Jeremie Tanguay, Gijs van Tulder, Joseph Turian, Sebastian Urban, Pascal Vincent, Francesco Visin, Harm de Vries, David Warde-Farley, Dustin J. Webb, Matthew Willson, Kelvin Xu, Lijun Xue, Li Yao, Saizheng Zhang, Ying Zhang

View

Download (PDF)

Source codes

Tags: Computer science, CUDA, Deep learning, Machine learning, nVidia, nVidia GeForce GTX Titan X, Package, Performance, Python, Symbolic Computation

May 11, 2016 by hgpu