[nvptx] Add PTX_CTA_SIZE
authorTom de Vries <tdevries@suse.de>
Wed, 19 Dec 2018 17:16:10 +0000 (17:16 +0000)
committerTom de Vries <vries@gcc.gnu.org>
Wed, 19 Dec 2018 17:16:10 +0000 (17:16 +0000)
2018-12-19  Tom de Vries  <tdevries@suse.de>

* config/nvptx/nvptx.c (PTX_CTA_SIZE): Define.

From-SVN: r267281

gcc/ChangeLog
gcc/config/nvptx/nvptx.c

index 7b0ca6357de667f4040d3f20e130202ae572fbd5..365d5931bcf44d62a32af5b26a1c85b0e3037e1e 100644 (file)
@@ -1,3 +1,7 @@
+2018-12-19  Tom de Vries  <tdevries@suse.de>
+
+       * config/nvptx/nvptx.c (PTX_CTA_SIZE): Define.
+
 2018-12-19  Tom de Vries  <tdevries@suse.de>
 
        * omp-offload.c (oacc_fn_attrib_level): Remove static.
index 2a2d638e6d72e2af745ed460cb2abcb7417998f9..f4095ff5f558034245d2230ac14ed433591181bb 100644 (file)
 #define PTX_WORKER_LENGTH 32
 #define PTX_DEFAULT_RUNTIME_DIM 0 /* Defer to runtime.  */
 
+/* The PTX concept CTA (Concurrent Thread Array) maps on the CUDA concept thread
+   block, which has had a maximum number of threads of 1024 since CUDA version
+   2.x.  */
+#define PTX_CTA_SIZE 1024
+
 /* The various PTX memory areas an object might reside in.  */
 enum nvptx_data_area
 {