/[MITgcm]/MITgcm_contrib/cg2d_bench/cg2d.F

Diff of /MITgcm_contrib/cg2d_bench/cg2d.F

Parent Directory | Revision Log | View Revision Graph Revision Graph | View Patch Patch

-revision 1.1 by ce107,
Fri May 12 21:58:05 2006 UTC
+revision 1.3 by ce107,
Wed May 31 16:27:25 2006 UTC
 Line 1
+ C       $Id$
        SUBROUTINE CG2D
  C     /==========================================================\
  C     | SUBROUTINE CG2D                                          |
-Line 28 
 C     === Global data ===
+Line 29 
 C     === Global data ===
  #include "EEPARAMS.h"
  #include "PARAMS.h"
  #include "CG2D.h"
+ #if defined(USE_PAPI_FLOPS) || defined(USE_PAPI_FLIPS)
+ #if defined(PAPI_PER_ITERATION) || defined(PAPI_PER_TIMESTEP)
+ #include "PAPI.h"
+ #endif
+ #endif
  C     === Routine arguments ===
  C     myThid - Thread on which I am working.
-Line 49 
 C                   or they converge at
+Line 55 
 C                   or they converge at
  C     err         - Measure of residual of Ax - b, usually the norm.
  C     I, J, N     - Loop counters ( N counts CG iterations )
        INTEGER actualIts
-       REAL    actualResidual
        INTEGER bi, bj
        INTEGER I, J, N
-       REAL    err
+ #ifdef USE_MIXED_PRECISION
-       REAL    errSum
+       REAL*8    actualResidual
-       REAL    etaN
+       REAL*8    err
-       REAL    etaNM1
+       REAL*8    errSum
-       REAL    etaNSum
+       REAL*8    etaN
-       REAL    beta
+       REAL*8    etaNM1
-       REAL    alpha
+       REAL*8    etaNSum
-       REAL    alphaSum
+       REAL*8    beta
-       REAL    sumRHS
+       REAL*8    alpha
-       REAL    temp
+       REAL*8    alphaSum
+       REAL*8    sumRHS
+       REAL*8    temp
+ #else
+       Real    actualResidual
+       Real    err
+       Real    errSum
+       Real    etaN
+       Real    etaNM1
+       Real    etaNSum
+       Real    beta
+       Real    alpha
+       Real    alphaSum
+       Real    sumRHS
+       Real    temp
+ #endif
  C--   Initialise inverter
-       etaNM1              = 1. D0
+       etaNM1              = 1. _d 0
  C--   Initial residual calculation
        err    = 0. _d 0
        sumRHS = 0. _d 0
        DO J=1,sNy
         DO I=1,sNx
-         cg2d_s(I,J) = 0.
+         cg2d_s(I,J) = 0. _d 0
           cg2d_r(I,J) = cg2d_b(I,J) -
       &   ( aW2d(I  ,J  )*cg2d_x(I-1,J  )+aW2d(I+1,J  )*cg2d_x(I+1,J  )
       &    +aS2d(I  ,J  )*cg2d_x(I  ,J-1)+aS2d(I  ,J+1)*cg2d_x(I  ,J+1)
-Line 92 
 C--   Initial residual calculation
+Line 112 
 C--   Initial residual calculation
        actualIts      = 0
        actualResidual = SQRT(err)
        WRITE(6,*) ' CG2D iters, err = ', actualIts, actualResidual
-       IF ( actualResidual .EQ. 0. ) STOP 'ABNORMAL END: RESIDUAL 0'
+       IF ( actualResidual .EQ. 0. _d 0) STOP 'ABNORMAL END: RESIDUAL 0'
  C     >>>>>>>>>>>>>>> BEGIN SOLVER <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
        DO 10 N=1, cg2dMaxIters
-Line 126 
 C--    processes.
+Line 146 
 C--    processes.
  C--    Ten extra exchanges
  #ifdef TEN_EXTRA_EXCHS
-        CALL EXCH_XY_R8( cg2d_s )
+        DO J=1,10
-        CALL EXCH_XY_R8( cg2d_s )
+           CALL EXCH_XY_R8( cg2d_s )
-        CALL EXCH_XY_R8( cg2d_s )
+        ENDDO
-        CALL EXCH_XY_R8( cg2d_s )
-        CALL EXCH_XY_R8( cg2d_s )
-        CALL EXCH_XY_R8( cg2d_s )
-        CALL EXCH_XY_R8( cg2d_s )
-        CALL EXCH_XY_R8( cg2d_s )
-        CALL EXCH_XY_R8( cg2d_s )
-        CALL EXCH_XY_R8( cg2d_s )
  #endif
  C==    Evaluate laplace operator on conjugate gradient vector
-Line 155 
 C==    q = A.s
+Line 168 
 C==    q = A.s
  #ifdef HUNDRED_EXTRA_SUMS
  C--    Hundred extra global sums
-        CALL GSUM_R8( temp, alpha )
+        DO J=1,100
-        CALL GSUM_R8( temp, alpha )
+           CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
+        ENDDO
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
-        CALL GSUM_R8( temp, alpha )
  #endif
         alpha = temp
-Line 277 
 C      Now compute "interior" points.
+Line 193 
 C      Now compute "interior" points.
         err = SQRT(err)
         actualIts      = N
         actualResidual = err
- CcnhDebugStarts
+ #ifdef RESIDUAL_PER_ITERATION
- C      WRITE(6,*) ' CG2D iters, err = ', actualIts, actualResidual
+        WRITE(6,*) ' CG2D iters, err = ', actualIts, actualResidual
- CcnhDebugEnds
+ #endif
         IF ( err .LT. cg2dTargetResidual ) GOTO 11
         CALL EXCH_XY_R8(cg2d_r )
+ #ifdef PAPI_PER_ITERATION
+ #ifdef USE_PAPI_FLOPS
+        call PAPIF_flops(real_time, proc_time, flpops, mflops, check)
+        WRITE(6,'(F10.3,A7,F10.3,A37,I8)')
+      $      mflops, ' user ', mflops*proc_time/real_time,
+      $      ' wallclock Mflop/s during iteration ', N
+ #else
+ #ifdef USE_PAPI_FLIPS
+        call PAPIF_flips(real_time, proc_time, flpops, mflops, check)
+        WRITE(6,'(F10.3,A7,F10.3,A37,I8)')
+      $      mflops, ' user ', mflops*proc_time/real_time,
+      $      ' wallclock Mflip/s during iteration ', N
+ #endif
+ #endif
+ #endif
 CONTINUE
 CONTINUE
        CALL EXCH_XY_R8(cg2d_x )
+ #ifdef PAPI_PER_TIMESTEP
+ #ifdef USE_PAPI_FLOPS
+        call PAPIF_flops(real_time, proc_time, flpops, mflops, check)
+        WRITE(6,'(F10.3,A7,F10.3,A37,I8)')
+      $      mflops, ' user ', mflops*proc_time/real_time,
+      $      ' wallclock Mflop/s during iteration ', N
+ #else
+ #ifdef USE_PAPI_FLIPS
+        call PAPIF_flips(real_time, proc_time, flpops, mflops, check)
+        WRITE(6,'(F10.3,A7,F10.3,A37,I8)')
+      $      mflops, ' user ', mflops*proc_time/real_time,
+      $      ' wallclock Mflip/s during iteration ', N
+ #endif
+ #endif
+ #endif
        WRITE(6,*) ' CG2D iters, err = ', actualIts, actualResidual
  C     Calc Ax to check result

 Legend:



Removed from v.1.1
 


changed lines


 
Added in v.1.3
 Legend:



Removed from v.1.1
 


changed lines


 
Added in v.1.3
-Removed from v.1.1
+Added in v.1.3

	ViewVC Help
Powered by ViewVC 1.1.22