main/doxygen_doc/lalg__basic_8F90_source.html

!! Copyright (C) 2002-2006 M. Marques, A. Castro, A. Rubio, G. Bertsch

!!

!! This program is free software; you can redistribute it and/or modify

!! it under the terms of the GNU General Public License as published by

!! the Free Software Foundation; either version 2, or (at your option)

!! any later version.

!!

!! This program is distributed in the hope that it will be useful,

!! but WITHOUT ANY WARRANTY; without even the implied warranty of

!! MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

!! GNU General Public License for more details.

!!

!! You should have received a copy of the GNU General Public License

!! along with this program; if not, write to the Free Software

!! Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA

!! 02110-1301, USA.

!!


#include "global.h"


module lalg_basic_oct_m

  use blas_oct_m

  use debug_oct_m

  use global_oct_m

  use, intrinsic :: iso_fortran_env

  use messages_oct_m

  use profiling_oct_m

  use utils_oct_m


  implicit none


  private

  public ::           &

    lalg_swap,        &

    lalg_scal,        &

    lalg_axpy,        &

    lalg_copy,        &

    lalg_nrm2,        &

    lalg_symv,        &

    lalg_gemv,        &

    lalg_gemm,        &

    lalg_gemm_cn,     &

    lalg_gemm_nc,     &

    lalg_gemm_cc,     &

    lalg_trmm,        &

    lalg_symm

  ! ------------------------------------------------------------------

  ! BLAS level I

  ! ------------------------------------------------------------------


  interface lalg_swap

    module procedure swap_1_2

    module procedure swap_2_2

    module procedure swap_3_2

    module procedure swap_4_2

    module procedure swap_1_4

    module procedure swap_2_4

    module procedure swap_3_4

    module procedure swap_4_4

  end interface lalg_swap


  interface lalg_scal

    module procedure scal_1_2

    module procedure scal_2_2

    module procedure scal_3_2

    module procedure scal_4_2

    module procedure scal_1_4

    module procedure scal_2_4

    module procedure scal_3_4

    module procedure scal_4_4

    module procedure scal_5_4

    module procedure scal_6_4

  end interface lalg_scal


  interface lalg_axpy

    module procedure axpy_1_2

    module procedure axpy_2_2

    module procedure axpy_3_2

    module procedure axpy_4_2

    module procedure axpy_1_4

    module procedure axpy_2_4

    module procedure axpy_3_4

    module procedure axpy_4_4

    module procedure axpy_5_4

    module procedure axpy_6_4

    module procedure axpy_7_4

  end interface lalg_axpy


  interface lalg_copy

    module procedure copy_1_2

    module procedure copy_2_2

    module procedure copy_3_2

    module procedure copy_4_2

    module procedure copy_1_4

    module procedure copy_2_4

    module procedure copy_3_4

    module procedure copy_4_4

  end interface lalg_copy


  interface lalg_nrm2

    module procedure nrm2_2

    module procedure nrm2_4

  end interface lalg_nrm2


  ! ------------------------------------------------------------------

  ! BLAS level II

  ! ------------------------------------------------------------------


  interface lalg_symv

    module procedure symv_1_2

    module procedure symv_1_4

    module procedure symv_2_2

    module procedure symv_2_4

  end interface lalg_symv


  interface lalg_gemv

    module procedure gemv_1_2

    module procedure gemv_1_4

    module procedure gemv_2_2

    module procedure gemv_2_4

  end interface lalg_gemv


  ! ------------------------------------------------------------------

  ! BLAS level III

  ! ------------------------------------------------------------------


  interface lalg_gemm

    module procedure gemm_1_2

    module procedure gemm_1_4

    module procedure gemm_2_2

    module procedure gemm_2_4

    module procedure dgemm_simple

  end interface lalg_gemm


  interface lalg_gemm_cn

    module procedure gemm_cn_1_2

    module procedure gemm_cn_1_4

    module procedure gemm_cn_2_2

    module procedure gemm_cn_2_4

  end interface lalg_gemm_cn


  interface lalg_gemm_nc

    module procedure gemm_nc_1_2

    module procedure gemm_nc_1_4

    module procedure gemm_nc_2_2

    module procedure gemm_nc_2_4

  end interface lalg_gemm_nc


  interface lalg_gemm_cc

    module procedure gemm_cc_1_2

    module procedure gemm_cc_1_4

  end interface lalg_gemm_cc


  interface lalg_symm

    module procedure symm_1_2

    module procedure symm_1_4

  end interface lalg_symm


  interface lalg_trmm

    module procedure trmm_1_2

    module procedure trmm_1_4

  end interface lalg_trmm


contains


  subroutine dgemm_simple(a, b, c, transa, transb, alpha, beta)

    real(real64), contiguous,  intent(in )    :: a(:,:)

    real(real64), contiguous,  intent(in )    :: b(:,:)

    real(real64), contiguous,  intent(inout)  :: c(:,:)

    !                                                           !! zeroed on input, as \p beta is 0.

    character(len=1), optional, intent(in )   :: transa, transb

    real(real64),     optional, intent(in )   :: alpha

    real(real64),     optional, intent(in )   :: beta

    !                                                           !! For example, 1.0 allows addition of the MM product to an

    !                                                           !! input \p c. The default, 0.0, defines \p c as the MM product.


    integer          :: m, k, l, n

    character(len=1) :: ta, tb

    real(real64)     :: p_alpha, p_beta


    push_sub(dgemm_simple)


    ta = 'N'

    tb = 'N'

    if (present(transa)) ta = transa

    if (present(transb)) tb = transb


    p_alpha = optional_default(alpha, 1.0_real64)

    p_beta = optional_default(beta, 0.0_real64)


    if (ta == 'n' .or. ta == 'N') then

      m = size(a, 1)

      k = size(a, 2)

    else

      m = size(a, 2)

      k = size(a, 1)

    end if

    if (tb == 'n' .or. tb == 'N') then

      l = size(b, 1)

      n = size(b, 2)

    else

      l = size(b, 2)

      n = size(b, 1)

    end if

    assert(size(c, 1) == m)

    assert(size(c, 2) == n)

    assert(k == l)


    call blas_gemm(ta, tb, m, n, k, p_alpha, a(1, 1), lead_dim(a), &

      b(1, 1), lead_dim(b), p_beta, c(1, 1), lead_dim(c))


    pop_sub(dgemm_simple)


  end subroutine dgemm_simple


#  define N_ARG_TYPES 2

#  include "lalg_basic_blas_inc.F90"

#  undef N_ARG_TYPES


#  define N_ARG_TYPES 4

#  include "lalg_basic_blas_inc.F90"

#  undef N_ARG_TYPES


end module lalg_basic_oct_m


!! Local Variables:

!! mode: f90

!! coding: utf-8

!! End:

blas_oct_m::blas_gemm
--------------— gemm ---------------— performs one of the matrix-matrix operations
Definition: blas.F90:363

global_oct_m::optional_default
Definition: global.F90:270

lalg_basic_oct_m::lalg_axpy
constant times a vector plus a vector
Definition: lalg_basic.F90:171

lalg_basic_oct_m::lalg_copy
Copies a vector x, to a vector y.
Definition: lalg_basic.F90:186

lalg_basic_oct_m::lalg_gemm_cc
lalg_gemm with both the (Hermitian) transpose of A and B.
Definition: lalg_basic.F90:252

lalg_basic_oct_m::lalg_gemm_cn
The same as above but with (Hermitian) transpose of A.
Definition: lalg_basic.F90:236

lalg_basic_oct_m::lalg_gemm_nc
The same as lalg_gemm but with (Hermitian) transpose of B.
Definition: lalg_basic.F90:244

lalg_basic_oct_m::lalg_gemm
Matrix-matrix multiplication plus matrix.
Definition: lalg_basic.F90:227

lalg_basic_oct_m::lalg_gemv
Definition: lalg_basic.F90:215

lalg_basic_oct_m::lalg_nrm2
Returns the euclidean norm of a vector.
Definition: lalg_basic.F90:198

lalg_basic_oct_m::lalg_scal
scales a vector by a constant
Definition: lalg_basic.F90:157

lalg_basic_oct_m::lalg_swap
swap two vectors
Definition: lalg_basic.F90:145

lalg_basic_oct_m::lalg_symm
The following matrix multiplications all expect upper triangular matrices for a. For real matrices,...
Definition: lalg_basic.F90:259

lalg_basic_oct_m::lalg_symv
Matrix-vector multiplication plus vector.
Definition: lalg_basic.F90:208

lalg_basic_oct_m::lalg_trmm
Matrix-matrix multiplication.
Definition: lalg_basic.F90:265

utils_oct_m::lead_dim
Definition: utils.F90:159

blas_oct_m
This module contains interfaces for BLAS routines You should not use these routines directly....
Definition: blas.F90:118

debug_oct_m
Definition: debug.F90:114

global_oct_m
Definition: global.F90:114

lalg_basic_oct_m
Definition: lalg_basic.F90:114

lalg_basic_oct_m::symv_2_4
subroutine symv_2_4(n1, n2, alpha, a, x, beta, y)
Definition: lalg_basic.F90:1795

lalg_basic_oct_m::gemm_cc_1_2
subroutine gemm_cc_1_2(m, n, k, alpha, a, b, beta, c)
GEMM when both a and b are (Hermitian) transposes.
Definition: lalg_basic.F90:1064

lalg_basic_oct_m::trmm_1_2
subroutine trmm_1_2(m, n, uplo, transa, side, alpha, a, b)
Definition: lalg_basic.F90:1119

lalg_basic_oct_m::axpy_1_4
subroutine axpy_1_4(n1, da, dx, dy)
Definition: lalg_basic.F90:1410

lalg_basic_oct_m::axpy_4_2
subroutine axpy_4_2(n1, n2, n3, n4, da, dx, dy)
Definition: lalg_basic.F90:644

lalg_basic_oct_m::swap_4_2
subroutine swap_4_2(n1, n2, n3, n4, dx, dy)
Definition: lalg_basic.F90:432

lalg_basic_oct_m::copy_2_4
subroutine copy_2_4(n1, n2, dx, dy)
Definition: lalg_basic.F90:1662

lalg_basic_oct_m::swap_2_2
subroutine swap_2_2(n1, n2, dx, dy)
Definition: lalg_basic.F90:385

lalg_basic_oct_m::gemm_1_2
subroutine gemm_1_2(m, n, k, alpha, a, b, beta, c)
Definition: lalg_basic.F90:910

lalg_basic_oct_m::gemm_2_4
subroutine gemm_2_4(m1, m2, n, k, alpha, a, b, beta, c)
Definition: lalg_basic.F90:1888

lalg_basic_oct_m::axpy_6_4
subroutine axpy_6_4(n1, n2, da, dx, dy)
Definition: lalg_basic.F90:1570

lalg_basic_oct_m::axpy_2_2
subroutine axpy_2_2(n1, n2, da, dx, dy)
Definition: lalg_basic.F90:573

lalg_basic_oct_m::trmm_1_4
subroutine trmm_1_4(m, n, uplo, transa, side, alpha, a, b)
Definition: lalg_basic.F90:2076

lalg_basic_oct_m::swap_3_2
subroutine swap_3_2(n1, n2, n3, dx, dy)
Definition: lalg_basic.F90:411

lalg_basic_oct_m::copy_3_2
subroutine copy_3_2(n1, n2, n3, dx, dy)
Definition: lalg_basic.F90:736

lalg_basic_oct_m::scal_5_4
subroutine scal_5_4(n1, da, dx)
Definition: lalg_basic.F90:1362

lalg_basic_oct_m::copy_4_2
subroutine copy_4_2(n1, n2, n3, n4, dx, dy)
Definition: lalg_basic.F90:761

lalg_basic_oct_m::swap_3_4
subroutine swap_3_4(n1, n2, n3, dx, dy)
Definition: lalg_basic.F90:1232

lalg_basic_oct_m::gemm_nc_2_2
subroutine gemm_nc_2_2(m1, m2, n1, n2, k, alpha, a, b, beta, c)
Definition: lalg_basic.F90:1026

lalg_basic_oct_m::scal_2_4
subroutine scal_2_4(n1, n2, da, dx)
Definition: lalg_basic.F90:1297

lalg_basic_oct_m::swap_4_4
subroutine swap_4_4(n1, n2, n3, n4, dx, dy)
Definition: lalg_basic.F90:1253

lalg_basic_oct_m::gemm_cn_1_2
subroutine gemm_cn_1_2(m, n, k, alpha, a, b, beta, c)
The same as above but with (Hermitian) transpose of a. Note, in this also works when a and b are real...
Definition: lalg_basic.F90:957

lalg_basic_oct_m::gemm_cn_2_4
subroutine gemm_cn_2_4(m1, m2, n1, n2, k, alpha, a, b, beta, c)
Definition: lalg_basic.F90:1935

lalg_basic_oct_m::scal_1_2
subroutine scal_1_2(n1, da, dx)
Definition: lalg_basic.F90:459

lalg_basic_oct_m::scal_4_4
subroutine scal_4_4(n1, n2, n3, n4, da, dx)
Definition: lalg_basic.F90:1341

lalg_basic_oct_m::swap_1_2
subroutine swap_1_2(n1, dx, dy)
Definition: lalg_basic.F90:368

lalg_basic_oct_m::axpy_3_4
subroutine axpy_3_4(n1, n2, n3, da, dx, dy)
Definition: lalg_basic.F90:1478

lalg_basic_oct_m::swap_1_4
subroutine swap_1_4(n1, dx, dy)
Definition: lalg_basic.F90:1189

lalg_basic_oct_m::axpy_4_4
subroutine axpy_4_4(n1, n2, n3, n4, da, dx, dy)
Definition: lalg_basic.F90:1510

lalg_basic_oct_m::gemv_2_2
subroutine gemv_2_2(m1, m2, n, alpha, a, x, beta, y)
Definition: lalg_basic.F90:879

lalg_basic_oct_m::dgemm_simple
subroutine dgemm_simple(a, b, c, transa, transb, alpha, beta)
GEMM with a simplified API for two matrices of consistent shape and type.
Definition: lalg_basic.F90:286

lalg_basic_oct_m::scal_6_4
subroutine scal_6_4(n1, n2, da, dx)
Definition: lalg_basic.F90:1379

lalg_basic_oct_m::gemm_2_2
subroutine gemm_2_2(m1, m2, n, k, alpha, a, b, beta, c)
Definition: lalg_basic.F90:931

lalg_basic_oct_m::gemm_cc_1_4
subroutine gemm_cc_1_4(m, n, k, alpha, a, b, beta, c)
GEMM when both a and b are (Hermitian) transposes.
Definition: lalg_basic.F90:2021

lalg_basic_oct_m::scal_1_4
subroutine scal_1_4(n1, da, dx)
Definition: lalg_basic.F90:1280

lalg_basic_oct_m::copy_1_2
subroutine copy_1_2(n1, dx, dy)
Definition: lalg_basic.F90:682

lalg_basic_oct_m::gemv_2_4
subroutine gemv_2_4(m1, m2, n, alpha, a, x, beta, y)
Definition: lalg_basic.F90:1836

lalg_basic_oct_m::gemm_cn_2_2
subroutine gemm_cn_2_2(m1, m2, n1, n2, k, alpha, a, b, beta, c)
Definition: lalg_basic.F90:978

lalg_basic_oct_m::scal_2_2
subroutine scal_2_2(n1, n2, da, dx)
Definition: lalg_basic.F90:476

lalg_basic_oct_m::axpy_5_4
subroutine axpy_5_4(n1, da, dx, dy)
Definition: lalg_basic.F90:1545

lalg_basic_oct_m::copy_2_2
subroutine copy_2_2(n1, n2, dx, dy)
Definition: lalg_basic.F90:705

lalg_basic_oct_m::axpy_7_4
subroutine axpy_7_4(n1, n2, n3, da, dx, dy)
Definition: lalg_basic.F90:1606

lalg_basic_oct_m::axpy_3_2
subroutine axpy_3_2(n1, n2, n3, da, dx, dy)
Definition: lalg_basic.F90:612

lalg_basic_oct_m::scal_3_4
subroutine scal_3_4(n1, n2, n3, da, dx)
Definition: lalg_basic.F90:1322

lalg_basic_oct_m::gemm_nc_2_4
subroutine gemm_nc_2_4(m1, m2, n1, n2, k, alpha, a, b, beta, c)
Definition: lalg_basic.F90:1983

lalg_basic_oct_m::axpy_1_2
subroutine axpy_1_2(n1, da, dx, dy)
Definition: lalg_basic.F90:544

lalg_basic_oct_m::nrm2_4
real(real64) function nrm2_4(n, dx)
Definition: lalg_basic.F90:1749

lalg_basic_oct_m::symv_1_2
subroutine symv_1_2(n, alpha, a, x, beta, y)
Definition: lalg_basic.F90:820

lalg_basic_oct_m::gemm_1_4
subroutine gemm_1_4(m, n, k, alpha, a, b, beta, c)
Definition: lalg_basic.F90:1867

lalg_basic_oct_m::gemv_1_2
subroutine gemv_1_2(m, n, alpha, a, x, beta, y)
Definition: lalg_basic.F90:860

lalg_basic_oct_m::copy_1_4
subroutine copy_1_4(n1, dx, dy)
Definition: lalg_basic.F90:1639

lalg_basic_oct_m::symm_1_4
subroutine symm_1_4(m, n, side, alpha, a, b, beta, c)
The following matrix multiplications all expect upper triangular matrices for a. For real matrices,...
Definition: lalg_basic.F90:2046

lalg_basic_oct_m::gemm_nc_1_2
subroutine gemm_nc_1_2(m, n, k, alpha, a, b, beta, c)
The same as gemm but with (Hermitian) transpose of b. Note, in this also works when a and b are real.
Definition: lalg_basic.F90:1005

lalg_basic_oct_m::symv_2_2
subroutine symv_2_2(n1, n2, alpha, a, x, beta, y)
Definition: lalg_basic.F90:838

lalg_basic_oct_m::swap_2_4
subroutine swap_2_4(n1, n2, dx, dy)
Definition: lalg_basic.F90:1206

lalg_basic_oct_m::copy_4_4
subroutine copy_4_4(n1, n2, n3, n4, dx, dy)
Definition: lalg_basic.F90:1718

lalg_basic_oct_m::nrm2_2
real(real64) function nrm2_2(n, dx)
Definition: lalg_basic.F90:792

lalg_basic_oct_m::gemm_cn_1_4
subroutine gemm_cn_1_4(m, n, k, alpha, a, b, beta, c)
The same as above but with (Hermitian) transpose of a. Note, in this also works when a and b are real...
Definition: lalg_basic.F90:1914

lalg_basic_oct_m::gemm_nc_1_4
subroutine gemm_nc_1_4(m, n, k, alpha, a, b, beta, c)
The same as gemm but with (Hermitian) transpose of b. Note, in this also works when a and b are real.
Definition: lalg_basic.F90:1962

lalg_basic_oct_m::symm_1_2
subroutine symm_1_2(m, n, side, alpha, a, b, beta, c)
The following matrix multiplications all expect upper triangular matrices for a. For real matrices,...
Definition: lalg_basic.F90:1089

lalg_basic_oct_m::axpy_2_4
subroutine axpy_2_4(n1, n2, da, dx, dy)
Definition: lalg_basic.F90:1439

lalg_basic_oct_m::gemv_1_4
subroutine gemv_1_4(m, n, alpha, a, x, beta, y)
Definition: lalg_basic.F90:1817

lalg_basic_oct_m::copy_3_4
subroutine copy_3_4(n1, n2, n3, dx, dy)
Definition: lalg_basic.F90:1693

lalg_basic_oct_m::scal_4_2
subroutine scal_4_2(n1, n2, n3, n4, da, dx)
Definition: lalg_basic.F90:520

lalg_basic_oct_m::symv_1_4
subroutine symv_1_4(n, alpha, a, x, beta, y)
Definition: lalg_basic.F90:1777

lalg_basic_oct_m::scal_3_2
subroutine scal_3_2(n1, n2, n3, da, dx)
Definition: lalg_basic.F90:501

messages_oct_m
Definition: messages.F90:115

profiling_oct_m
Definition: profiling.F90:116

utils_oct_m
This module is intended to contain simple general-purpose utility functions and procedures.
Definition: utils.F90:118