docs/html.1.5.x/solver__BiCGStab__L__Cmplx_8cpp_source.html

 #include "solver_BiCGStab_L_Cmplx.h"


 #ifdef USE_FACTORY_AUTOREGISTER

 namespace {

   bool init = Solver_BiCGStab_L_Cmplx::register_factory();

 }

 #endif


 const std::string Solver_BiCGStab_L_Cmplx::class_name = "Solver_BiCGStab_L_Cmplx";


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::set_parameters(const Parameters& params)

 {

   const string str_vlevel = params.get_string("verbose_level");


   m_vl = vout.set_verbose_level(str_vlevel);


   //- fetch and check input parameters

   int    Niter, Nrestart;

   double Stop_cond;

   bool   use_init_guess;

   double Omega_tolerance;

   int    N_L;


   int err = 0;

   err += params.fetch_int("maximum_number_of_iteration", Niter);

   err += params.fetch_int("maximum_number_of_restart", Nrestart);

   err += params.fetch_double("convergence_criterion_squared", Stop_cond);

   err += params.fetch_bool("use_initial_guess", use_init_guess);

   err += params.fetch_double("Omega_tolerance", Omega_tolerance);

   err += params.fetch_int("number_of_orthonormal_vectors", N_L);


   if (err) {

     vout.crucial(m_vl, "Error at %s: input parameter not found.\n", class_name.c_str());

     exit(EXIT_FAILURE);

   }


   set_parameters(Niter, Nrestart, Stop_cond, use_init_guess);

   set_parameters_BiCGStab_series(Omega_tolerance);

   set_parameters_L(N_L);

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::set_parameters(const int Niter, const int Nrestart, const double Stop_cond)

 {

   ThreadManager_OpenMP::assert_single_thread(class_name);


   //- print input parameters

   vout.general(m_vl, "%s: input parameters\n", class_name.c_str());

   vout.general(m_vl, "  Niter     = %d\n", Niter);

   vout.general(m_vl, "  Nrestart  = %d\n", Nrestart);

   vout.general(m_vl, "  Stop_cond = %8.2e\n", Stop_cond);


   //- range check

   int err = 0;

   err += ParameterCheck::non_negative(Niter);

   err += ParameterCheck::non_negative(Nrestart);

   err += ParameterCheck::square_non_zero(Stop_cond);


   if (err) {

     vout.crucial(m_vl, "Error at %s: parameter range check failed.\n", class_name.c_str());

     exit(EXIT_FAILURE);

   }


   //- store values

   m_Niter     = Niter;

   m_Nrestart  = Nrestart;

   m_Stop_cond = Stop_cond;

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::set_parameters(const int Niter, const int Nrestart, const double Stop_cond, const bool use_init_guess)

 {

   ThreadManager_OpenMP::assert_single_thread(class_name);


   //- print input parameters

   vout.general(m_vl, "%s: input parameters\n", class_name.c_str());

   vout.general(m_vl, "  Niter          = %d\n", Niter);

   vout.general(m_vl, "  Nrestart       = %d\n", Nrestart);

   vout.general(m_vl, "  Stop_cond      = %8.2e\n", Stop_cond);

   vout.general(m_vl, "  use_init_guess = %s\n", use_init_guess ? "true" : "false");


   //- range check

   int err = 0;

   err += ParameterCheck::non_negative(Niter);

   err += ParameterCheck::non_negative(Nrestart);

   err += ParameterCheck::square_non_zero(Stop_cond);


   if (err) {

     vout.crucial(m_vl, "Error at %s: parameter range check failed.\n", class_name.c_str());

     exit(EXIT_FAILURE);

   }


   //- store values

   m_Niter          = Niter;

   m_Nrestart       = Nrestart;

   m_Stop_cond      = Stop_cond;

   m_use_init_guess = use_init_guess;

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::set_parameters_BiCGStab_series(const double Omega_tolerance)

 {

   ThreadManager_OpenMP::assert_single_thread(class_name);


   //- print input parameters

   vout.general(m_vl, "  Omega_tolerance = %8.2e\n", Omega_tolerance);


   //- range check

   // NB. Omega_tolerance == 0.0 is allowed.


   //- store values

   m_Omega_tolerance = Omega_tolerance;

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::set_parameters_L(const int N_L)

 {

   //- print input parameters

   vout.general(m_vl, "  N_L   = %d\n", N_L);


   //- range check

   int err = 0;

   err += ParameterCheck::non_negative(N_L);


   if (err) {

     vout.crucial(m_vl, "Error at %s: parameter range check failed.\n", class_name.c_str());

     exit(EXIT_FAILURE);

   }


   //- store values

   m_N_L = N_L;

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::solve(Field& xq, const Field& b,

                                     int& Nconv, double& diff)

 {

   const double bnorm2 = b.norm2();

   const int    bsize  = b.size();


   vout.paranoiac(m_vl, "%s: starts\n", class_name.c_str());

   vout.paranoiac(m_vl, "  norm of b = %16.8e\n", bnorm2);

   vout.paranoiac(m_vl, "  size of b = %d\n", bsize);


   bool   is_converged = false;

   int    Nconv2       = 0;

   double diff2        = 1.0;  // superficial initialization

   double rr;


   int Nconv_unit = 1;

   // if (m_fopr->get_mode() == "DdagD" || m_fopr->get_mode() == "DDdag") {

   //   Nconv_unit = 2;

   // }


   reset_field(b);


   if (m_use_init_guess) {

     copy(m_s, xq);  // s = xq;

   } else {

     copy(m_s, b);   // s = b;

   }

   solve_init(b, rr);

   Nconv2 += Nconv_unit;


   vout.detailed(m_vl, "    iter: %8d  %22.15e\n", Nconv2, rr / bnorm2);


   for (int i_restart = 0; i_restart < m_Nrestart; i_restart++) {

     for (int iter = 0; iter < m_Niter; iter++) {

       if (rr / bnorm2 < m_Stop_cond) break;


       solve_step(rr);

       Nconv2 += 2 * Nconv_unit * m_N_L;


       vout.detailed(m_vl, "    iter: %8d  %22.15e\n", Nconv2, rr / bnorm2);

     }


     //- calculate true residual

     m_fopr->mult(m_s, m_x); // s  = m_fopr->mult(x);

     axpy(m_s, -1.0, b);     // s -= b;

     diff2 = m_s.norm2();


     if (diff2 / bnorm2 < m_Stop_cond) {

       vout.detailed(m_vl, "%s: converged.\n", class_name.c_str());

       vout.detailed(m_vl, "  iter(final): %8d  %22.15e\n", Nconv2, diff2 / bnorm2);


       is_converged = true;


       m_Nrestart_count = i_restart;

       m_Nconv_count    = Nconv2;


       break;

     } else {

       //- restart with new approximate solution

       copy(m_s, m_x); // s = x;

       solve_init(b, rr);


       vout.detailed(m_vl, "%s: restarted.\n", class_name.c_str());

     }

   }


   if (!is_converged) {

     vout.crucial(m_vl, "Error at %s: not converged.\n", class_name.c_str());

     vout.crucial(m_vl, "  iter(final): %8d  %22.15e\n", Nconv2, diff2 / bnorm2);

     exit(EXIT_FAILURE);

   }


   copy(xq, m_x); // xq = x;


 #pragma omp barrier

 #pragma omp master

   {

     diff  = sqrt(diff2 / bnorm2);

     Nconv = Nconv2;

   }

 #pragma omp barrier

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::reset_field(const Field& b)

 {

 #pragma omp barrier

 #pragma omp master

   {

     const int Nin  = b.nin();

     const int Nvol = b.nvol();

     const int Nex  = b.nex();


     if ((m_s.nin() != Nin) || (m_s.nvol() != Nvol) || (m_s.nex() != Nex)) {

       m_s.reset(Nin, Nvol, Nex);

       m_x.reset(Nin, Nvol, Nex);

       m_r_init.reset(Nin, Nvol, Nex);

       m_v.reset(Nin, Nvol, Nex);

     }


     m_u.resize(m_N_L + 1);

     m_r.resize(m_N_L + 1);


     for (int i = 0; i < m_N_L + 1; ++i) {

       m_u[i].reset(Nin, Nvol, Nex);

       m_r[i].reset(Nin, Nvol, Nex);

     }

   }

 #pragma omp barrier


   vout.paranoiac(m_vl, "    %s: field size reset.\n", class_name.c_str());

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::solve_init(const Field& b, double& rr)

 {

   copy(m_x, m_s);  // x = s;


   for (int i = 0; i < m_N_L + 1; ++i) {

     m_r[i].set(0.0);        // r[i] = 0.0;

     m_u[i].set(0.0);        // u[i] = 0.0;

   }


   // r[0] = b - A x_0

   m_fopr->mult(m_v, m_s);   // m_v = m_fopr->mult(s);

   copy(m_r[0], b);          // r[0]  = b;

   axpy(m_r[0], -1.0, m_v);  // r[0] -= m_v;


   copy(m_r_init, m_r[0]);   // r_init = r[0];

   rr = m_r[0].norm2();      // rr     = r[0] * r[0];


 #pragma omp barrier

 #pragma omp master

   {

     m_rho_prev = cmplx(-1.0, 0.0);


     // NB. m_alpha_prev = 0.0 \neq 1.0

     m_alpha_prev = cmplx(0.0, 0.0);

   }

 #pragma omp barrier

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::solve_step(double& rr)

 {

   dcomplex rho_prev2   = m_rho_prev;

   dcomplex alpha_prev2 = m_alpha_prev;


   for (int j = 0; j < m_N_L; ++j) {

     dcomplex rho = dotc(m_r[j], m_r_init);  // dcomplex rho  = r[j] * r_init;

     rho = conj(rho);


     dcomplex beta = alpha_prev2 * (rho / rho_prev2);


     rho_prev2 = rho;


     for (int i = 0; i < j + 1; ++i) {

       aypx(-beta, m_u[i], m_r[i]);  // u[i] = - beta * u[i] + r[i];

     }


     m_fopr->mult(m_u[j + 1], m_u[j]);  // u[j+1] = m_fopr->mult(u[j]);


     dcomplex gamma = dotc(m_u[j + 1], m_r_init);

     alpha_prev2 = rho_prev2 / conj(gamma);


     for (int i = 0; i < j + 1; ++i) {

       axpy(m_r[i], -alpha_prev2, m_u[i + 1]);  // r[i] -= alpha_prev * u[i+1];

     }


     m_fopr->mult(m_r[j + 1], m_r[j]);  // r[j+1] = m_fopr->mult(r[j]);


     axpy(m_x, alpha_prev2, m_u[0]);    // x += alpha_prev * u[0];

   }


   std::vector<double>   sigma(m_N_L + 1);

   std::vector<dcomplex> gamma_prime(m_N_L + 1);


   // NB. tau(m_N_L,m_N_L+1), not (m_N_L+1,m_N_L+1)

   std::vector<dcomplex> tau(m_N_L * (m_N_L + 1));


   const double sigma_0 = m_r[0].norm2();


   for (int j = 1; j < m_N_L + 1; ++j) {

     for (int i = 1; i < j; ++i) {

       int ij = index_ij(i, j);


       dcomplex r_ji = dotc(m_r[j], m_r[i]);

       tau[ij] = conj(r_ji) / sigma[i];  // tau[ij]  = (r[j] * r[i]) / sigma[i];

       axpy(m_r[j], -tau[ij], m_r[i]);   // r[j]    -= tau[ij] * r[i];

     }


     sigma[j] = m_r[j].norm2();  // sigma[j] = r[j] * r[j];


     dcomplex r_0j = dotc(m_r[0], m_r[j]);

     gamma_prime[j] = conj(r_0j) / sigma[j]; // gamma_prime[j] = (r[0] * r[j]) / sigma[j];


     //- a prescription to improve stability of BiCGStab(L)

     double abs_rho = abs(r_0j) / sqrt(sigma[j] * sigma_0);

     if (abs_rho < m_Omega_tolerance) {

       gamma_prime[j] *= m_Omega_tolerance / abs_rho;

     }

   }


   std::vector<dcomplex> gamma(m_N_L + 1);

   dcomplex              c_tmp;


   gamma[m_N_L] = gamma_prime[m_N_L];


   for (int j = m_N_L - 1; j > 0; --j) {

     dcomplex c_tmp = cmplx(0.0, 0.0);


     for (int i = j + 1; i < m_N_L + 1; ++i) {

       int ji = index_ij(j, i);

       c_tmp += tau[ji] * gamma[i];

     }


     gamma[j] = gamma_prime[j] - c_tmp;

   }


   // NB. gamma_double_prime(m_N_L), not (m_N_L+1)

   std::vector<dcomplex> gamma_double_prime(m_N_L);


   for (int j = 1; j < m_N_L; ++j) {

     dcomplex c_tmp = cmplx(0.0, 0.0);


     for (int i = j + 1; i < m_N_L; ++i) {

       int ji = index_ij(j, i);

       c_tmp += tau[ji] * gamma[i + 1];

     }


     gamma_double_prime[j] = gamma[j + 1] + c_tmp;

   }


   axpy(m_x, gamma[1], m_r[0]);                    // x    += gamma[          1] * r[    0];

   axpy(m_r[0], -gamma_prime[m_N_L], m_r[m_N_L]);  // r[0] -= gamma_prime[m_N_L] * r[m_N_L];

   axpy(m_u[0], -gamma[m_N_L], m_u[m_N_L]);        // u[0] -= gamma[      m_N_L] * u[m_N_L];


   for (int j = 1; j < m_N_L; ++j) {

     axpy(m_x, gamma_double_prime[j], m_r[j]);     // x    += gamma_double_prime[j] * r[j];

     axpy(m_r[0], -gamma_prime[j], m_r[j]);        // r[0] -= gamma_prime[       j] * r[j];

     axpy(m_u[0], -gamma[j], m_u[j]);              // u[0] -= gamma[             j] * u[j];

   }


   rr = m_r[0].norm2();  // rr = r[0] * r[0];


 #pragma omp barrier

 #pragma omp master

   {

     m_rho_prev   = rho_prev2;

     m_alpha_prev = alpha_prev2;


     m_rho_prev *= -gamma_prime[m_N_L];

   }

 #pragma omp barrier

 }


 //====================================================================

 double Solver_BiCGStab_L_Cmplx::flop_count()

 {

   const int NPE = CommonParameters::NPE();


   //- NB1 Nin = 2 * Nc * Nd, Nex = 1  for field_F

   //- NB2 Nvol = CommonParameters::Nvol()/2 for eo

   const int Nin  = m_x.nin();

   const int Nvol = m_x.nvol();

   const int Nex  = m_x.nex();


   const double gflop_fopr = m_fopr->flop_count();


   if (gflop_fopr < CommonParameters::epsilon_criterion()) {

     vout.crucial(m_vl, "Warning at %s: no fopr->flop_count() is available, setting flop = 0\n", class_name.c_str());

     return 0.0;

   }


   const double gflop_axpy = (Nin * Nex * 2) * ((Nvol * NPE) / 1.0e+9);

   const double gflop_dotc = (Nin * Nex * 4) * ((Nvol * NPE) / 1.0e+9);

   const double gflop_norm = (Nin * Nex * 2) * ((Nvol * NPE) / 1.0e+9);


   int N_L_part = 0;

   for (int j = 0; j < m_N_L; ++j) {

     for (int i = 0; i < j + 1; ++i) {

       N_L_part += 1;

     }

   }


   const double gflop_init           = gflop_fopr + gflop_axpy + gflop_norm;

   const double gflop_step_BiCG_part = 2 * m_N_L * gflop_fopr

                                       + 2 * m_N_L * gflop_dotc

                                       + (m_N_L + 2 * N_L_part) * gflop_axpy;

   const double gflop_step_L_part = (N_L_part + m_N_L) * gflop_dotc

                                    + (N_L_part + 3 * m_N_L) * gflop_axpy

                                    + (m_N_L + 1) * gflop_norm;

   const double gflop_step          = gflop_step_BiCG_part + gflop_step_L_part;

   const double gflop_true_residual = gflop_fopr + gflop_axpy + gflop_norm;


   const int    N_iter = (m_Nconv_count - 1) / (2 * m_N_L);

   const double gflop  = gflop_norm + gflop_init + gflop_step * N_iter + gflop_true_residual * (m_Nrestart_count + 1)

                         + gflop_init * m_Nrestart_count;


   return gflop;

 }


 //====================================================================

 //============================================================END=====

Solver_BiCGStab_L_Cmplx::m_Nconv_count
int m_Nconv_count
Definition: solver_BiCGStab_L_Cmplx.h:68

Bridge::vout
BridgeIO vout
Definition: bridgeIO.cpp:503

Parameters::fetch_bool
int fetch_bool(const string &key, bool &value) const
Definition: parameters.cpp:391

Solver_BiCGStab_L_Cmplx::class_name
static const std::string class_name
Definition: solver_BiCGStab_L_Cmplx.h:47

Bridge::BridgeIO::detailed
void detailed(const char *format,...)
Definition: bridgeIO.cpp:216

Solver_BiCGStab_L_Cmplx::m_alpha_prev
dcomplex m_alpha_prev
Definition: solver_BiCGStab_L_Cmplx.h:62

CommonParameters::epsilon_criterion
static double epsilon_criterion()
Definition: commonParameters.h:119

Field::norm2
double norm2() const
Definition: field.cpp:592

Solver_BiCGStab_L_Cmplx::m_N_L
int m_N_L
Definition: solver_BiCGStab_L_Cmplx.h:58

Bridge::BridgeIO::general
void general(const char *format,...)
Definition: bridgeIO.cpp:197

Solver_BiCGStab_L_Cmplx::m_Stop_cond
double m_Stop_cond
Definition: solver_BiCGStab_L_Cmplx.h:53

Solver_BiCGStab_L_Cmplx::m_Nrestart_count
int m_Nrestart_count
Definition: solver_BiCGStab_L_Cmplx.h:67

Solver_BiCGStab_L_Cmplx::set_parameters_L
void set_parameters_L(const int N_L)
Definition: solver_BiCGStab_L_Cmplx.cpp:134

Solver_BiCGStab_L_Cmplx::solve_step
void solve_step(double &)
Definition: solver_BiCGStab_L_Cmplx.cpp:303

Field
Container of Field-type object.
Definition: field.h:45

Parameters::fetch_double
int fetch_double(const string &key, double &value) const
Definition: parameters.cpp:327

Solver_BiCGStab_L_Cmplx::m_rho_prev
dcomplex m_rho_prev
Definition: solver_BiCGStab_L_Cmplx.h:62

Solver_BiCGStab_L_Cmplx::m_r_init
Field m_r_init
Definition: solver_BiCGStab_L_Cmplx.h:65

Solver_BiCGStab_L_Cmplx::m_Omega_tolerance
double m_Omega_tolerance
Definition: solver_BiCGStab_L_Cmplx.h:56

Field::nvol
int nvol() const
Definition: field.h:127

Solver_BiCGStab_L_Cmplx::solve_init
void solve_init(const Field &, double &)
Definition: solver_BiCGStab_L_Cmplx.cpp:273

Parameters
Class for parameters.
Definition: parameters.h:46

copy
void copy(Field &y, const Field &x)
copy(y, x): y = x
Definition: field.cpp:532

Solver_BiCGStab_L_Cmplx::flop_count
double flop_count()
Definition: solver_BiCGStab_L_Cmplx.cpp:422

Solver_BiCGStab_L_Cmplx::m_use_init_guess
bool m_use_init_guess
Definition: solver_BiCGStab_L_Cmplx.h:54

ParameterCheck::square_non_zero
int square_non_zero(const double v)
Definition: parameterCheck.cpp:43

Field::nin
int nin() const
Definition: field.h:126

Solver_BiCGStab_L_Cmplx::set_parameters
void set_parameters(const Parameters &params)
Definition: solver_BiCGStab_L_Cmplx.cpp:25

dotc
dcomplex dotc(const Field &y, const Field &x)
Definition: field.cpp:155

Parameters::fetch_int
int fetch_int(const string &key, int &value) const
Definition: parameters.cpp:346

Fopr::flop_count
virtual double flop_count()
returns the flop in giga unit
Definition: fopr.h:120

Solver_BiCGStab_L_Cmplx::m_fopr
Fopr * m_fopr
Definition: solver_BiCGStab_L_Cmplx.h:50

aypx
void aypx(const double a, Field &y, const Field &x)
aypx(y, a, x): y := a * y + x
Definition: field.cpp:612

Solver_BiCGStab_L_Cmplx::set_parameters_BiCGStab_series
void set_parameters_BiCGStab_series(const double Omega_tolerance)
Definition: solver_BiCGStab_L_Cmplx.cpp:118

Field::nex
int nex() const
Definition: field.h:128

solver_BiCGStab_L_Cmplx.h

Bridge::BridgeIO::paranoiac
void paranoiac(const char *format,...)
Definition: bridgeIO.cpp:235

Field::reset
void reset(const int Nin, const int Nvol, const int Nex, const element_type cmpl=Element_type::COMPLEX)
Definition: field.h:95

Solver_BiCGStab_L_Cmplx::index_ij
int index_ij(const int i, const int j)
Definition: solver_BiCGStab_L_Cmplx.h:112

Solver_BiCGStab_L_Cmplx::m_Niter
int m_Niter
Definition: solver_BiCGStab_L_Cmplx.h:52

axpy
void axpy(Field &y, const double a, const Field &x)
axpy(y, a, x): y := a * x + y
Definition: field.cpp:319

Bridge::BridgeIO::crucial
void crucial(const char *format,...)
Definition: bridgeIO.cpp:178

Solver_BiCGStab_L_Cmplx::m_x
Field m_x
Definition: solver_BiCGStab_L_Cmplx.h:65

Solver_BiCGStab_L_Cmplx::m_v
Field m_v
Definition: solver_BiCGStab_L_Cmplx.h:65

Solver_BiCGStab_L_Cmplx::m_r
std::vector< Field > m_r
Definition: solver_BiCGStab_L_Cmplx.h:64

Fopr::mult
virtual void mult(Field &, const Field &)=0
multiplies fermion operator to a given field (2nd argument)

ParameterCheck::non_negative
int non_negative(const int v)
Definition: parameterCheck.cpp:21

Solver_BiCGStab_L_Cmplx::m_s
Field m_s
Definition: solver_BiCGStab_L_Cmplx.h:65

Solver_BiCGStab_L_Cmplx::m_u
std::vector< Field > m_u
Definition: solver_BiCGStab_L_Cmplx.h:64

ThreadManager_OpenMP::assert_single_thread
static void assert_single_thread(const std::string &class_name)
assert currently running on single thread.
Definition: threadManager_OpenMP.cpp:238

Solver_BiCGStab_L_Cmplx::m_Nrestart
int m_Nrestart
Definition: solver_BiCGStab_L_Cmplx.h:52

Parameters::get_string
string get_string(const string &key) const
Definition: parameters.cpp:221

Solver_BiCGStab_L_Cmplx::reset_field
void reset_field(const Field &)
Definition: solver_BiCGStab_L_Cmplx.cpp:242

Solver::m_vl
Bridge::VerboseLevel m_vl
Definition: solver.h:63

Bridge::BridgeIO::set_verbose_level
static VerboseLevel set_verbose_level(const std::string &str)
Definition: bridgeIO.cpp:131

Solver_BiCGStab_L_Cmplx::solve
void solve(Field &solution, const Field &source, int &Nconv, double &diff)
Definition: solver_BiCGStab_L_Cmplx.cpp:154

CommonParameters::NPE
static int NPE()
Definition: commonParameters.h:101

Field::size
int size() const
Definition: field.h:132