docs/html.1.2.x/solver__BiCGStab__L__Cmplx_8cpp_source.html

 #include "solver_BiCGStab_L_Cmplx.h"


 using std::valarray;


 #ifdef USE_FACTORY

 namespace {

   Solver *create_object(Fopr *fopr)

   {

     return new Solver_BiCGStab_L_Cmplx(fopr);

   }


   bool init = Solver::Factory::Register("BiCGStab_L_Cmplx", create_object);

 }

 #endif


 //- parameter entries

 namespace {

   void append_entry(Parameters& param)

   {

     param.Register_int("maximum_number_of_iteration", 0);

     param.Register_double("convergence_criterion_squared", 0.0);


     param.Register_int("number_of_orthonormal_vectors", 0);


     param.Register_string("verbose_level", "NULL");

   }


 #ifdef USE_PARAMETERS_FACTORY

   bool init_param = ParametersFactory::Register("Solver.BiCGStab_L_Cmplx", append_entry);

 #endif

 }

 //- end


 //- parameters class

 Parameters_Solver_BiCGStab_L_Cmplx::Parameters_Solver_BiCGStab_L_Cmplx() { append_entry(*this); }

 //- end


 const std::string Solver_BiCGStab_L_Cmplx::class_name = "Solver_BiCGStab_L_Cmplx";


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::set_parameters(const Parameters& params)

 {

   const string str_vlevel = params.get_string("verbose_level");


   m_vl = vout.set_verbose_level(str_vlevel);


   //- fetch and check input parameters

   int    Niter;

   double Stop_cond;

   int    N_L;


   int err = 0;

   err += params.fetch_int("maximum_number_of_iteration", Niter);

   err += params.fetch_double("convergence_criterion_squared", Stop_cond);

   err += params.fetch_int("number_of_orthonormal_vectors", N_L);


   if (err) {

     vout.crucial(m_vl, "%s: fetch error, input parameter not found.\n", class_name.c_str());

     abort();

   }


   set_parameters(Niter, Stop_cond);

   set_parameters_L(N_L);

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::set_parameters(const int Niter, const double Stop_cond)

 {

   ThreadManager_OpenMP::assert_single_thread(class_name);


   //- print input parameters

   vout.general(m_vl, "%s: input parameters\n", class_name.c_str());

   vout.general(m_vl, "  Niter     = %d\n", Niter);

   vout.general(m_vl, "  Stop_cond = %16.8e\n", Stop_cond);


   //- range check

   int err = 0;

   err += ParameterCheck::non_negative(Niter);

   err += ParameterCheck::square_non_zero(Stop_cond);


   if (err) {

     vout.crucial(m_vl, "%s: parameter range check failed.\n", class_name.c_str());

     abort();

   }


   //- store values

   m_Niter     = Niter;

   m_Stop_cond = Stop_cond;

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::set_parameters_L(const int N_L)

 {

   //- print input parameters

   vout.general(m_vl, "  N_L   = %d\n", N_L);


   //- range check

   int err = 0;

   err += ParameterCheck::non_negative(N_L);


   if (err) {

     vout.crucial(m_vl, "%s: parameter range check failed.\n", class_name.c_str());

     abort();

   }


   //- store values

   m_N_L = N_L;

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::solve(Field& xq, const Field& b,

                                     int& Nconv, double& diff)

 {

   //#pragma omp parallel

   {

     double bnorm2 = b.norm2();

     double snorm  = 1.0 / bnorm2;

     int    bsize  = b.size();

     double rr;


     int nth = ThreadManager_OpenMP::get_num_threads();

     int ith = ThreadManager_OpenMP::get_thread_id();


 #pragma omp master

     {

       vout.paranoiac(m_vl, "%s: starts\n", class_name.c_str());

       vout.paranoiac(m_vl, "  norm of b = %16.8e\n", bnorm2);

       vout.paranoiac(m_vl, "  size of b = %d\n", bsize);

     }

 #pragma omp barrier


     reset_field(b);


     // Nconv = -1;

     int Nconv2 = 0;

     copy(s, b); // s = b;


     solve_init(b, rr);


     bool is_converged = false;


 #pragma omp master

     vout.detailed(m_vl, "    iter: %8d  %22.15e\n", 0, rr * snorm);

 #pragma omp barrier


     for (int iter = 0; iter < m_Niter; iter++) {

       if (!is_converged) {

         solve_step(rr);


         Nconv2 += 2 * m_N_L;


 #pragma omp master

         vout.detailed(m_vl, "    iter: %8d  %22.15e\n", Nconv2, rr * snorm);

 #pragma omp barrier


         if (rr * snorm < m_Stop_cond) {

           m_fopr->mult(s, x); // s  = m_fopr->mult(x);

           axpy(s, -1.0, b);   // s -= b;


           double diff2 = s.norm2();

           ThreadManager_OpenMP::sync_barrier_all();


           nth = ThreadManager_OpenMP::get_num_threads();

           if (ith == 0) vout.detailed(m_vl, "    iter0: %8d  %22.15e\n", nth, diff2 * snorm);


           if (diff2 * snorm < m_Stop_cond) {

             // NB. Nconv is calculated above.

             // break;

             is_converged = true;

           }


           copy(s, x); // s = x;

           solve_init(b, rr);


           nth = ThreadManager_OpenMP::get_num_threads();

           if (ith == 0) vout.detailed(m_vl, "    iter1: %8d  %22.15e\n", nth, rr * snorm);

         }

       }

     }


     m_fopr->mult(s, x); // s  = m_fopr->mult(x);

     axpy(s, -1.0, b);   // s -= b;


     copy(xq, x);        // xq = x;


     double diff2 = s.norm2();


 #pragma omp master

     {

       diff  = sqrt(diff2);

       Nconv = Nconv2;

     }

 #pragma omp barrier


     if (diff2 * snorm > m_Stop_cond) {

 #pragma omp master

       vout.crucial(m_vl, "%s: not converged.\n", class_name.c_str());

 #pragma omp barrier

       abort();

     }

   } // end of parallel region

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::reset_field(const Field& b)

 {

 #pragma omp master

   {

     int Nin  = b.nin();

     int Nvol = b.nvol();

     int Nex  = b.nex();


     if ((s.nin() != Nin) || (s.nvol() != Nvol) || (s.nex() != Nex)) {

       s.reset(Nin, Nvol, Nex);

       x.reset(Nin, Nvol, Nex);


       r_init.reset(Nin, Nvol, Nex);


       v_tmp.reset(Nin, Nvol, Nex);


       vout.paranoiac(m_vl, "    %s: field size reset.\n", class_name.c_str());

     }


     u.resize(m_N_L + 1);

     r.resize(m_N_L + 1);


     for (int i = 0; i < m_N_L + 1; ++i) {

       u[i].reset(Nin, Nvol, Nex);

       r[i].reset(Nin, Nvol, Nex);

     }

   }

 #pragma omp barrier

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::solve_init(const Field& b, double& rr)

 {

   copy(x, s);  // x = s;


   //- r[0] = b - A x_0

   m_fopr->mult(v_tmp, s);   // v_tmp = m_fopr->mult(s);

   copy(r[0], b);            // r[0]  = b;

   axpy(r[0], -1.0, v_tmp);  // r[0] -= v_tmp;


   copy(r_init, r[0]);       // r_init = r[0];

   rr = r[0].norm2();        // rr     = r[0] * r[0];


   u[0].set(0.0);            // u[0] = 0.0;


   // NB. alpha_prev = 0.0 \neq 1.0

 #pragma omp master

   {

     rho_prev   = cmplx(-1.0, 0.0);

     alpha_prev = cmplx(0.0, 0.0);

   }

 #pragma omp barrier

 }


 //====================================================================

 void Solver_BiCGStab_L_Cmplx::solve_step(double& rr)

 {

   dcomplex rho_prev2   = rho_prev;

   dcomplex alpha_prev2 = alpha_prev;


   for (int j = 0; j < m_N_L; ++j) {

     dcomplex rho = dotc(r[j], r_init);   // dcomplex rho  = r[j] * r_init;

     rho = conj(rho);


     dcomplex beta = alpha_prev2 * (rho / rho_prev2);


     rho_prev2 = rho;


     for (int i = 0; i < j + 1; ++i) {

       aypx(-beta, u[i], r[i]);   // u[i] = - beta * u[i] + r[i];

     }


     m_fopr->mult(u[j + 1], u[j]);  // u[j+1] = m_fopr->mult(u[j]);


     dcomplex gamma = dotc(u[j + 1], r_init);

     alpha_prev2 = rho_prev2 / conj(gamma);


     for (int i = 0; i < j + 1; ++i) {

       axpy(r[i], -alpha_prev2, u[i + 1]);  // r[i] -= alpha_prev * u[i+1];

     }


     m_fopr->mult(r[j + 1], r[j]);        // r[j+1] = m_fopr->mult(r[j]);


     axpy(x, alpha_prev2, u[0]);          // x += alpha_prev * u[0];

   }


   valarray<double>   sigma(m_N_L + 1);

   valarray<dcomplex> gamma_prime(m_N_L + 1);


   // NB. tau(m_N_L,m_N_L+1), not (m_N_L+1,m_N_L+1)

   valarray<dcomplex> tau(m_N_L * (m_N_L + 1));

   int                ij, ji;


   for (int j = 1; j < m_N_L + 1; ++j) {

     for (int i = 1; i < j; ++i) {

       ij = index_ij(i, j);


       dcomplex r_ji = dotc(r[j], r[i]);

       tau[ij] = conj(r_ji) / sigma[i];  // tau[ij]  = (r[j] * r[i]) / sigma[i];

       axpy(r[j], -tau[ij], r[i]);       // r[j]    -= tau[ij] * r[i];

     }


     sigma[j] = r[j].norm2();  // sigma[j] = r[j] * r[j];


     dcomplex r_0j = dotc(r[0], r[j]);

     gamma_prime[j] = conj(r_0j) / sigma[j]; // gamma_prime[j] = (r[0] * r[j]) / sigma[j];

   }


   valarray<dcomplex> gamma(m_N_L + 1);

   dcomplex           c_tmp;


   gamma[m_N_L] = gamma_prime[m_N_L];


   for (int j = m_N_L - 1; j > 0; --j) {

     c_tmp = cmplx(0.0, 0.0);


     for (int i = j + 1; i < m_N_L + 1; ++i) {

       ji     = index_ij(j, i);

       c_tmp += tau[ji] * gamma[i];

     }


     gamma[j] = gamma_prime[j] - c_tmp;

   }


   // NB. gamma_double_prime(m_N_L), not (m_N_L+1)

   valarray<dcomplex> gamma_double_prime(m_N_L);


   for (int j = 1; j < m_N_L; ++j) {

     c_tmp = cmplx(0.0, 0.0);


     for (int i = j + 1; i < m_N_L; ++i) {

       ji     = index_ij(j, i);

       c_tmp += tau[ji] * gamma[i + 1];

     }


     gamma_double_prime[j] = gamma[j + 1] + c_tmp;

   }


   axpy(x, gamma[1], r[0]);                    // x    += gamma[          1] * r[    0];

   axpy(r[0], -gamma_prime[m_N_L], r[m_N_L]);  // r[0] -= gamma_prime[m_N_L] * r[m_N_L];

   axpy(u[0], -gamma[m_N_L], u[m_N_L]);        // u[0] -= gamma[      m_N_L] * u[m_N_L];


   for (int j = 1; j < m_N_L; ++j) {

     axpy(x, gamma_double_prime[j], r[j]);      // x    += gamma_double_prime[j] * r[j];

     axpy(r[0], -gamma_prime[j], r[j]);         // r[0] -= gamma_prime[       j] * r[j];

     axpy(u[0], -gamma[j], u[j]);               // u[0] -= gamma[             j] * u[j];

   }


   rr = r[0].norm2();  // rr = r[0] * r[0];


 #pragma omp master

   {

     rho_prev   = rho_prev2;

     alpha_prev = alpha_prev2;

     rho_prev  *= -gamma_prime[m_N_L];

   }

 #pragma omp barrier

 }


 //====================================================================

 //============================================================END=====

Bridge::vout
BridgeIO vout
Definition: bridgeIO.cpp:207

Solver_BiCGStab_L_Cmplx::class_name
static const std::string class_name
Definition: solver_BiCGStab_L_Cmplx.h:46

Bridge::BridgeIO::detailed
void detailed(const char *format,...)
Definition: bridgeIO.cpp:50

ThreadManager_OpenMP::get_num_threads
static int get_num_threads()
returns available number of threads.
Definition: threadManager_OpenMP.cpp:95

Parameters::Register_string
void Register_string(const string &, const string &)
Definition: parameters.cpp:352

Solver_BiCGStab_L_Cmplx::index_ij
int index_ij(int i, int j)
Definition: solver_BiCGStab_L_Cmplx.h:83

Field::norm2
double norm2() const
Definition: field.cpp:469

Fopr::mult
virtual const Field mult(const Field &)=0
multiplies fermion operator to a given field and returns the resultant field.

Solver_BiCGStab_L_Cmplx::m_N_L
int m_N_L
Definition: solver_BiCGStab_L_Cmplx.h:51

Bridge::BridgeIO::general
void general(const char *format,...)
Definition: bridgeIO.cpp:38

Solver_BiCGStab_L_Cmplx::m_Stop_cond
double m_Stop_cond
Definition: solver_BiCGStab_L_Cmplx.h:55

Parameters::Register_int
void Register_int(const string &, const int)
Definition: parameters.cpp:331

Solver_BiCGStab_L_Cmplx::set_parameters_L
void set_parameters_L(const int N_L)
Definition: solver_BiCGStab_L_Cmplx.cpp:111

Solver_BiCGStab_L_Cmplx
BiCGStab(L) algorithm.
Definition: solver_BiCGStab_L_Cmplx.h:43

Solver_BiCGStab_L_Cmplx::solve_step
void solve_step(double &)
Definition: solver_BiCGStab_L_Cmplx.cpp:287

Field
Container of Field-type object.
Definition: field.h:37

Solver_BiCGStab_L_Cmplx::u
std::valarray< Field > u
Definition: solver_BiCGStab_L_Cmplx.h:57

Solver_BiCGStab_L_Cmplx::rho_prev
dcomplex rho_prev
Definition: solver_BiCGStab_L_Cmplx.h:60

Field::nvol
int nvol() const
Definition: field.h:101

Solver_BiCGStab_L_Cmplx::solve_init
void solve_init(const Field &, double &)
Definition: solver_BiCGStab_L_Cmplx.cpp:262

Parameters
Class for parameters.
Definition: parameters.h:40

copy
void copy(Field &y, const Field &x)
copy(y, x): y = x
Definition: field.cpp:409

ThreadManager_OpenMP::get_thread_id
static int get_thread_id()
returns thread id.
Definition: threadManager_OpenMP.cpp:107

ParameterCheck::square_non_zero
int square_non_zero(const double v)
Definition: checker.cpp:41

Field::nin
int nin() const
Definition: field.h:100

Solver_BiCGStab_L_Cmplx::set_parameters
void set_parameters(const Parameters &params)
Definition: solver_BiCGStab_L_Cmplx.cpp:57

dotc
dcomplex dotc(const Field &y, const Field &x)
Definition: field.cpp:98

Field::reset
void reset(const int Nin, const int Nvol, const int Nex, const element_type cmpl=COMPLEX)
Definition: field.h:82

Solver_BiCGStab_L_Cmplx::s
Field s
Definition: solver_BiCGStab_L_Cmplx.h:59

ThreadManager_OpenMP::sync_barrier_all
static void sync_barrier_all()
barrier among all the threads and nodes.
Definition: threadManager_OpenMP.cpp:141

Solver_BiCGStab_L_Cmplx::r_init
Field r_init
Definition: solver_BiCGStab_L_Cmplx.h:59

Solver_BiCGStab_L_Cmplx::m_fopr
Fopr * m_fopr
Definition: solver_BiCGStab_L_Cmplx.h:49

aypx
void aypx(const double a, Field &y, const Field &x)
aypx(y, a, x): y := a * y + x
Definition: field.cpp:489

Field::nex
int nex() const
Definition: field.h:102

solver_BiCGStab_L_Cmplx.h

Bridge::BridgeIO::paranoiac
void paranoiac(const char *format,...)
Definition: bridgeIO.cpp:62

Solver_BiCGStab_L_Cmplx::v_tmp
Field v_tmp
Definition: solver_BiCGStab_L_Cmplx.h:59

Solver_BiCGStab_L_Cmplx::m_Niter
int m_Niter
Definition: solver_BiCGStab_L_Cmplx.h:54

axpy
void axpy(Field &y, const double a, const Field &x)
axpy(y, a, x): y := a * x + y
Definition: field.cpp:193

Bridge::BridgeIO::crucial
void crucial(const char *format,...)
Definition: bridgeIO.cpp:26

Solver
Base class for linear solver class family.
Definition: solver.h:37

ParametersFactory::Register
static bool Register(const std::string &realm, const creator_callback &cb)
Definition: parameters_factory.h:71

Solver_BiCGStab_L_Cmplx::alpha_prev
dcomplex alpha_prev
Definition: solver_BiCGStab_L_Cmplx.h:60

ParameterCheck::non_negative
int non_negative(const int v)
Definition: checker.cpp:21

Parameters::Register_double
void Register_double(const string &, const double)
Definition: parameters.cpp:324

Solver_BiCGStab_L_Cmplx::r
std::valarray< Field > r
Definition: solver_BiCGStab_L_Cmplx.h:57

Fopr
Base class of fermion operator family.
Definition: fopr.h:39

Parameters::fetch_double
int fetch_double(const string &key, double &val) const
Definition: parameters.cpp:124

Parameters::get_string
string get_string(const string &key) const
Definition: parameters.cpp:85

Solver_BiCGStab_L_Cmplx::reset_field
void reset_field(const Field &)
Definition: solver_BiCGStab_L_Cmplx.cpp:230

Parameters::fetch_int
int fetch_int(const string &key, int &val) const
Definition: parameters.cpp:141

Solver_BiCGStab_L_Cmplx::x
Field x
Definition: solver_BiCGStab_L_Cmplx.h:59

Parameters_Solver_BiCGStab_L_Cmplx::Parameters_Solver_BiCGStab_L_Cmplx
Parameters_Solver_BiCGStab_L_Cmplx()
Definition: solver_BiCGStab_L_Cmplx.cpp:51

Solver::m_vl
Bridge::VerboseLevel m_vl
Definition: solver.h:56

Bridge::BridgeIO::set_verbose_level
static VerboseLevel set_verbose_level(const std::string &str)
Definition: bridgeIO.cpp:191

Solver_BiCGStab_L_Cmplx::solve
void solve(Field &solution, const Field &source, int &Nconv, double &diff)
Definition: solver_BiCGStab_L_Cmplx.cpp:131

ThreadManager_OpenMP::assert_single_thread
static void assert_single_thread(const std::string &classname)
assert currently running on single thread.
Definition: threadManager_OpenMP.cpp:151

Field::size
int size() const
Definition: field.h:106