docs/html.2.0.x/Imp_2fopr__CloverTerm__impl_8cpp_source.html

#include "fopr_CloverTerm_impl.h"


#include "Fopr/fopr_thread-inc.h"


namespace Imp {

#if defined USE_GROUP_SU3

#include "fopr_Wilson_impl_SU3-inc.h"

#elif defined USE_GROUP_SU2

#include "fopr_Wilson_impl_SU2-inc.h"

#elif defined USE_GROUP_SU_N

#include "fopr_Wilson_impl_SU_N-inc.h"

#endif


  const std::string Fopr_CloverTerm::class_name = "Imp::Fopr_CloverTerm";


//====================================================================

  void Fopr_CloverTerm::init(const Parameters& params)

  {

    ThreadManager::assert_single_thread(class_name);


    m_vl = CommonParameters::Vlevel();


    vout.general(m_vl, "%s: construction\n", class_name.c_str());

    vout.increase_indent();


    m_Nvol = CommonParameters::Nvol();

    m_Ndim = CommonParameters::Ndim();

    m_Nc   = CommonParameters::Nc();

    m_Nd   = CommonParameters::Nd();

    m_NinF = 2 * m_Nc * m_Nd;


    m_boundary.resize(m_Ndim);

    m_SG.resize(m_Ndim * m_Ndim);


    int Ndf = 2 * m_Nc * m_Nc;

    m_shift = new ShiftField_lex(Ndf);


    std::string repr;

    if (!params.fetch_string("gamma_matrix_type", repr)) {

      m_repr = repr;

    } else {

      m_repr = "Dirac"; // default

      vout.general(m_vl, "gamma_matrix_type is not given: defalt = %s\n",

                   m_repr.c_str());

    }

    if ((m_repr != "Dirac") && (m_repr != "Chiral")) {

      vout.crucial("Error in %s: irrelevant mult mode = %s\n",

                   class_name.c_str(), m_repr.c_str());

      exit(EXIT_FAILURE);

    }


    set_parameters(params);


    setup_gamma_matrices();


    m_U = 0;


    vout.decrease_indent();

    vout.general(m_vl, "%s: construction finished.\n",

                 class_name.c_str());

  }


//====================================================================

  void Fopr_CloverTerm::init(const std::string repr)

  {

    ThreadManager::assert_single_thread(class_name);


    m_vl = CommonParameters::Vlevel();


    vout.general(m_vl, "%s: construction (obsolete)\n",

                 class_name.c_str());


    m_Nvol = CommonParameters::Nvol();

    m_Ndim = CommonParameters::Ndim();

    m_Nc   = CommonParameters::Nc();

    m_Nd   = CommonParameters::Nd();

    m_NinF = 2 * m_Nc * m_Nd;


    m_boundary.resize(m_Ndim);

    m_SG.resize(m_Ndim * m_Ndim);


    m_repr = repr;


    setup_gamma_matrices();


    int Ndf = 2 * m_Nc * m_Nc;

    m_shift = new ShiftField_lex(Ndf);


    m_U = 0;


    vout.general(m_vl, "%s: construction finished.\n",

                 class_name.c_str());

  }


//====================================================================

  void Fopr_CloverTerm::tidyup()

  {

    delete m_shift;

  }


//====================================================================

  void Fopr_CloverTerm::set_parameters(const Parameters& params)

  {

#pragma omp barrier


    int ith = ThreadManager::get_thread_id();


    std::string vlevel;

    if (!params.fetch_string("verbose_level", vlevel)) {

      if (ith == 0) m_vl = vout.set_verbose_level(vlevel);

    }

#pragma omp barrier


    //- fetch and check input parameters

    double           kappa, cSW;

    std::vector<int> bc;


    int err = 0;

    err += params.fetch_double("hopping_parameter", kappa);

    err += params.fetch_double("clover_coefficient", cSW);

    err += params.fetch_int_vector("boundary_condition", bc);


    if (err) {

      vout.crucial("Error at %s: input parameter not found.\n",

                   class_name.c_str());

      exit(EXIT_FAILURE);

    }


    set_parameters(kappa, cSW, bc);

  }


//====================================================================

  void Fopr_CloverTerm::set_parameters(const double kappa,

                                       const double cSW,

                                       const std::vector<int> bc)

  {

    assert(bc.size() == m_Ndim);


#pragma omp barrier

    int ith = ThreadManager::get_thread_id();

    if (ith == 0) {

      m_kappa    = kappa;

      m_cSW      = cSW;

      m_boundary = bc;

    }

#pragma omp barrier


    vout.general(m_vl, "%s: input parameters\n", class_name.c_str());

    vout.general(m_vl, "  gamma matrix type = %s\n", m_repr.c_str());

    vout.general(m_vl, "  kappa = %12.8f\n", kappa);

    vout.general(m_vl, "  cSW   = %12.8f\n", cSW);

    for (int mu = 0; mu < m_Ndim; ++mu) {

      vout.general(m_vl, "  boundary[%d] = %2d\n", mu, bc[mu]);

    }

  }


//====================================================================

  void Fopr_CloverTerm::get_parameters(Parameters& params) const

  {

    params.set_double("hopping_parameter", m_kappa);

    params.set_double("clover_coefficient", m_cSW);

    params.set_int_vector("boundary_condition", m_boundary);

    params.set_string("gamma_matrix_type", m_repr);


    params.set_string("verbose_level", vout.get_verbose_level(m_vl));

  }


//====================================================================

  void Fopr_CloverTerm::setup_gamma_matrices()

  {

    GammaMatrixSet *gmset = GammaMatrixSet::New(m_repr);


    m_GM5 = gmset->get_GM(gmset->GAMMA5);


    m_SG[sg_index(0, 1)] = gmset->get_GM(gmset->SIGMA12);

    m_SG[sg_index(1, 2)] = gmset->get_GM(gmset->SIGMA23);

    m_SG[sg_index(2, 0)] = gmset->get_GM(gmset->SIGMA31);

    m_SG[sg_index(3, 0)] = gmset->get_GM(gmset->SIGMA41);

    m_SG[sg_index(3, 1)] = gmset->get_GM(gmset->SIGMA42);

    m_SG[sg_index(3, 2)] = gmset->get_GM(gmset->SIGMA43);


    m_SG[sg_index(1, 0)] = m_SG[sg_index(0, 1)].mult(-1);

    m_SG[sg_index(2, 1)] = m_SG[sg_index(1, 2)].mult(-1);

    m_SG[sg_index(0, 2)] = m_SG[sg_index(2, 0)].mult(-1);

    m_SG[sg_index(0, 3)] = m_SG[sg_index(3, 0)].mult(-1);

    m_SG[sg_index(1, 3)] = m_SG[sg_index(3, 1)].mult(-1);

    m_SG[sg_index(2, 3)] = m_SG[sg_index(3, 2)].mult(-1);


    m_SG[sg_index(0, 0)] = gmset->get_GM(gmset->UNITY);

    m_SG[sg_index(1, 1)] = gmset->get_GM(gmset->UNITY);

    m_SG[sg_index(2, 2)] = gmset->get_GM(gmset->UNITY);

    m_SG[sg_index(3, 3)] = gmset->get_GM(gmset->UNITY);

    // these 4 gamma matrices are actually not used.


    delete gmset;

  }


//====================================================================

  void Fopr_CloverTerm::set_config(Field *U)

  {

    int nth = ThreadManager::get_num_threads();

    vout.detailed(m_vl, "%s: set_config is called: num_threads = %d\n",

                  class_name.c_str(), nth);


    if (nth > 1) {

      set_config_impl(U);

    } else {

      set_config_omp(U);

    }


    vout.detailed(m_vl, "%s: set_config finished.\n", class_name.c_str());

  }


//====================================================================

  void Fopr_CloverTerm::set_config_omp(Field *U)

  {

#pragma omp parallel

    {

      set_config_impl(U);

    }

  }


//====================================================================

  void Fopr_CloverTerm::set_config_impl(Field *U)

  {

#pragma omp barrier


    int ith = ThreadManager::get_thread_id();

    if (ith == 0) m_U = (Field_G *)U;


#pragma omp barrier


    set_csw();

#pragma omp barrier

  }


//====================================================================

  void Fopr_CloverTerm::set_mode(const std::string mode)

  {

#pragma omp barrier

    int ith = ThreadManager::get_thread_id();

    if (ith == 0) m_mode = mode;

#pragma omp barrier

  }


//====================================================================

  void Fopr_CloverTerm::mult(Field& v, const Field& w)

  {

    // csw kappa sigma_{mu nu} F_{mu nu}

    if ((m_mode == "D") || (m_mode == "F")) {

      mult_sigmaF(v, w);

    } else {

      vout.crucial("Error at %s: undefined mode = %s\n",

                   class_name.c_str(), m_mode.c_str());

      exit(EXIT_FAILURE);

    }

  }


//====================================================================

  void Fopr_CloverTerm::mult_dag(Field& v, const Field& w)

  {

    mult(v, w);

  }


//====================================================================

  void Fopr_CloverTerm::mult_gm5(Field& v, const Field& w)

  {

    if (m_repr == "Dirac") {

      gm5_dirac(v, w);

    } else if (m_repr == "Chiral") {

      gm5_chiral(v, w);

    }

  }


//====================================================================

  void Fopr_CloverTerm::gm5_dirac(Field& w, const Field& f)

  {

    const int Nvc = 2 * CommonParameters::Nc();

    const int Nd  = CommonParameters::Nd();


    const double *v1 = f.ptr(0);

    double       *v2 = w.ptr(0);


    const int id1 = 0;

    const int id2 = Nvc;

    const int id3 = Nvc * 2;

    const int id4 = Nvc * 3;


    // threadding applied.

    const int Nthread  = ThreadManager::get_num_threads();

    const int i_thread = ThreadManager::get_thread_id();


    const int is = m_Nvol * i_thread / Nthread;

    const int ns = m_Nvol * (i_thread + 1) / Nthread - is;


    for (int site = is; site < is + ns; ++site) {

      // for (int site = 0; site < m_Nvol; ++site) {

      for (int icc = 0; icc < Nvc; icc++) {

        int in = Nvc * Nd * site;


        v2[icc + id1 + in] = v1[icc + id3 + in];

        v2[icc + id2 + in] = v1[icc + id4 + in];

        v2[icc + id3 + in] = v1[icc + id1 + in];

        v2[icc + id4 + in] = v1[icc + id2 + in];

      }

    }

  }


//====================================================================

  void Fopr_CloverTerm::gm5_chiral(Field& w, const Field& f)

  {

    const int Nvc = 2 * CommonParameters::Nc();

    const int Nd  = CommonParameters::Nd();


    const double *v1 = f.ptr(0);

    double       *v2 = w.ptr(0);


    const int id1 = 0;

    const int id2 = Nvc;

    const int id3 = Nvc * 2;

    const int id4 = Nvc * 3;


    // threadding applied.

    const int Nthread  = ThreadManager::get_num_threads();

    const int i_thread = ThreadManager::get_thread_id();


    const int is = m_Nvol * i_thread / Nthread;

    const int ns = m_Nvol * (i_thread + 1) / Nthread - is;


    for (int site = is; site < is + ns; ++site) {

      // for (int site = 0; site < m_Nvol; ++site) {

      for (int icc = 0; icc < Nvc; icc++) {

        int in = Nvc * Nd * site;


        v2[icc + id1 + in] = v1[icc + id1 + in];

        v2[icc + id2 + in] = v1[icc + id2 + in];

        v2[icc + id3 + in] = -v1[icc + id3 + in];

        v2[icc + id4 + in] = -v1[icc + id4 + in];

      }

    }

  }


//====================================================================

  void Fopr_CloverTerm::mult_isigma(Field_F& v, const Field_F& w,

                                    const int mu, const int nu)

  {

    assert(mu != nu);

    mult_iGM(v, m_SG[sg_index(mu, nu)], w);

  }


//====================================================================

  void Fopr_CloverTerm::mult_sigmaF(Field& v, const Field& f)

  {

    // multiplies csw kappa sigma_{mu nu} F_{mu nu}

    // NOTE: this is NOT  1 - csw kappa sigma_{mu nu} F_{mu nu}


    mult_csw(v, f);

  }


//====================================================================

  void Fopr_CloverTerm::mult_csw(Field& v, const Field& w)

  {

    // multiplies csw kappa sigma_{mu nu} F_{mu nu}

    // NOTE: this is NOT  1 - csw kappa sigma_{mu nu} F_{mu nu}


    if (m_repr == "Dirac") {

      mult_csw_dirac(v, w);

    } else if (m_repr == "Chiral") {

      mult_csw_chiral(v, w);

    }

  }


//====================================================================

  void Fopr_CloverTerm::mult_csw_dirac(Field& v, const Field& w)

  {

    // multiplies csw kappa sigma_{mu nu} F_{mu nu}

    // NOTE: this is NOT  1 - csw kappa sigma_{mu nu} F_{mu nu}

    assert(w.nex() == 1);


    const int Nc   = CommonParameters::Nc();

    const int Nvc  = 2 * Nc;

    const int Ndf  = 2 * Nc * Nc;

    const int Nd   = CommonParameters::Nd();

    const int Nvol = w.nvol();


    const int id1 = 0;

    const int id2 = Nvc;

    const int id3 = Nvc * 2;

    const int id4 = Nvc * 3;


    const double kappa_cSW = m_kappa * m_cSW;


    const double *w2 = w.ptr(0);

    double       *v2 = v.ptr(0);


    double *Bx = m_Bx.ptr(0);

    double *By = m_By.ptr(0);

    double *Bz = m_Bz.ptr(0);

    double *Ex = m_Ex.ptr(0);

    double *Ey = m_Ey.ptr(0);

    double *Ez = m_Ez.ptr(0);


    // threading applied.

    const int Nthread  = ThreadManager::get_num_threads();

    const int i_thread = ThreadManager::get_thread_id();


    const int is = m_Nvol * i_thread / Nthread;

    const int ns = m_Nvol * (i_thread + 1) / Nthread - is;


    for (int site = is; site < is + ns; ++site) {

      int iv = Nvc * Nd * site;

      int ig = Ndf * site;


      for (int ic = 0; ic < Nc; ++ic) {

        int ic_r = 2 * ic;

        int ic_i = ic_r + 1;

        int ic_g = ic * Nvc + ig;


        v2[ic_r + id1 + iv] = 0.0;

        v2[ic_i + id1 + iv] = 0.0;

        v2[ic_r + id2 + iv] = 0.0;

        v2[ic_i + id2 + iv] = 0.0;


        v2[ic_r + id3 + iv] = 0.0;

        v2[ic_i + id3 + iv] = 0.0;

        v2[ic_r + id4 + iv] = 0.0;

        v2[ic_i + id4 + iv] = 0.0;


        // isigma_23 * Bx

        v2[ic_r + id1 + iv] -= mult_uv_i(&Bx[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id1 + iv] += mult_uv_r(&Bx[ic_g], &w2[id2 + iv], Nc);

        v2[ic_r + id2 + iv] -= mult_uv_i(&Bx[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id2 + iv] += mult_uv_r(&Bx[ic_g], &w2[id1 + iv], Nc);


        v2[ic_r + id3 + iv] -= mult_uv_i(&Bx[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id3 + iv] += mult_uv_r(&Bx[ic_g], &w2[id4 + iv], Nc);

        v2[ic_r + id4 + iv] -= mult_uv_i(&Bx[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id4 + iv] += mult_uv_r(&Bx[ic_g], &w2[id3 + iv], Nc);


        // isigma_31 * By

        v2[ic_r + id1 + iv] += mult_uv_r(&By[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id1 + iv] += mult_uv_i(&By[ic_g], &w2[id2 + iv], Nc);

        v2[ic_r + id2 + iv] -= mult_uv_r(&By[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id2 + iv] -= mult_uv_i(&By[ic_g], &w2[id1 + iv], Nc);


        v2[ic_r + id3 + iv] += mult_uv_r(&By[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id3 + iv] += mult_uv_i(&By[ic_g], &w2[id4 + iv], Nc);

        v2[ic_r + id4 + iv] -= mult_uv_r(&By[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id4 + iv] -= mult_uv_i(&By[ic_g], &w2[id3 + iv], Nc);


        // isigma_12 * Bz

        v2[ic_r + id1 + iv] -= mult_uv_i(&Bz[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id1 + iv] += mult_uv_r(&Bz[ic_g], &w2[id1 + iv], Nc);

        v2[ic_r + id2 + iv] += mult_uv_i(&Bz[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id2 + iv] -= mult_uv_r(&Bz[ic_g], &w2[id2 + iv], Nc);


        v2[ic_r + id3 + iv] -= mult_uv_i(&Bz[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id3 + iv] += mult_uv_r(&Bz[ic_g], &w2[id3 + iv], Nc);

        v2[ic_r + id4 + iv] += mult_uv_i(&Bz[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id4 + iv] -= mult_uv_r(&Bz[ic_g], &w2[id4 + iv], Nc);


        // isigma_41 * Ex

        v2[ic_r + id1 + iv] += mult_uv_i(&Ex[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id1 + iv] -= mult_uv_r(&Ex[ic_g], &w2[id4 + iv], Nc);

        v2[ic_r + id2 + iv] += mult_uv_i(&Ex[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id2 + iv] -= mult_uv_r(&Ex[ic_g], &w2[id3 + iv], Nc);


        v2[ic_r + id3 + iv] += mult_uv_i(&Ex[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id3 + iv] -= mult_uv_r(&Ex[ic_g], &w2[id2 + iv], Nc);

        v2[ic_r + id4 + iv] += mult_uv_i(&Ex[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id4 + iv] -= mult_uv_r(&Ex[ic_g], &w2[id1 + iv], Nc);


        // isigma_42 * Ey

        v2[ic_r + id1 + iv] -= mult_uv_r(&Ey[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id1 + iv] -= mult_uv_i(&Ey[ic_g], &w2[id4 + iv], Nc);

        v2[ic_r + id2 + iv] += mult_uv_r(&Ey[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id2 + iv] += mult_uv_i(&Ey[ic_g], &w2[id3 + iv], Nc);


        v2[ic_r + id3 + iv] -= mult_uv_r(&Ey[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id3 + iv] -= mult_uv_i(&Ey[ic_g], &w2[id2 + iv], Nc);

        v2[ic_r + id4 + iv] += mult_uv_r(&Ey[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id4 + iv] += mult_uv_i(&Ey[ic_g], &w2[id1 + iv], Nc);


        // isigma_43 * Ez

        v2[ic_r + id1 + iv] += mult_uv_i(&Ez[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id1 + iv] -= mult_uv_r(&Ez[ic_g], &w2[id3 + iv], Nc);

        v2[ic_r + id2 + iv] -= mult_uv_i(&Ez[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id2 + iv] += mult_uv_r(&Ez[ic_g], &w2[id4 + iv], Nc);


        v2[ic_r + id3 + iv] += mult_uv_i(&Ez[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id3 + iv] -= mult_uv_r(&Ez[ic_g], &w2[id1 + iv], Nc);

        v2[ic_r + id4 + iv] -= mult_uv_i(&Ez[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id4 + iv] += mult_uv_r(&Ez[ic_g], &w2[id2 + iv], Nc);


        // v *= m_kappa * m_cSW;

        v2[ic_r + id1 + iv] *= kappa_cSW;

        v2[ic_i + id1 + iv] *= kappa_cSW;

        v2[ic_r + id2 + iv] *= kappa_cSW;

        v2[ic_i + id2 + iv] *= kappa_cSW;


        v2[ic_r + id3 + iv] *= kappa_cSW;

        v2[ic_i + id3 + iv] *= kappa_cSW;

        v2[ic_r + id4 + iv] *= kappa_cSW;

        v2[ic_i + id4 + iv] *= kappa_cSW;

      }

    }

#pragma omp barrier

  }


//====================================================================

  void Fopr_CloverTerm::mult_csw_chiral(Field& v, const Field& w)

  {

    // multiplies csw kappa sigma_{mu nu} F_{mu nu}

    // NOTE: this is NOT  1 - csw kappa sigma_{mu nu} F_{mu nu}

    assert(w.nex() == 1);


    const int Nc   = CommonParameters::Nc();

    const int Nvc  = 2 * Nc;

    const int Ndf  = 2 * Nc * Nc;

    const int Nd   = CommonParameters::Nd();

    const int Nvol = w.nvol();


    const int id1 = 0;

    const int id2 = Nvc;

    const int id3 = Nvc * 2;

    const int id4 = Nvc * 3;


    const double kappa_cSW = m_kappa * m_cSW;


    const double *w2 = w.ptr(0);

    double       *v2 = v.ptr(0);


    double *Bx = m_Bx.ptr(0);

    double *By = m_By.ptr(0);

    double *Bz = m_Bz.ptr(0);

    double *Ex = m_Ex.ptr(0);

    double *Ey = m_Ey.ptr(0);

    double *Ez = m_Ez.ptr(0);


    int ith, nth, is, ns;

    set_threadtask(ith, nth, is, ns, m_Nvol);


#pragma omp barrier


    for (int site = is; site < ns; ++site) {

      int iv = Nvc * Nd * site;

      int ig = Ndf * site;


      for (int ic = 0; ic < Nc; ++ic) {

        int ic_r = 2 * ic;

        int ic_i = ic_r + 1;

        int ic_g = ic * Nvc + ig;


        v2[ic_r + id1 + iv] = 0.0;

        v2[ic_i + id1 + iv] = 0.0;

        v2[ic_r + id2 + iv] = 0.0;

        v2[ic_i + id2 + iv] = 0.0;


        v2[ic_r + id3 + iv] = 0.0;

        v2[ic_i + id3 + iv] = 0.0;

        v2[ic_r + id4 + iv] = 0.0;

        v2[ic_i + id4 + iv] = 0.0;


        // isigma_23 * Bx

        v2[ic_r + id1 + iv] -= mult_uv_i(&Bx[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id1 + iv] += mult_uv_r(&Bx[ic_g], &w2[id2 + iv], Nc);

        v2[ic_r + id2 + iv] -= mult_uv_i(&Bx[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id2 + iv] += mult_uv_r(&Bx[ic_g], &w2[id1 + iv], Nc);


        v2[ic_r + id3 + iv] -= mult_uv_i(&Bx[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id3 + iv] += mult_uv_r(&Bx[ic_g], &w2[id4 + iv], Nc);

        v2[ic_r + id4 + iv] -= mult_uv_i(&Bx[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id4 + iv] += mult_uv_r(&Bx[ic_g], &w2[id3 + iv], Nc);


        // isigma_31 * By

        v2[ic_r + id1 + iv] += mult_uv_r(&By[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id1 + iv] += mult_uv_i(&By[ic_g], &w2[id2 + iv], Nc);

        v2[ic_r + id2 + iv] -= mult_uv_r(&By[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id2 + iv] -= mult_uv_i(&By[ic_g], &w2[id1 + iv], Nc);


        v2[ic_r + id3 + iv] += mult_uv_r(&By[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id3 + iv] += mult_uv_i(&By[ic_g], &w2[id4 + iv], Nc);

        v2[ic_r + id4 + iv] -= mult_uv_r(&By[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id4 + iv] -= mult_uv_i(&By[ic_g], &w2[id3 + iv], Nc);


        // isigma_12 * Bz

        v2[ic_r + id1 + iv] -= mult_uv_i(&Bz[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id1 + iv] += mult_uv_r(&Bz[ic_g], &w2[id1 + iv], Nc);

        v2[ic_r + id2 + iv] += mult_uv_i(&Bz[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id2 + iv] -= mult_uv_r(&Bz[ic_g], &w2[id2 + iv], Nc);


        v2[ic_r + id3 + iv] -= mult_uv_i(&Bz[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id3 + iv] += mult_uv_r(&Bz[ic_g], &w2[id3 + iv], Nc);

        v2[ic_r + id4 + iv] += mult_uv_i(&Bz[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id4 + iv] -= mult_uv_r(&Bz[ic_g], &w2[id4 + iv], Nc);


        // isigma_41 * Ex

        v2[ic_r + id1 + iv] += mult_uv_i(&Ex[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id1 + iv] -= mult_uv_r(&Ex[ic_g], &w2[id2 + iv], Nc);

        v2[ic_r + id2 + iv] += mult_uv_i(&Ex[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id2 + iv] -= mult_uv_r(&Ex[ic_g], &w2[id1 + iv], Nc);


        v2[ic_r + id3 + iv] -= mult_uv_i(&Ex[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id3 + iv] += mult_uv_r(&Ex[ic_g], &w2[id4 + iv], Nc);

        v2[ic_r + id4 + iv] -= mult_uv_i(&Ex[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id4 + iv] += mult_uv_r(&Ex[ic_g], &w2[id3 + iv], Nc);


        // isigma_42 * Ey

        v2[ic_r + id1 + iv] -= mult_uv_r(&Ey[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id1 + iv] -= mult_uv_i(&Ey[ic_g], &w2[id2 + iv], Nc);

        v2[ic_r + id2 + iv] += mult_uv_r(&Ey[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id2 + iv] += mult_uv_i(&Ey[ic_g], &w2[id1 + iv], Nc);


        v2[ic_r + id3 + iv] += mult_uv_r(&Ey[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id3 + iv] += mult_uv_i(&Ey[ic_g], &w2[id4 + iv], Nc);

        v2[ic_r + id4 + iv] -= mult_uv_r(&Ey[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id4 + iv] -= mult_uv_i(&Ey[ic_g], &w2[id3 + iv], Nc);


        // isigma_43 * Ez

        v2[ic_r + id1 + iv] += mult_uv_i(&Ez[ic_g], &w2[id1 + iv], Nc);

        v2[ic_i + id1 + iv] -= mult_uv_r(&Ez[ic_g], &w2[id1 + iv], Nc);

        v2[ic_r + id2 + iv] -= mult_uv_i(&Ez[ic_g], &w2[id2 + iv], Nc);

        v2[ic_i + id2 + iv] += mult_uv_r(&Ez[ic_g], &w2[id2 + iv], Nc);


        v2[ic_r + id3 + iv] -= mult_uv_i(&Ez[ic_g], &w2[id3 + iv], Nc);

        v2[ic_i + id3 + iv] += mult_uv_r(&Ez[ic_g], &w2[id3 + iv], Nc);

        v2[ic_r + id4 + iv] += mult_uv_i(&Ez[ic_g], &w2[id4 + iv], Nc);

        v2[ic_i + id4 + iv] -= mult_uv_r(&Ez[ic_g], &w2[id4 + iv], Nc);


        // v *= m_kappa * m_cSW;

        v2[ic_r + id1 + iv] *= kappa_cSW;

        v2[ic_i + id1 + iv] *= kappa_cSW;

        v2[ic_r + id2 + iv] *= kappa_cSW;

        v2[ic_i + id2 + iv] *= kappa_cSW;


        v2[ic_r + id3 + iv] *= kappa_cSW;

        v2[ic_i + id3 + iv] *= kappa_cSW;

        v2[ic_r + id4 + iv] *= kappa_cSW;

        v2[ic_i + id4 + iv] *= kappa_cSW;

      }

    }


#pragma omp barrier

  }


//====================================================================

  void Fopr_CloverTerm::set_csw()

  {

    set_fieldstrength(m_Bx, 1, 2);

    set_fieldstrength(m_By, 2, 0);

    set_fieldstrength(m_Bz, 0, 1);

    set_fieldstrength(m_Ex, 3, 0);

    set_fieldstrength(m_Ey, 3, 1);

    set_fieldstrength(m_Ez, 3, 2);

  }


//====================================================================

  void Fopr_CloverTerm::set_fieldstrength(Field_G& Fst,

                                          const int mu, const int nu)

  {

#pragma omp barrier


    m_staple.upper(m_Cup, *m_U, mu, nu); // these staple constructions

    m_staple.lower(m_Cdn, *m_U, mu, nu); // are multi-threaded.


    mult_Field_Gnd(Fst, 0, *m_U, mu, m_Cup, 0);

    multadd_Field_Gnd(Fst, 0, *m_U, mu, m_Cdn, 0, -1.0);


    mult_Field_Gdn(m_v1, 0, m_Cup, 0, *m_U, mu);

    multadd_Field_Gdn(m_v1, 0, m_Cdn, 0, *m_U, mu, -1.0);


    m_shift->forward(m_v2, m_v1, mu);


    axpy(Fst, 1.0, m_v2);

#pragma omp barrier


    ah_Field_G(Fst, 0);

#pragma omp barrier


    scal(Fst, 0.25);

#pragma omp barrier

  }


//====================================================================

  double Fopr_CloverTerm::flop_count()

  {

    // Counting of floating point operations in giga unit.

    // The following counting explicitly depends on the implementation

    // and to be recalculated when the code is modified.

    // Present counting is based on rev.1107. [24 Aug 2014 H.Matsufuru]


    const int Nvol = CommonParameters::Nvol();

    const int NPE  = CommonParameters::NPE();


    const int flop_site = m_Nc * m_Nd * (2 + 48 * m_Nc);


    const double gflop = flop_site * (Nvol * (NPE / 1.0e+9));


    return gflop;

  }


//====================================================================

}

//============================================================END=====